DataSalon

Discover quality datasets for AI training — aggregated from 40+ platforms, curated by AI.

ProductSearch Datasets Browse Topics Rankings Community API / MCP

ResourcesDocumentation Blog Changelog Status

LegalPrivacy Policy Terms of Service Cookie Policy

GQA: Compositional Visual Question Answering | DataSalon

Home Multimodal & LLMGQA: Compositional Visual Question Answering

Multimodal & LLM

GQA: Compositional Visual Question Answering

Name: GQA: Compositional Visual Question Answering
Creator: echarlaix
Published: 2022-03-02T23:29:22
Keywords: Size Categories1 Mn10 M, Modalitytext, Modalitytabular, Librarymlcroissant, Librarydatasets, Regionus, Licenseapache 20

by echarlaix·Updated 4y ago

Description

22 million compositional questions and 113,000 images featuring dense scene graph annotations. The dataset structures visual reasoning through functional programs that map out the logic required to reach an answer for each image.

Use Cases

Train neural module networks using the functional program logic to guide visual attention and execution
Improve visual grounding by mapping scene graph nodes to specific bounding boxes in the image
Evaluate model bias by comparing performance on the balanced versus unbalanced question splits
Benchmark compositional generalization by testing on question structures not seen during training

Strengths

22 million questions generated to test compositional reasoning across 113,000 images
Includes dense scene graphs containing objects, attributes, and relations for every image
Provides functional programs for every question to define explicit reasoning steps
Features a balanced answer distribution to mitigate linguistic priors and shortcuts

Size Categories1 Mn10 M Modalitytext Modalitytabular Librarymlcroissant Librarydatasets Regionus Licenseapache 20

Related Datasets

Quality Score

D22

Description

Source

Reputation

Quality Score

D22

Description

Source

Reputation

Access

Community

66 downloads

1 likes

0 views

Dataset Info

Author: echarlaix
Created: Mar 2, 2022
Updated: Feb 1, 2022
Last synced: Apr 28, 2026

Access

Community

66 downloads

1 likes

0 views

Dataset Info

Author: echarlaix
Created: Mar 2, 2022
Updated: Feb 1, 2022
Last synced: Apr 28, 2026

GQA: Compositional Visual Question Answering

Description

Use Cases

Strengths

Related Topics

Related Datasets

Quality Score

Community

Dataset Info

Community

Dataset Info