DataSalon

Discover quality datasets for AI training — aggregated from 40+ platforms, curated by AI.

ProductSearch Datasets Browse Topics Rankings Community API / MCP

ResourcesDocumentation Blog Changelog Status

LegalPrivacy Policy Terms of Service Cookie Policy

ViQuAE: Visual Question Answering over Entities | DataSalon

Home Multimodal & LLMViQuAE: Visual Question Answering over Entities

Multimodal & LLM

ViQuAE: Visual Question Answering over Entities

Name: ViQuAE: Visual Question Answering over Entities
Creator: PaulLerner
Published: 2022-03-02T23:29:22
Keywords: Size Categories1 Kn10 K, Librarypolars, Modalitytext, Librarymlcroissant, Modalityimage, Librarydatasets, Librarypandas, Regionus, JSON

by PaulLerner·Updated 4y ago

Description

3,700 question-answer pairs paired with images and a retrieval corpus of 1.5 million Wikipedia passages. The dataset focuses on entity-centric visual question answering, requiring models to identify visual entities and retrieve external knowledge to provide answers.

Use Cases

Benchmark multimodal retrieval systems using the question and image inputs to query the Wikipedia passage corpus
Train entity-linking models to map visual regions to specific Wikidata identifiers
Develop end-to-end knowledge-based VQA pipelines that integrate visual recognition with external text evidence

Strengths

3,700 human-annotated question-answer pairs linked to visual content
Retrieval corpus containing 1.5 million Wikipedia passages
Entity-level ground truth annotations linking images to Wikidata identifiers

JSON Size Categories1 Kn10 K Librarypolars Modalitytext Librarymlcroissant Modalityimage Librarydatasets Librarypandas Regionus

Related Datasets

Quality Score

D24

Description

Source

Reputation

Quality Score

D24

Description

Source

Reputation

Access

Community

78 downloads

4 likes

0 views

Dataset Info

Author: PaulLerner
Created: Mar 2, 2022
Updated: Feb 15, 2022
Last synced: Apr 29, 2026

Access

Community

78 downloads

4 likes

0 views

Dataset Info

Author: PaulLerner
Created: Mar 2, 2022
Updated: Feb 15, 2022
Last synced: Apr 29, 2026

ViQuAE: Visual Question Answering over Entities

Description

Use Cases

Strengths

Related Topics

Related Datasets

Quality Score

Community

Dataset Info

Community

Dataset Info