DataSalon

Discover quality datasets for AI training — aggregated from 40+ platforms, curated by AI.

ProductSearch Datasets Browse Topics Rankings Community API / MCP

ResourcesDocumentation Blog Changelog Status

LegalPrivacy Policy Terms of Service Cookie Policy

ViTextVQA: 50,000 Vietnamese Text-Based Visual Question Answer Pairs | DataSalon

Home Multimodal & LLMViTextVQA: 50,000 Vietnamese Text-Based Visual Question Answer Pairs

Multimodal & LLM

ViTextVQA: 50,000 Vietnamese Text-Based Visual Question Answer Pairs

Name: ViTextVQA: 50,000 Vietnamese Text-Based Visual Question Answer Pairs
Creator: minhquan6203
Published: 2024-07-22T14:12:26
Keywords: Licensecc By Nc 30, Regionus, Arxiv240410652

by minhquan6203·Updated 6mo ago

Available on 1 platform

Description

ViTextVQA contains over 16,000 images and 50,000 question-answer pairs focused on Vietnamese text comprehension within visual contexts. Developed by researcher minhquan6203 and documented in Arxiv paper 2404.10652, it serves as a benchmark for text-based visual question answering in the Vietnamese language.

Use Cases

Training models to extract and interpret Vietnamese text from images using the question-answer pairs
Evaluating OCR-based visual question answering systems on Vietnamese linguistic nuances
Benchmarking multimodal LLMs on regional language text comprehension

Strengths

Contains over 50,000 question-answer pairs
Includes 16,000+ images with Vietnamese text
First large-scale dataset specifically for Vietnamese text-based VQA

Limitations

Specific column names and schema are not documented in the provided metadata
Restricted to non-commercial use under CC BY-NC 3.0 license

Provenance

Source: minhquan6203 (Arxiv:2404.10652)
Collection Method: Annotated
Freshness: Last updated January 2026.
Geography: Vietnam

The dataset is released under a Creative Commons Attribution-NonCommercial 3.0 license. Users should refer to the associated Arxiv paper 2404.10652 for detailed methodology and evaluation metrics.

Licensecc By Nc 30 Regionus Arxiv240410652

Related Datasets

Quality Score

D39

Description

Source

Reputation

Quality Score

D39

Description

Source

Reputation

Access

Community

19 downloads

17 likes

0 views

Dataset Info

Author: minhquan6203
Created: Jul 22, 2024
Updated: Jan 16, 2026
Last synced: Apr 28, 2026

Access

Community

19 downloads

17 likes

0 views

Dataset Info

Author: minhquan6203
Created: Jul 22, 2024
Updated: Jan 16, 2026
Last synced: Apr 28, 2026

ViTextVQA: 50,000 Vietnamese Text-Based Visual Question Answer Pairs

Description

Use Cases

Strengths

Limitations

Provenance

Related Topics

Related Datasets

Quality Score

Community

Dataset Info

Community

Dataset Info