DataSalon

Discover quality datasets for AI training — aggregated from 40+ platforms, curated by AI.

ProductSearch Datasets Browse Topics Rankings Community API / MCP

ResourcesDocumentation Blog Changelog Status

LegalPrivacy Policy Terms of Service Cookie Policy

K-Viscuit: Multi-Choice Visual Question Answering for Korean Culture | DataSalon

Home Multimodal & LLMK-Viscuit: Multi-Choice Visual Question Answering for Korean Culture

Multimodal & LLM

K-Viscuit: Multi-Choice Visual Question Answering for Korean Culture

Name: K-Viscuit: Multi-Choice Visual Question Answering for Korean Culture
Creator: ddehun
Published: 2024-08-17T09:40:00
Keywords: Vision Language Models, Korean Culture, Benchmark, Computer Vision, Visual Question Answering, Multimodal Evaluation, Multimodal

by ddehun·Updated 1y ago

Available on 1 platform

Description

A Multi-Choice Visual Question Answering dataset designed to evaluate Vision-Language Models on their understanding of Korean culture. It was created through a Human-VLM collaboration and is part of research presented in a June 2024 arXiv paper. The dataset was last updated on HuggingFace on August 17, 2024.

Use Cases

Benchmarking model performance on cultural interpretation tasks based on the described VQA format.
Training models to improve visual and cultural reasoning based on Korean cultural elements.
Studying Human-VLM collaboration methods in dataset creation as described in the research paper.

Strengths

Designed specifically for evaluating cultural understanding in Vision-Language Models.
Created through a documented Human-VLM collaboration methodology.
Associated with a June 2024 research paper, suggesting academic rigor.

Limitations

Description metadata is limited; actual data quality requires manual inspection after download.
Column-level documentation is absent; field semantics must be inferred after download.
Row count and file formats are unknown, which may limit suitability assessment.

Provenance

Source: Author ddehun on HuggingFace.
Collection Method: Created through a Human-VLM collaboration.
Freshness: Last updated 2024-08-17 11:36:20.
Geography: Focus on Korean culture.

Multimodal Vision Language Models Korean Culture Benchmark Computer Vision Visual Question Answering Multimodal Evaluation

Related Datasets

Quality Score

D37

Description

Source

Reputation

Quality Score

D37

Description

Source

Reputation

Access

Community

166 downloads

10 likes

0 views

Dataset Info

Author: ddehun
Created: Aug 17, 2024
Updated: Aug 17, 2024
Last synced: May 14, 2026

Access

Community

166 downloads

10 likes

0 views

Dataset Info

Author: ddehun
Created: Aug 17, 2024
Updated: Aug 17, 2024
Last synced: May 14, 2026

K-Viscuit: Multi-Choice Visual Question Answering for Korean Culture

Description

Use Cases

Strengths

Limitations

Provenance

Related Topics

Related Datasets

Quality Score

Community

Dataset Info

Community

Dataset Info