Q-Mirror: 440 Expert-Verified Scientific Questions for Multi-Modal QA

Name: Q-Mirror: 440 Expert-Verified Scientific Questions for Multi-Modal QA
Creator: anonymous, anonymous
Published: 2026-05-06T16:17:51
Keywords: Ai Evaluation, Scientific Benchmark, Benchmark, Question Answering, Text, Synthetic, Multimodal

by anonymous, anonymous / Q-mirrorUpdated 1mo ago

Available on 1 platform

Sign in to view source links and access this dataset

Description

440 expert-verified scientific questions spanning 22 disciplines, partitioned into Q-Mirror-Expert (310 questions) and Q-Mirror-Grad (130 questions). This benchmark dataset, created by Q-mirror, is for evaluating the transformation of text-only QA pairs into multi-modal QA pairs and includes JSONL annotation files and generated PNG images. It was last updated on 2026-05-06.

Use Cases

Benchmarking multi-modal question-answering models based on the 440 expert-verified scientific questions
Evaluating text-to-multi-modal transformation techniques based on the provided text-only QA pairs and generated images
Training or fine-tuning vision-language models for scientific domains based on the annotated multi-modal QA pairs

Strengths

Contains 440 questions verified by experts, ensuring a quality benchmark
Covers 22 distinct scientific disciplines, providing broad domain coverage
Includes a partition into expert-level (310) and graduate-level (130) questions for targeted evaluation

Limitations

Column-level documentation is absent; field semantics must be inferred after download
Row count is unknown, which may limit suitability assessment for large-scale training

Provenance

Source: Q-mirror
Collection Method: Expert verification and generation for the NeurIPS 2026 Evaluations and Datasets Track
Time Range: 2026
Freshness: Last updated 2026-05-06 16:17:51; freshness should be verified
Geography: null

null

Text Multimodal Ai Evaluation Scientific Benchmark Benchmark Question Answering Synthetic

Related Datasets

Quality Score

D33

Description

24

Source

41

Reputation

35

Access

31

Community

0 views

Dataset Info

Author: anonymous, anonymous
Org: Q-mirror
Created: May 6, 2026
Updated: May 6, 2026
Last synced: May 19, 2026

Access

31

Community

0 views

Dataset Info

Author: anonymous, anonymous
Org: Q-mirror
Created: May 6, 2026
Updated: May 6, 2026
Last synced: May 19, 2026

Q-Mirror: 440 Expert-Verified Scientific Questions for Multi-Modal QA

Description

Use Cases

Strengths

Limitations

Provenance

Related Topics

Related Datasets

Quality Score

Community

Dataset Info

Community

Dataset Info