DataSalon

Discover quality datasets for AI training — aggregated from 40+ platforms, curated by AI.

ProductSearch Datasets Browse Topics Rankings Community API / MCP

ResourcesDocumentation Blog Changelog Status

LegalPrivacy Policy Terms of Service Cookie Policy

SPAR-Bench: 7,207 Spatial Reasoning QA Pairs Across 20 Tasks | DataSalon

Home Multimodal & LLMSPAR-Bench: 7,207 Spatial Reasoning QA Pairs Across 20 Tasks

Multimodal & LLM

SPAR-Bench: 7,207 Spatial Reasoning QA Pairs Across 20 Tasks

Name: SPAR-Bench: 7,207 Spatial Reasoning QA Pairs Across 20 Tasks
Creator: jasonzhango
Published: 2025-03-20T06:12:10
Keywords: Size Categories1 Kn10 K, Librarypolars, Librarydask, Modalitytext, Librarymlcroissant, Modalityimage, Librarydatasets, Parquet, Arxiv250322976, Regionus

by jasonzhango·Updated 1y ago

Available on 1 platform

Description

SPAR-Bench contains 7,207 manually verified spatial reasoning question-answer pairs across 20 distinct tasks, released by jasonzhango in 2025. The benchmark evaluates vision-language models using single-view, multi-view, and video modalities to test spatial perception and reasoning capabilities.

Use Cases

Evaluating VLM spatial perception across 20 task categories
Benchmarking multi-view reasoning using multi-image QA pairs
Testing temporal spatial reasoning within the video-based tasks

Strengths

7,207 manually verified records
20 diverse spatial task categories
Includes three distinct visual modalities: single-view, multi-view, and video

Limitations

Small scale of 7,207 records compared to general VLM training sets
Specific column names and schema are not explicitly listed in the source metadata

Provenance

Source: jasonzhango (Arxiv: 2503.22976)
Collection Method: Manually verified
Freshness: Last updated April 2025.

Associated with Arxiv paper 2503.22976; data is provided in Parquet format and requires standard VLM evaluation pipelines.

Parquet Size Categories1 Kn10 K Librarypolars Librarydask Modalitytext Librarymlcroissant Modalityimage Librarydatasets Arxiv250322976 Regionus

Related Datasets

Quality Score

D36

Description

Source

Reputation

Quality Score

D36

Description

Source

Reputation

Access

Community

1.7K downloads

3 likes

0 views

Dataset Info

Author: jasonzhango
Created: Mar 20, 2025
Updated: Apr 1, 2025
Last synced: May 26, 2026

Access

Community

1.7K downloads

3 likes

0 views

Dataset Info

Author: jasonzhango
Created: Mar 20, 2025
Updated: Apr 1, 2025
Last synced: May 26, 2026

SPAR-Bench: 7,207 Spatial Reasoning QA Pairs Across 20 Tasks

Description

Use Cases

Strengths

Limitations

Provenance

Related Topics

Related Datasets

Quality Score

Community

Dataset Info

Community

Dataset Info