DataSalon

Discover quality datasets for AI training — aggregated from 40+ platforms, curated by AI.

ProductSearch Datasets Browse Topics Rankings Community API / MCP

ResourcesDocumentation Blog Changelog Status

LegalPrivacy Policy Terms of Service Cookie Policy

WorldBench: A Visually Diverse Multimodal Reasoning Benchmark | DataSalon

Home Computer VisionWorldBench: A Visually Diverse Multimodal Reasoning Benchmark

Computer Vision

WorldBench: A Visually Diverse Multimodal Reasoning Benchmark

Name: WorldBench: A Visually Diverse Multimodal Reasoning Benchmark
Creator: zlab-princeton
Published: 2026-06-03T00:05:14
Keywords: Ai Evaluation, Benchmark, Visual Taxonomy, Computer Vision, Multimodal Reasoning, Multimodal

by zlab-princeton·Updated 6d ago

Available on 1 platform

Description

WorldBench is a multimodal reasoning benchmark organized around a visual taxonomy spanning seven domains: Living Things, Objects, Scenes, Digital World, Academics, Documents/Charts/Tables, and Agents. It is designed by zlab-princeton to evaluate Multimodal Large Language Models. The dataset was last updated on 2026-06-08.

Use Cases

Benchmarking model performance on visual reasoning across seven diverse domains mentioned in the description
Identifying model weaknesses in specific visual categories like 'Documents/Charts/Tables' or 'Agents'
Training or fine-tuning MLLMs on a structured visual taxonomy
Conducting research on the breadth of multimodal understanding

Strengths

The benchmark is structured around a broad visual taxonomy covering seven distinct domains.
It is designed specifically for evaluating modern Multimodal Large Language Models.
The dataset was last updated on 2026-06-08.

Limitations

Description metadata is limited; actual data quality requires manual inspection after download.
Column-level documentation is absent; field semantics must be inferred after download.
Row count and file formats are unknown, which may limit suitability assessment.

Provenance

Source: zlab-princeton
Freshness: Last updated 2026-06-08 01:32:32; freshness should be verified.

Multimodal Ai Evaluation Benchmark Visual Taxonomy Computer Vision Multimodal Reasoning

Related Datasets

Quality Score

D37

Description

Source

Reputation

Quality Score

D37

Description

Source

Reputation

Access

Community

27 downloads

1 likes

0 views

Dataset Info

Author: zlab-princeton
Created: Jun 3, 2026
Updated: Jun 8, 2026
Last synced: Jun 14, 2026

Access

Community

27 downloads

1 likes

0 views

Dataset Info

Author: zlab-princeton
Created: Jun 3, 2026
Updated: Jun 8, 2026
Last synced: Jun 14, 2026

WorldBench: A Visually Diverse Multimodal Reasoning Benchmark

Description

Use Cases

Strengths

Limitations

Provenance

Related Topics

Related Datasets

Quality Score

Community

Dataset Info

Community

Dataset Info