DataSalon

Discover quality datasets for AI training — aggregated from 40+ platforms, curated by AI.

ProductSearch Datasets Browse Topics Rankings Community API / MCP

ResourcesDocumentation Blog Changelog Status

LegalPrivacy Policy Terms of Service Cookie Policy

Common-O: Multi-Scene Reasoning with 10,000+ Household Objects | DataSalon

Home Multimodal & LLMCommon-O: Multi-Scene Reasoning with 10,000+ Household Objects

Multimodal & LLM

Common-O: Multi-Scene Reasoning with 10,000+ Household Objects

Name: Common-O: Multi-Scene Reasoning with 10,000+ Household Objects
Creator: facebook
Published: 2025-10-24T21:57:13
Keywords: Size Categories10 Kn100 K, Arxiv251103768, Librarypolars, Librarydask, Languageen, Modalitytext, Librarymlcroissant, Modalityimage, Librarydatasets, Parquet, Regionus, Licensemit

by facebook·Updated 4mo ago

Available on 1 platform

Description

Common-O contains between 10,000 and 100,000 image-text pairs designed by Meta researchers in 2026 to evaluate multimodal LLM reasoning. The data is organized into two subsets featuring household objects to test the ability of models to identify common elements across 3 to 16 different scenes.

Use Cases

Evaluating multimodal LLMs on multi-scene reasoning tasks using the 'what's in common' query feature
Benchmarking model performance degradation when moving from the standard subset to the 'Common-O Complex' subset
Fine-tuning vision-language models for relational reasoning across multiple household object images

Strengths

Includes a 'Common-O Complex' subset with 8-16 objects to test reasoning scalability
MIT licensed for open research use
Large scale with 10,000 to 100,000 reasoning pairs

Limitations

Domain-specific focus on household objects may limit generalizability to non-domestic environments
Lack of explicit column documentation in metadata

Provenance

Source: Facebook (Meta) AI Research, associated with Arxiv paper 2511.03768
Freshness: Last updated March 2026.

The dataset is distributed in Parquet format and requires libraries like Polars or Dask for efficient handling of the 10K-100K records as indicated by metadata tags.

Parquet Size Categories10 Kn100 K Arxiv251103768 Librarypolars Librarydask Languageen Modalitytext Librarymlcroissant Modalityimage Librarydatasets Regionus Licensemit

Related Datasets

Quality Score

D38

Description

Source

Reputation

Quality Score

D38

Description

Source

Reputation

Access

Community

321 downloads

11 likes

0 views

Dataset Info

Author: facebook
Created: Oct 24, 2025
Updated: Mar 10, 2026
Last synced: May 2, 2026

Access

Community

321 downloads

11 likes

0 views

Dataset Info

Author: facebook
Created: Oct 24, 2025
Updated: Mar 10, 2026
Last synced: May 2, 2026

Common-O: Multi-Scene Reasoning with 10,000+ Household Objects

Description

Use Cases

Strengths

Limitations

Provenance

Related Topics

Related Datasets

Quality Score

Community

Dataset Info

Community

Dataset Info