Cambrian-10M: Multimodal Instruction Tuning Data for Vision-Language Models

Name: Cambrian-10M: Multimodal Instruction Tuning Data for Vision-Language Models
Creator: nyu-visionx
Published: 2024-05-30T03:27:31
Keywords: Task Categoriesquestion Answering, Size Categories1 Mn10 M, Languageen, Task Categoriesvisual Question Answering, Vision Language, Regionus, Large Language Models, Licenseapache 20, Arxiv240616860, Visual Question Answering, Multimodal Instruction Tuning, Multimodal

by nyu-visionxUpdated 2y ago

Available on 1 platform

Sign in to view source links and access this dataset

Description

A dataset designed for instruction tuning in multimodal settings involving visual interaction data. It was created by nyu-visionx and released in 2024 to address the scarcity of high-quality multimodal instruction-tuning data. The dataset aims to maintain the language abilities of multimodal large language models.

Use Cases

Instruction tuning of multimodal LLMs based on visual interaction data mentioned in the description
Training models for visual question answering tasks based on the dataset's stated purpose
Maintaining language capabilities in vision-language models based on the dataset's design goal

Strengths

Designed specifically for multimodal instruction tuning, a stated research need
Associated with a published research paper (arXiv:2406.16860) and project website

Limitations

Description metadata is limited; actual data quality requires manual inspection after download
Column-level documentation is absent; field semantics must be inferred after download
Row count is unknown, which may limit suitability assessment

Provenance

Source: nyu-visionx
Freshness: Last updated 2024-07-08 04:34:51; freshness should be verified

License is unknown; users must verify terms before use.

Multimodal Task Categoriesquestion Answering Size Categories1 Mn10 M Languageen Task Categoriesvisual Question Answering Vision Language Regionus Large Language Models Licenseapache 20 Arxiv240616860 Visual Question Answering Multimodal Instruction Tuning

Related Datasets

Quality Score

D37

Description

39

Source

36

Reputation

47

Access

22

Community

7.3K downloads

127 likes

0 views

Dataset Info

Author: nyu-visionx
Created: May 30, 2024
Updated: Jul 8, 2024
Last synced: Jun 23, 2026

Access

22

Community

7.3K downloads

127 likes

0 views

Dataset Info

Author: nyu-visionx
Created: May 30, 2024
Updated: Jul 8, 2024
Last synced: Jun 23, 2026

Cambrian-10M: Multimodal Instruction Tuning Data for Vision-Language Models

Description

Use Cases

Strengths

Limitations

Provenance

Related Topics

Related Datasets

Quality Score

Community

Dataset Info

Community

Dataset Info