DataSalon

Discover quality datasets for AI training — aggregated from 40+ platforms, curated by AI.

ProductSearch Datasets Browse Topics Rankings Community API / MCP

ResourcesDocumentation Blog Changelog Status

LegalPrivacy Policy Terms of Service Cookie Policy

FineVision: 24.3M Vision-Language Samples with 88.9M Dialogue Turns | DataSalon

Home Multimodal & LLMFineVision: 24.3M Vision-Language Samples with 88.9M Dialogue Turns

Multimodal & LLM

FineVision: 24.3M Vision-Language Samples with 88.9M Dialogue Turns

Name: FineVision: 24.3M Vision-Language Samples with 88.9M Dialogue Turns
Creator: HuggingFaceM4
Published: 2025-07-28T16:12:38
Keywords: Librarypolars, Librarydask, Size Categories10 Mn100 M, Modalitytext, Librarymlcroissant, Modalityimage, Librarydatasets, Parquet, Regionus, Arxiv251017269

by HuggingFaceM4·Updated 9mo ago

Available on 1 platform

Description

HuggingFaceM4 released FineVision in October 2025, a collection of 24.3 million samples featuring 17.3 million images and 88.9 million conversational turns. The dataset is designed for training open Vision-Language Models and contains 9.5 billion answer tokens.

Use Cases

Training multi-turn Vision-Language Models using the 88.9M conversational turns
Fine-tuning multi-modal instruction followers using the 9.5B answer tokens
Large-scale image feature extraction using the 17.3M image records

Strengths

Contains 17.3M images for visual representation learning
Includes 88.9M conversational turns for complex dialogue training
Provides 9.5B answer tokens for high-resolution language modeling
Native support for Polars and Dask for distributed processing

Limitations

Massive data volume requires high-performance computing infrastructure
Potential for label noise or inconsistencies across 24.3M samples

Provenance

Source: HuggingFaceM4
Freshness: Updated October 2025

Accessing the data requires the Hugging Face datasets library; users should use get_dataset_config_names to identify specific subsets before loading.

Parquet Librarypolars Librarydask Size Categories10 Mn100 M Modalitytext Librarymlcroissant Modalityimage Librarydatasets Regionus Arxiv251017269

Related Datasets

Quality Score

C43

Description

Source

Reputation

Quality Score

C43

Description

Source

Reputation

Access

Community

149.6K downloads

478 likes

0 views

Dataset Info

Author: HuggingFaceM4
Created: Jul 28, 2025
Updated: Oct 21, 2025
Last synced: Jul 25, 2026

Access

Community

149.6K downloads

478 likes

0 views

Dataset Info

Author: HuggingFaceM4
Created: Jul 28, 2025
Updated: Oct 21, 2025
Last synced: Jul 25, 2026

FineVision: 24.3M Vision-Language Samples with 88.9M Dialogue Turns

Description

Use Cases

Strengths

Limitations

Provenance

Related Topics

Related Datasets

Quality Score

Community

Dataset Info

Community

Dataset Info