DataSalon

Discover quality datasets for AI training — aggregated from 40+ platforms, curated by AI.

ProductSearch Datasets Browse Topics Rankings Community API / MCP

ResourcesDocumentation Blog Changelog Status

LegalPrivacy Policy Terms of Service Cookie Policy

Multimodal Cold Start: 10K-100K Reasoning Samples for SFT | DataSalon

Home Multimodal & LLMMultimodal Cold Start: 10K-100K Reasoning Samples for SFT

Multimodal & LLM

Multimodal Cold Start: 10K-100K Reasoning Samples for SFT

Name: Multimodal Cold Start: 10K-100K Reasoning Samples for SFT
Creator: WaltonFuture
Published: 2025-05-23T11:13:45
Keywords: Size Categories10 Kn100 K, Task Categoriesimage Text To Text, Librarypolars, Librarydask, Cold Start, Modalitytext, Chain Of Thought, Librarymlcroissant, Modalityimage, Librarydatasets, Parquet, Large Language Model, Sft, Regionus, Reasoning, Reinforcement Learning, Arxiv250522334, Multimodal

by WaltonFuture·Updated 1y ago

Available on 1 platform

Description

10,000 to 100,000 multimodal records for cold-start supervised fine-tuning (SFT) in reasoning tasks, released by WaltonFuture in 2025. It supports the research paper 'Advancing Multimodal Reasoning via Reinforcement Learning with Cold Start' by providing initial training data for a two-stage reinforcement learning pipeline.

Use Cases

Supervised fine-tuning of models using chain-of-thought reasoning labels
Cold-start initialization for reinforcement learning in image-text-to-text tasks
Benchmarking multimodal reasoning capabilities

Strengths

10,000 to 100,000 record scale
Includes chain-of-thought reasoning labels
Optimized Parquet format

Limitations

Lack of explicit column documentation in metadata
Potential narrow focus on the cold-start SFT phase of reinforcement learning

Provenance

Source: WaltonFuture, associated with Arxiv paper 2505.22334
Freshness: Last updated July 2025.

Associated with Arxiv paper 2505.22334; requires understanding of the two-stage reinforcement learning approach described therein.

Multimodal Parquet Size Categories10 Kn100 K Task Categoriesimage Text To Text Librarypolars Librarydask Cold Start Modalitytext Chain Of Thought Librarymlcroissant Modalityimage Librarydatasets Large Language Model Sft Regionus Reasoning Reinforcement Learning Arxiv250522334

Related Datasets

Quality Score

D37

Description

Source

Reputation

Quality Score

D37

Description

Source

Reputation

Access

Community

82 downloads

11 likes

0 views

Dataset Info

Author: WaltonFuture
Created: May 23, 2025
Updated: Jul 24, 2025

Access

Community

82 downloads

11 likes

0 views

Dataset Info

Author: WaltonFuture
Created: May 23, 2025
Updated: Jul 24, 2025

Multimodal Cold Start: 10K-100K Reasoning Samples for SFT

Description

Use Cases

Strengths

Limitations

Provenance

Related Topics

Related Datasets

Quality Score

Community

Dataset Info

Community

Dataset Info