DataSalon

Discover quality datasets for AI training — aggregated from 40+ platforms, curated by AI.

ProductSearch Datasets Browse Topics Rankings Community API / MCP

ResourcesDocumentation Blog Changelog Status

LegalPrivacy Policy Terms of Service Cookie Policy

Innovator-VL-RL-172K: 172,000 Multimodal Reinforcement Learning Instances | DataSalon

Home Multimodal & LLMInnovator-VL-RL-172K: 172,000 Multimodal Reinforcement Learning Instances

Multimodal & LLM

Innovator-VL-RL-172K: 172,000 Multimodal Reinforcement Learning Instances

Name: Innovator-VL-RL-172K: 172,000 Multimodal Reinforcement Learning Instances
Creator: InnovatorLab
Published: 2026-01-23T15:28:44
Keywords: Task Categoriesimage Text To Text, Librarypolars, Librarydask, Dataset Collection, Vision Language Model, Languageen, Modalitytext, Size Categories100 Kn1 M, Librarymlcroissant, Arxiv260119325, Modalityimage, Librarydatasets, Parquet, Large Language Model, Regionus, Reinforcement Learning, Licensemit, Multimodal

by InnovatorLab·Updated 5mo ago

Available on 1 platform

Description

Innovator-VL-RL-172K is a curated multimodal reinforcement learning dataset containing 172,000 instances released by InnovatorLab in 2026. It provides image-text reasoning pairs designed to support RLHF-style optimization for vision-language models.

Use Cases

Optimizing vision-language models using the 172,000 image-text reasoning pairs for RLHF
Benchmarking decision-making performance in multimodal agents using curated response selection samples
Fine-tuning models to improve visual reasoning accuracy through reinforcement learning optimization

Strengths

172,000 curated instances
MIT licensed
Linked to Arxiv research 2601.19325

Limitations

Lack of detailed column descriptions in metadata
Potential geographic bias toward US-centric data
Curated nature may introduce selection bias

Provenance

Source: InnovatorLab
Collection Method: Curated
Freshness: Last updated February 2026.
Geography: United States

The dataset is provided in Parquet format and is compatible with Polars, Dask, and Hugging Face Datasets libraries.

Multimodal Parquet Task Categoriesimage Text To Text Librarypolars Librarydask Dataset Collection Vision Language Model Languageen Modalitytext Size Categories100 Kn1 M Librarymlcroissant Arxiv260119325 Modalityimage Librarydatasets Large Language Model Regionus Reinforcement Learning Licensemit

Related Datasets

Quality Score

D38

Description

Source

Reputation

Quality Score

D38

Description

Source

Reputation

Access

Community

482 downloads

1 likes

0 views

Dataset Info

Author: InnovatorLab
Created: Jan 23, 2026
Updated: Feb 6, 2026
Last synced: Jul 8, 2026

Access

Community

482 downloads

1 likes

0 views

Dataset Info

Author: InnovatorLab
Created: Jan 23, 2026
Updated: Feb 6, 2026
Last synced: Jul 8, 2026

Innovator-VL-RL-172K: 172,000 Multimodal Reinforcement Learning Instances

Description

Use Cases

Strengths

Limitations

Provenance

Related Topics

Related Datasets

Quality Score

Community

Dataset Info

Community

Dataset Info