DataSalon

Discover quality datasets for AI training — aggregated from 40+ platforms, curated by AI.

ProductSearch Datasets Browse Topics Rankings Community API / MCP

ResourcesDocumentation Blog Changelog Status

LegalPrivacy Policy Terms of Service Cookie Policy

VisualWebInstruct-Verified: High-Confidence Multimodal QA for RL Training | DataSalon

Home Multimodal & LLMVisualWebInstruct-Verified: High-Confidence Multimodal QA for RL Training

Multimodal & LLM

VisualWebInstruct-Verified: High-Confidence Multimodal QA for RL Training

Name: VisualWebInstruct-Verified: High-Confidence Multimodal QA for RL Training
Creator: TIGER-Lab
Published: 2025-05-24T10:14:39
Keywords: Multimodal Qa, Language Model Training, Computer Vision, Reinforcement Learning, Multimodal

by TIGER-Lab·Updated 9mo ago

Available on 1 platform

Description

A high-confidence subset of VisualWebInstruct curated by TIGER-Lab, last updated October 24, 2025. It contains verified multimodal question–answer pairs where correctness, reasoning quality, and image–text alignment have been explicitly validated. The dataset is designed for Reinforcement Learning and Reward Model training pipelines.

Use Cases

Training reinforcement learning agents based on verified multimodal question–answer pairs.
Training reward models based on validated reasoning quality and image–text alignment.
Fine-tuning vision-language models on high-confidence instruction-following data.

Strengths

Contains verified question–answer pairs where correctness has been explicitly validated.
Data quality is curated for high-confidence use in Reinforcement Learning training.

Limitations

Column-level documentation is absent; field semantics must be inferred after download.
Row count is unknown, which may limit suitability assessment.

Provenance

Source: TIGER-Lab
Collection Method: Curated subset of VisualWebInstruct.
Freshness: Last updated 2025-10-24 15:52:27.

Multimodal Multimodal Qa Language Model Training Computer Vision Reinforcement Learning

Related Datasets

Quality Score

C40

Description

Source

Reputation

Quality Score

C40

Description

Source

Reputation

Access

Community

851 downloads

7 likes

0 views

Dataset Info

Author: TIGER-Lab
Created: May 24, 2025
Updated: Oct 24, 2025
Last synced: Jun 1, 2026

Access

Community

851 downloads

7 likes

0 views

Dataset Info

Author: TIGER-Lab
Created: May 24, 2025
Updated: Oct 24, 2025
Last synced: Jun 1, 2026

VisualWebInstruct-Verified: High-Confidence Multimodal QA for RL Training

Description

Use Cases

Strengths

Limitations

Provenance

Related Topics

Related Datasets

Quality Score

Community

Dataset Info

Community

Dataset Info