DataSalon

Discover quality datasets for AI training — aggregated from 40+ platforms, curated by AI.

ProductSearch Datasets Browse Topics Rankings Community API / MCP

ResourcesDocumentation Blog Changelog Status

LegalPrivacy Policy Terms of Service Cookie Policy

Video Reasoning Training Dataset for Perception and Embodied Tasks | DataSalon

Home Computer VisionVideo Reasoning Training Dataset for Perception and Embodied Tasks

Computer Vision

Video Reasoning Training Dataset for Perception and Embodied Tasks

Name: Video Reasoning Training Dataset for Perception and Embodied Tasks
Creator: Zane-QIU
Published: 2026-04-03T09:38:03
Keywords: Video Reasoning, Robotics, Computer Vision, Large Scale, Simulation, Video, Synthetic, Multimodal

by Zane-QIU·Updated 2mo ago

Available on 1 platform

Description

Videoreason Training is a large-scale dataset comprising 471,575 samples across three subsets: perception (176,907 samples), simulation (105,818 samples), and embodied (188,850 samples). It was created by Zane-QIU and last updated on HuggingFace in April 2026. The dataset is designed for training models on video reasoning tasks spanning visual perception, 3D simulation, and robotics.

Use Cases

Train segmentation models using the perception subset's segmentation labels.
Develop video super-resolution models using the low-resolution and high-resolution video pairs in the perception subset.
Simulate camera motion for 3D scene navigation using the camera pose sequences in the simulation subset.
Train embodied AI agents for robotic manipulation using the action and state sequences in the embodied subset.

Strengths

471,575 total video samples
Covers three distinct reasoning domains: perception, simulation, and embodied tasks

Limitations

Specific column names, data formats, and sample sizes per task within subsets are unknown
No information on video resolution, frame rate, or annotation quality

Provenance

Source: Zane-QIU on HuggingFace
Freshness: Last updated April 2026.

The full dataset description and column details are only available on the external HuggingFace dataset page. License information is unknown.

Video Multimodal Video Reasoning Robotics Computer Vision Large Scale Simulation Synthetic

Related Datasets

Quality Score

D35

Description

Source

Reputation

Quality Score

D35

Description

Source

Reputation

Access

Community

2 downloads

1 likes

0 views

Dataset Info

Author: Zane-QIU
Created: Apr 3, 2026
Updated: Apr 5, 2026
Last synced: Apr 6, 2026

Access

Community

2 downloads

1 likes

0 views

Dataset Info

Author: Zane-QIU
Created: Apr 3, 2026
Updated: Apr 5, 2026
Last synced: Apr 6, 2026

Video Reasoning Training Dataset for Perception and Embodied Tasks

Description

Use Cases

Strengths

Limitations

Provenance

Related Topics

Related Datasets

Quality Score

Community

Dataset Info

Community

Dataset Info