DataSalon

Discover quality datasets for AI training — aggregated from 40+ platforms, curated by AI.

ProductSearch Datasets Browse Topics Rankings Community API / MCP

ResourcesDocumentation Blog Changelog Status

LegalPrivacy Policy Terms of Service Cookie Policy

Subject–Text–Video Triples for Generation Tasks | DataSalon

Home Computer VisionSubject–Text–Video Triples for Generation Tasks

Computer Vision

Subject–Text–Video Triples for Generation Tasks

Name: Subject–Text–Video Triples for Generation Tasks
Creator: HiDream-ai
Published: 2026-04-01T08:37:50
Keywords: Size Categories1 Mn10 M, Text To Video, Video Generation, Computer Vision, Regionus, Large Scale, Subject To Video, Video, Task Categoriestext To Video, Image To Video, Licenseapache 20, Multimodal

by HiDream-ai·Updated 3mo ago

Available on 1 platform

Description

4.1 million subject–text–video triples form this dataset for subject-driven video generation. Created by HiDream-ai, it was last updated in April 2026. It includes instance segmentation, face detection, quality scores, and timeline annotations.

Use Cases

Train subject-to-video models using the 4.1M subject–text–video triples.
Evaluate video generation quality using the provided multi-dimensional quality scores.
Segment subjects in video frames using the included instance detection and segmentation annotations.
Analyze temporal event structure in videos using the timeline annotations.
Detect and process faces within video subjects using the face detection data.

Strengths

Contains 4.1 million data triples, indicating significant scale.
Includes multiple annotation types: instance segmentation, face detection, quality scores, and timeline events.

Limitations

Specific row counts, column details, and file formats are not provided.
The geographic and temporal coverage of the source videos is unknown.

Provenance

Source: HiDream-ai
Collection Method: null
Time Range: null
Freshness: null
Geography: null

null

Video Multimodal Size Categories1 Mn10 M Text To Video Video Generation Computer Vision Regionus Large Scale Subject To Video Task Categoriestext To Video Image To Video Licenseapache 20

Related Datasets

Quality Score

D36

Description

Source

Reputation

Quality Score

D36

Description

Source

Reputation

Access

Community

2 downloads

2 likes

0 views

Dataset Info

Author: HiDream-ai
Created: Apr 1, 2026
Updated: Apr 3, 2026
Last synced: May 20, 2026

Access

Community

2 downloads

2 likes

0 views

Dataset Info

Author: HiDream-ai
Created: Apr 1, 2026
Updated: Apr 3, 2026
Last synced: May 20, 2026

Subject–Text–Video Triples for Generation Tasks

Description

Use Cases

Strengths

Limitations

Provenance

Related Topics

Related Datasets

Quality Score

Community

Dataset Info

Community

Dataset Info