DataSalon

Discover quality datasets for AI training — aggregated from 40+ platforms, curated by AI.

ProductSearch Datasets Browse Topics Rankings Community API / MCP

ResourcesDocumentation Blog Changelog Status

LegalPrivacy Policy Terms of Service Cookie Policy

Vript: Fine-Grained Video Scripting Dataset with 12K Videos | DataSalon

Home Multimodal & LLMVript: Fine-Grained Video Scripting Dataset with 12K Videos

Multimodal & LLM

Vript: Fine-Grained Video Scripting Dataset with 12K Videos

Name: Vript: Fine-Grained Video Scripting Dataset with 12K Videos
Creator: Mutonix
Published: 2024-04-10T12:17:42
Keywords: Multimodal Annotation, Computer Vision, Video Captioning, Video Scripting, Multimodal

by Mutonix·Updated 2y ago

Available on 1 platform

Description

Vript is a fine-grained video-text dataset constructed by Mutonix, containing 12,000 annotated high-resolution videos split into approximately 400,000 clips. The annotation is inspired by video scripts, detailing scene content, shot types, and camera movements. The dataset was last updated on June 11, 2024.

Use Cases

Training video-to-text models based on fine-grained scene descriptions.
Developing video generation models based on structured script annotations.
Researching the relationship between camera movements, shot types, and narrative content.

Strengths

Contains 12,000 high-resolution videos.
Provides fine-grained annotations for approximately 400,000 video clips.
Annotation structure includes scene content, shot type, and camera movement details.

Limitations

Column-level documentation is absent; field semantics must be inferred after download.
Row count for the full dataset is unknown, which may limit suitability assessment.
Description metadata is limited; actual data quality requires manual inspection after download.

Provenance

Source: Mutonix
Collection Method: Constructed and annotated, likely from curated video sources.
Freshness: Last updated 2024-06-11 10:38:10.

License is unknown; terms of use must be verified before application.

Multimodal Multimodal Annotation Computer Vision Video Captioning Video Scripting

Related Datasets

Quality Score

D39

Description

Source

Reputation

Quality Score

D39

Description

Source

Reputation

Access

Community

8.4K downloads

25 likes

0 views

Dataset Info

Author: Mutonix
Created: Apr 10, 2024
Updated: Jun 11, 2024
Last synced: Jun 28, 2026

Access

Community

8.4K downloads

25 likes

0 views

Dataset Info

Author: Mutonix
Created: Apr 10, 2024
Updated: Jun 11, 2024
Last synced: Jun 28, 2026

Vript: Fine-Grained Video Scripting Dataset with 12K Videos

Description

Use Cases

Strengths

Limitations

Provenance

Related Topics

Related Datasets

Quality Score

Community

Dataset Info

Community

Dataset Info