DataSalon

Discover quality datasets for AI training — aggregated from 40+ platforms, curated by AI.

ProductSearch Datasets Browse Topics Rankings Community API / MCP

ResourcesDocumentation Blog Changelog Status

LegalPrivacy Policy Terms of Service Cookie Policy

Video Llava: A Multimodal Vision-Language Dataset | DataSalon

Home Multimodal & LLMVideo Llava: A Multimodal Vision-Language Dataset

Multimodal & LLM

Video Llava: A Multimodal Vision-Language Dataset

Name: Video Llava: A Multimodal Vision-Language Dataset
Creator: LanguageBind
Published: 2024-01-21T08:54:26
Keywords: Vision Language, Multimodal Ai, Llm Training, Video Language Model, Multimodal

by LanguageBind·Updated 2y ago

Available on 1 platform

Description

LanguageBind published a dataset titled 'Video Llava' on the HuggingFace platform in January 2024. The dataset likely contains video and text data for training or evaluating multimodal AI models. Specific details on size, format, and content are not provided in the available metadata.

Use Cases

Fine-tuning a vision-language model for video captioning (inferred from domain, verify after download)
Benchmarking video question-answering systems (inferred from domain, verify after download)
Training a model for temporal reasoning in video sequences (inferred from domain, verify after download)

Strengths

Published on the HuggingFace platform, a major hub for AI datasets and models.
Authored by 'LanguageBind', an entity associated with multimodal AI research.

Limitations

Metadata is minimal; actual content requires verification after download.
Column-level documentation is absent; field semantics must be inferred after download.
Row count, file formats, and license are unknown, which may limit suitability assessment.

Provenance

Source: huggingface
Freshness: Last updated 2024-01-24 06:11:46; freshness should be verified.

License is unknown; users must verify permissible usage before download.

Multimodal Vision Language Multimodal Ai Llm Training Video Language Model

Related Datasets

Quality Score

D24

Description

Source

Reputation

Quality Score

D24

Description

Source

Reputation

Access

Community

725 downloads

18 likes

0 views

Dataset Info

Author: LanguageBind
Created: Jan 21, 2024
Updated: Jan 24, 2024
Last synced: Jun 18, 2026

Access

Community

725 downloads

18 likes

0 views

Dataset Info

Author: LanguageBind
Created: Jan 21, 2024
Updated: Jan 24, 2024
Last synced: Jun 18, 2026

Video Llava: A Multimodal Vision-Language Dataset

Description

Use Cases

Strengths

Limitations

Provenance

Related Topics

Related Datasets

Quality Score

Community

Dataset Info

Community

Dataset Info