DataSalon

Discover quality datasets for AI training — aggregated from 40+ platforms, curated by AI.

ProductSearch Datasets Browse Topics Rankings Community API / MCP

ResourcesDocumentation Blog Changelog Status

LegalPrivacy Policy Terms of Service Cookie Policy

LLaVA Dataset: Vision-Language Data for Multimodal AI Training | DataSalon

Home Multimodal & LLMLLaVA Dataset: Vision-Language Data for Multimodal AI Training

Multimodal & LLM

LLaVA Dataset: Vision-Language Data for Multimodal AI Training

Available on 1 platform

Description

A dataset named LLaVA, hosted on Kaggle, likely contains multimodal data for training vision-language models. The platform tags suggest it is intended for large language model (LLM) training and multimodal AI tasks. Specific details on size, structure, and creation are not provided in the available metadata.

Use Cases

Fine-tuning a vision-language model for image captioning (inferred from domain, verify after download)
Training a model for visual question answering (VQA) (inferred from domain, verify after download)
Benchmarking multimodal model performance on instruction-following tasks (inferred from domain, verify after download)

Strengths

Published on Kaggle, a major platform for data science resources.
Platform tags ('Vision Language', 'Llm Training', 'Multimodal Ai') clearly indicate its intended domain.

Limitations

Metadata is minimal; actual content requires verification after download.
Row count, file formats, and column definitions are unknown, which limits suitability assessment.
License, author, and last update date are unknown.

Provenance

Source: Kaggle
Collection Method: Uploaded to the Kaggle platform; original collection method is unknown.
Time Range: null
Freshness: Last updated date is unknown; freshness unverified.
Geography: null

License restrictions are unknown; users must verify terms before use.

Multimodal Vision Language Multimodal Ai Llm Training

Related Datasets

Quality Score

D16

Description

Source

Reputation

Quality Score

D16

Description

Source

Reputation

Access

Community

0 views

Dataset Info

Last synced: Apr 24, 2026

Access

Community

0 views

Dataset Info

Last synced: Apr 24, 2026

LLaVA Dataset: Vision-Language Data for Multimodal AI Training

Description

Use Cases

Strengths

Limitations

Provenance

Related Topics

Related Datasets

Quality Score

Community

Dataset Info

Community

Dataset Info