DataSalon

Discover quality datasets for AI training — aggregated from 40+ platforms, curated by AI.

ProductSearch Datasets Browse Topics Rankings Community API / MCP

ResourcesDocumentation Blog Changelog Status

LegalPrivacy Policy Terms of Service Cookie Policy

ASID-1M: Attribute-Structured and Quality-Verified Audiovisual Instructions | DataSalon

Home Computer VisionASID-1M: Attribute-Structured and Quality-Verified Audiovisual Instructions

Computer Vision

ASID-1M: Attribute-Structured and Quality-Verified Audiovisual Instructions

Name: ASID-1M: Attribute-Structured and Quality-Verified Audiovisual Instructions
Creator: AudioVisual-Caption
Published: 2026-02-10T02:44:25
Keywords: Task Categoriesimage Text To Text, Librarypolars, Languageen, Modalitytext, Size Categories100 Kn1 M, Caption, Librarymlcroissant, Arxiv260213013, Librarydatasets, Librarypandas, Audiovisual, Quality Verified, Video Understanding, Regionus, Attribute Structured, JSON

by AudioVisual-Caption·Updated 3mo ago

Available on 1 platform

Description

ASID-1M is a large-scale audiovisual instruction dataset designed to support universal video understanding through fine-grained, controllable supervision. It addresses the limitations of traditional monolithic captions by providing attribute-structured and quality-verified data. The dataset aims to improve coverage of both visual and auditory elements within video content for more precise model training.

Use Cases

Instruction tuning for video-language models
Fine-grained audiovisual understanding
Controllable video captioning
Multimodal instruction following

Strengths

Attribute-structured data for fine-grained supervision
Quality-verified instructions
Large-scale coverage for multimodal tasks

Limitations

Specific column names and sample data are currently unavailable in the provided summary

Provenance

Source: AudioVisual-Caption
Freshness: Last updated March 11, 2026.
Geography: Global (English language focus)

JSON Task Categoriesimage Text To Text Librarypolars Languageen Modalitytext Size Categories100 Kn1 M Caption Librarymlcroissant Arxiv260213013 Librarydatasets Librarypandas Audiovisual Quality Verified Video Understanding Regionus Attribute Structured

Related Datasets

Quality Score

C42

Description

Source

Reputation

Quality Score

C42

Description

Source

Reputation

Access

Community

6.1K downloads

82 likes

0 views

Dataset Info

Author: AudioVisual-Caption
Created: Feb 10, 2026
Updated: Mar 11, 2026
Last synced: Jun 9, 2026

Access

Community

6.1K downloads

82 likes

0 views

Dataset Info

Author: AudioVisual-Caption
Created: Feb 10, 2026
Updated: Mar 11, 2026
Last synced: Jun 9, 2026

ASID-1M: Attribute-Structured and Quality-Verified Audiovisual Instructions

Description

Use Cases

Strengths

Limitations

Provenance

Related Topics

Related Datasets

Quality Score

Community

Dataset Info

Community

Dataset Info