AF-Chat: ~75K Multi-Turn Conversations with Audio and Text

Name: AF-Chat: ~75K Multi-Turn Conversations with Audio and Text
Creator: nvidia
Published: 2025-07-10T07:34:16
Keywords: Size Categories10 Kn100 K, Licenseother, Librarypolars, Languageen, Arxiv250708128, Chat, Arxiv250303983, Modalitytext, Librarymlcroissant, Task Categoriesaudio Text To Text, Multi Turn Chat, Librarydatasets, Librarypandas, Audio Question Answering, Audio Text To Text, Environmental Sounds, Audio Llm, Audio, Regionus, Reasoning, JSON, Synthetic, Multimodal

by nvidiaUpdated 10mo ago

Available on 1 platform

Sign in to view source links and access this dataset

Description

AF-Chat is a fine-tuning dataset of approximately 75,000 multi-turn conversations involving audio clips, created by NVIDIA. The conversations are multi-audio, with an average of 4.6 clips and 6.2 turns per conversation, spanning speech, environmental sounds, and music. The dataset was last updated on July 21, 2025.

Use Cases

Fine-tuning audio-text conversational models based on multi-turn dialogues.
Training models for audio question answering based on multi-audio context.
Developing reasoning capabilities for LLMs based on combined speech, sound, and music inputs.

Strengths

Approximately 75,000 high-quality conversation examples.
Multi-audio context with an average of 4.6 clips and 6.2 turns per conversation.
Audio sourced from established datasets like YouTube8m and AudioSet.

Limitations

Column-level documentation is absent; field semantics must be inferred after download.
Row count is unknown, which may limit suitability assessment.
Description metadata is limited; actual data quality requires manual inspection after download.

Provenance

Source: NVIDIA, with audio sourced from YouTube8m and AudioSet.
Collection Method: Likely curated and synthesized from existing audio datasets for fine-tuning.
Time Range: null
Freshness: Last updated 2025-07-21 17:49:49.
Geography: null

null

Related Datasets

Quality Score

D39

Description

42

Source

36

Reputation

49

Access

26

Community

149 downloads

13 likes

0 views

Dataset Info

Author: nvidia
Created: Jul 10, 2025
Updated: Jul 21, 2025
Last synced: Jun 8, 2026

Access

26

Community

149 downloads

13 likes

0 views

Dataset Info

Author: nvidia
Created: Jul 10, 2025
Updated: Jul 21, 2025
Last synced: Jun 8, 2026

AF-Chat: ~75K Multi-Turn Conversations with Audio and Text

Description

Use Cases

Strengths

Limitations

Provenance

Related Topics

Related Datasets

Quality Score

Community

Dataset Info

Community

Dataset Info