Omnidistil: Multimodal Conversational Speech Dataset

Name: Omnidistil: Multimodal Conversational Speech Dataset
Creator: ShiniChien
Published: 2026-05-14T16:54:14
Keywords: Audio Dataset, Speech Synthesis, Conversational Ai, Tabular, Audio, Multimodal Dialogue

by ShiniChienUpdated 2mo ago

Available on 1 platform

Sign in to view source links and access this dataset

Description

A dataset of conversational speech audio paired with transcripts and prompts. It contains turn-based dialogue data with columns for conversation identifiers, speaker agents, text prompts, transcripts, and audio files. The dataset was uploaded by ShiniChien to Hugging Face and last updated on 2026-05-15.

Use Cases

Training text-to-speech models based on the audio and transcript columns.
Analyzing conversational dynamics based on turn indices and agent roles.
Evaluating speech synthesis quality using the specified TTS voice and audio duration metadata.
Building multimodal dialogue agents using the paired prompts, transcripts, and audio.

Strengths

Includes structured metadata such as conversation_id, turn_index, and agent for each dialogue turn.
Contains multimodal data with linked audio files (WAV format) and text transcripts.
Provides system prompts used to generate each speaker's turn.

Limitations

Description metadata is limited; actual data quality requires manual inspection after download.
Row count is unknown, which may limit suitability assessment.
Column-level documentation is absent; field semantics must be inferred after download.

Provenance

Source: huggingface
Collection Method: Likely generated using Gemini Live AI system based on prompt column description.
Freshness: Last updated 2026-05-15 09:43:25; freshness should be verified.

License is unknown; terms of use must be verified before application.

Tabular Audio Audio Dataset Speech Synthesis Conversational Ai Multimodal Dialogue

Related Datasets

Quality Score

D31

Description

24

Source

36

Reputation

41

Access

22

Community

49 downloads

1 likes

0 views

Dataset Info

Author: ShiniChien
Created: May 14, 2026
Updated: May 15, 2026
Last synced: May 26, 2026

Access

22

Community

49 downloads

1 likes

0 views

Dataset Info

Author: ShiniChien
Created: May 14, 2026
Updated: May 15, 2026
Last synced: May 26, 2026

Omnidistil: Multimodal Conversational Speech Dataset

Description

Use Cases

Strengths

Limitations

Provenance

Related Topics

Related Datasets

Quality Score

Community

Dataset Info

Community

Dataset Info