DataSalon

Discover quality datasets for AI training — aggregated from 40+ platforms, curated by AI.

ProductSearch Datasets Browse Topics Rankings Community API / MCP

ResourcesDocumentation Blog Changelog Status

LegalPrivacy Policy Terms of Service Cookie Policy

Tts Indo: Indonesian Text-to-Speech Dataset | DataSalon

Home Speech & AudioTts Indo: Indonesian Text-to-Speech Dataset

Speech & Audio

Tts Indo: Indonesian Text-to-Speech Dataset

Name: Tts Indo: Indonesian Text-to-Speech Dataset
Creator: agufsamudra
Published: 2025-05-18T11:42:28
Keywords: Task Categoriestext To Speech, Librarypolars, Librarydask, Modalityaudio, Modalitytext, Size Categories100 Kn1 M, Languageid, Librarymlcroissant, Librarydatasets, Parquet, Regionus, Licenseapache 20

by agufsamudra·Updated 1y ago

Available on 1 platform

Description

114,036 preprocessed Indonesian speech samples totaling approximately 4GB of data. The dataset includes WAV audio recordings sampled at 16,000 Hz paired with corresponding text transcriptions.

Use Cases

Train an Indonesian Text-to-Speech (TTS) model using the audio and text features
Fine-tune Automatic Speech Recognition (ASR) systems by mapping the audio recordings to their text transcriptions
Analyze phonetic distribution in Indonesian speech using the provided text labels

Strengths

Contains 114,036 individual speech examples
Audio files are provided in WAV format with a standardized sampling rate of 16,000 Hz
Includes a text column containing the transcription for each corresponding audio entry

Parquet Task Categoriestext To Speech Librarypolars Librarydask Modalityaudio Modalitytext Size Categories100 Kn1 M Languageid Librarymlcroissant Librarydatasets Regionus Licenseapache 20

Related Datasets

Quality Score

C41

Description

Source

Reputation

Quality Score

C41

Description

Source

Reputation

Access

Community

399 downloads

7 likes

0 views

Dataset Info

Author: agufsamudra
Created: May 18, 2025
Updated: May 18, 2025
Last synced: May 9, 2026

Access

Community

399 downloads

7 likes

0 views

Dataset Info

Author: agufsamudra
Created: May 18, 2025
Updated: May 18, 2025
Last synced: May 9, 2026

Tts Indo: Indonesian Text-to-Speech Dataset

Description

Use Cases

Strengths

Related Topics

Related Datasets

Quality Score

Community

Dataset Info

Community

Dataset Info