DataSalon

Discover quality datasets for AI training — aggregated from 40+ platforms, curated by AI.

ProductSearch Datasets Browse Topics Rankings Community API / MCP

ResourcesDocumentation Blog Changelog Status

LegalPrivacy Policy Terms of Service Cookie Policy

VieNeu-TTS-1000h: Vietnamese Neural Text-to-Speech 1000-Hour Dataset | DataSalon

Home Speech & AudioVieNeu-TTS-1000h: Vietnamese Neural Text-to-Speech 1000-Hour Dataset

Speech & Audio

VieNeu-TTS-1000h: Vietnamese Neural Text-to-Speech 1000-Hour Dataset

Name: VieNeu-TTS-1000h: Vietnamese Neural Text-to-Speech 1000-Hour Dataset
Creator: pnnbao-ump
Published: 2025-11-17T07:55:15
Keywords: Doi1057967hf7429, Text To Speech, Task Categoriestext To Speech, Modalityaudio, Modalitytext, Size Categories100 Kn1 M, Multi Speaker, Librarymlcroissant, Vietnamese, Librarydatasets, Licensecc By Nc 40, Audio, Regionus, Task Categoriesautomatic Speech Recognition, Arrow, Speech Recognition, Languagevi

by pnnbao-ump·Updated 6mo ago

Available on 1 platform

Description

443,641 Vietnamese audio samples and corresponding phonemized transcripts totaling 1,000 hours of speech data. The collection is structured for training and fine-tuning high-quality Text-to-Speech (TTS) and Automatic Speech Recognition (ASR) models.

Use Cases

Train a Vietnamese acoustic model from scratch using the 1,000 hours of audio samples and phonemized transcripts
Fine-tune a neural TTS system to improve pronunciation accuracy using the phonemized transcript labels
Develop an ASR system by mapping the audio samples to the provided text transcripts for speech-to-text conversion

Strengths

443,641 individual audio samples paired with transcripts
1,000 total hours of Vietnamese speech data
Includes phonemized transcripts for every audio sample to support neural TTS training
Supports both Text-to-Speech (TTS) and Automatic Speech Recognition (ASR) model development

Audio Arrow Doi1057967hf7429 Text To Speech Task Categoriestext To Speech Modalityaudio Modalitytext Size Categories100 Kn1 M Multi Speaker Librarymlcroissant Vietnamese Librarydatasets Licensecc By Nc 40 Regionus Task Categoriesautomatic Speech Recognition Speech Recognition Languagevi

Related Datasets

Quality Score

D37

Description

Source

Reputation

Quality Score

D37

Description

Source

Reputation

Access

Community

38 downloads

16 likes

0 views

Dataset Info

Author: pnnbao-ump
Created: Nov 17, 2025
Updated: Nov 25, 2025
Last synced: Apr 29, 2026

Access

Community

38 downloads

16 likes

0 views

Dataset Info

Author: pnnbao-ump
Created: Nov 17, 2025
Updated: Nov 25, 2025
Last synced: Apr 29, 2026

VieNeu-TTS-1000h: Vietnamese Neural Text-to-Speech 1000-Hour Dataset

Description

Use Cases

Strengths

Related Topics

Related Datasets

Quality Score

Community

Dataset Info

Community

Dataset Info