DataSalon

Discover quality datasets for AI training — aggregated from 40+ platforms, curated by AI.

ProductSearch Datasets Browse Topics Rankings Community API / MCP

ResourcesDocumentation Blog Changelog Status

LegalPrivacy Policy Terms of Service Cookie Policy

Emilia-NV: Mandarin Speech with 18 Paralinguistic Vocalization Categories | DataSalon

Home Speech & AudioEmilia-NV: Mandarin Speech with 18 Paralinguistic Vocalization Categories

Speech & Audio

Emilia-NV: Mandarin Speech with 18 Paralinguistic Vocalization Categories

Name: Emilia-NV: Mandarin Speech with 18 Paralinguistic Vocalization Categories
Creator: amphion
Published: 2025-08-01T16:47:44
Keywords: Task Categoriestext To Speech, Languagezh, Modalityaudio, Librarywebdataset, Licensecc By Nc Sa 40, Modalitytext, Size Categories100 Kn1 M, Librarymlcroissant, WEBDATASET, Librarydatasets, Regionus, Task Categoriesautomatic Speech Recognition

by amphion·Updated 8mo ago

Available on 1 platform

Description

Amphion released the NVSpeech (Emilia-NV) dataset in 2025, providing between 100,000 and 1,000,000 Mandarin Chinese speech samples. The collection features word-level annotations for 18 categories of paralinguistic vocalizations, including non-verbal sounds and lexicalized interjections.

Use Cases

Training ASR models to detect non-verbal sounds like laughter and breathing within speech
Synthesizing natural interjections like 'uhm' and 'oh' in TTS systems using word-level labels
Acoustic analysis of 18 different paralinguistic vocalization categories in Mandarin

Strengths

Includes 18 distinct categories of paralinguistic vocalizations
Provides word-level annotations for precise temporal alignment
Scale of 100,000 to 1,000,000 records

Limitations

Restricted to Mandarin Chinese language only
Non-commercial license (CC BY-NC-SA 4.0) restricts usage in proprietary products

Provenance

Source: Amphion
Freshness: Last updated September 2025.
Geography: China

The dataset is distributed in the WebDataset format and is licensed under CC BY-NC-SA 4.0, which prohibits commercial use and requires derivative works to be shared under the same terms.

WEBDATASET Task Categoriestext To Speech Languagezh Modalityaudio Librarywebdataset Licensecc By Nc Sa 40 Modalitytext Size Categories100 Kn1 M Librarymlcroissant Librarydatasets Regionus Task Categoriesautomatic Speech Recognition

Related Datasets

Quality Score

D39

Description

Source

Reputation

Quality Score

D39

Description

Source

Reputation

Access

Community

1.3K downloads

39 likes

0 views

Dataset Info

Author: amphion
Created: Aug 1, 2025
Updated: Sep 18, 2025
Last synced: Jun 7, 2026

Access

Community

1.3K downloads

39 likes

0 views

Dataset Info

Author: amphion
Created: Aug 1, 2025
Updated: Sep 18, 2025
Last synced: Jun 7, 2026

Emilia-NV: Mandarin Speech with 18 Paralinguistic Vocalization Categories

Description

Use Cases

Strengths

Limitations

Provenance

Related Topics

Related Datasets

Quality Score

Community

Dataset Info

Community

Dataset Info