Stepeval Audio Paralinguistic

Name: Stepeval Audio Paralinguistic
Creator: stepfun-ai
Published: 2025-07-23T08:27:59
Keywords: AUDIOFOLDER, Modalityaudio, Size Categoriesn1 K, Librarymlcroissant, Librarydatasets, Regionus, Arxiv250716632

by stepfun-aiUpdated 11mo ago

Available on 1 platform

Sign in to view source links and access this dataset

Description

550 annotated speech samples categorized across 11 distinct paralinguistic dimensions for speech-to-speech model evaluation. The dataset includes curated audio files and corresponding annotations derived from the Step-Audio 2 technical research.

Use Cases

Evaluate model performance on non-verbal cues using the 11 paralinguistic dimensions
Benchmark speech-to-speech generation models using the 550 annotated audio samples
Analyze model sensitivity to paralinguistic variations using the curated speech files

Strengths

550 curated and annotated speech samples
Covers 11 distinct paralinguistic dimensions for model evaluation
Designed as a speech-to-speech benchmark for the Step-Audio 2 model series

AUDIOFOLDER Modalityaudio Size Categoriesn1 K Librarymlcroissant Librarydatasets Regionus Arxiv250716632

Related Datasets

Quality Score

C40

Description

39

Source

44

Reputation

48

Access

22

Community

209 downloads

10 likes

0 views

Dataset Info

Author: stepfun-ai
Created: Jul 23, 2025
Updated: Aug 29, 2025
Last synced: Jul 2, 2026

Access

22

Community

209 downloads

10 likes

0 views

Dataset Info

Author: stepfun-ai
Created: Jul 23, 2025
Updated: Aug 29, 2025
Last synced: Jul 2, 2026

Stepeval Audio Paralinguistic

Description

Use Cases

Strengths

Related Topics

Related Datasets

Quality Score

Community

Dataset Info

Community

Dataset Info