Japanese TTS Model Robustness Benchmark

Name: Japanese TTS Model Robustness Benchmark
Creator: Parakeet-Inc
Published: 2026-01-21T10:12:37
Keywords: Task Categoriestext To Speech, Librarypolars, Modalityaudio, OPTIMIZED-PARQUET, Size Categoriesn1 K, Modalitytext, Librarymlcroissant, Librarydatasets, Librarypandas, Parquet, Regionus, Languageja, Licenseapache 20

by Parakeet-IncUpdated 5mo ago

Available on 1 platform

Sign in to view source links and access this dataset

Description

J-HARD-TTS-Eval is a benchmark dataset for evaluating autoregressive Japanese Text-To-Speech models. It focuses on specific failure modes including stability in short sequences, repetition handling, and context completion. The dataset was created by Parakeet-Inc and last updated in January 2026.

Use Cases

Benchmark TTS model robustness on failure modes like short sequence stability using Japanese audio and text data
Evaluate model performance on repetition handling tasks within Japanese speech synthesis
Assess context completion capabilities of autoregressive TTS models for Japanese language

Strengths

Benchmark designed for specific TTS failure modes: short sequences, repetition, and context completion
Dataset is optimized for Parquet format and includes tags for Japanese language and audio modality
Last updated in January 2026, indicating recent maintenance

Limitations

Unknown row count, column names, and file size limit analytical planning
Sample data unavailable prevents preview of data structure and content
Specific geographic coverage within Japan is unspecified

Provenance

Source: Parakeet-Inc via Hugging Face
Collection Method: Benchmark dataset for evaluating TTS model robustness
Time Range: null
Freshness: 2026-01-28
Geography: Japan (Language: ja)

null

OPTIMIZED-PARQUET Parquet Task Categoriestext To Speech Librarypolars Modalityaudio Size Categoriesn1 K Modalitytext Librarymlcroissant Librarydatasets Librarypandas Regionus Languageja Licenseapache 20

Related Datasets

Quality Score

D39

Description

39

Source

41

Reputation

47

Access

22

Community

195 downloads

5 likes

0 views

Dataset Info

Author: Parakeet-Inc
Created: Jan 21, 2026
Updated: Jan 28, 2026
Last synced: May 12, 2026

Access

22

Community

195 downloads

5 likes

0 views

Dataset Info

Author: Parakeet-Inc
Created: Jan 21, 2026
Updated: Jan 28, 2026
Last synced: May 12, 2026

Japanese TTS Model Robustness Benchmark

Description

Use Cases

Strengths

Limitations

Provenance

Related Topics

Related Datasets

Quality Score

Community

Dataset Info

Community

Dataset Info