DataSalon

Discover quality datasets for AI training — aggregated from 40+ platforms, curated by AI.

ProductSearch Datasets Browse Topics Rankings Community API / MCP

ResourcesDocumentation Blog Changelog Status

LegalPrivacy Policy Terms of Service Cookie Policy

MooreSpeechCorpora: Mooré Audio-Text Dataset for TTS and ASR | DataSalon

Home Speech & AudioMooreSpeechCorpora: Mooré Audio-Text Dataset for TTS and ASR

Speech & Audio

MooreSpeechCorpora: Mooré Audio-Text Dataset for TTS and ASR

Name: MooreSpeechCorpora: Mooré Audio-Text Dataset for TTS and ASR
Creator: anyantudre
Published: 2025-06-07T05:25:37
Keywords: Size Categories1 Kn10 K, Task Categoriestext To Speech, Librarypolars, Librarydask, Modalityaudio, Modalitytext, Librarymlcroissant, Librarydatasets, Parquet, Licensecc By Nc 40, Regionus, Task Categoriesautomatic Speech Recognition, Languagemos

by anyantudre·Updated 10mo ago

Available on 1 platform

Description

Cleaned and denoised audio-text pairs for the Mooré language (ISO 639-3: mos) sourced from public domains. This unified corpus is specifically curated for low-resource speech tasks including text-to-speech (TTS) and automatic speech recognition (ASR).

Use Cases

Train automatic speech recognition (ASR) models using the aligned audio and text transcriptions
Develop text-to-speech (TTS) synthesis engines for the Mooré language using the denoised audio samples
Perform phonetic and prosodic analysis of the Mooré language using the unified speech and text data

Strengths

Aligned audio and text pairs for the Mooré language (ISO 639-3: mos)
Cleaned and denoised audio files optimized for high-fidelity speech synthesis
Unified corpus structure derived from multiple publicly available sources

Parquet Size Categories1 Kn10 K Task Categoriestext To Speech Librarypolars Librarydask Modalityaudio Modalitytext Librarymlcroissant Librarydatasets Licensecc By Nc 40 Regionus Task Categoriesautomatic Speech Recognition Languagemos

Related Datasets

Quality Score

D36

Description

Source

Reputation

Quality Score

D36

Description

Source

Reputation

Access

Community

8 downloads

3 likes

0 views

Dataset Info

Author: anyantudre
Created: Jun 7, 2025
Updated: Jul 16, 2025

Access

Community

8 downloads

3 likes

0 views

Dataset Info

Author: anyantudre
Created: Jun 7, 2025
Updated: Jul 16, 2025

MooreSpeechCorpora: Mooré Audio-Text Dataset for TTS and ASR

Description

Use Cases

Strengths

Related Topics

Related Datasets

Quality Score

Community

Dataset Info

Community

Dataset Info