DataSalon

Discover quality datasets for AI training — aggregated from 40+ platforms, curated by AI.

ProductSearch Datasets Browse Topics Rankings Community API / MCP

ResourcesDocumentation Blog Changelog Status

LegalPrivacy Policy Terms of Service Cookie Policy

German Speech Audio with English Translations for ASR and TTS | DataSalon

Home Speech & AudioGerman Speech Audio with English Translations for ASR and TTS

Speech & Audio

German Speech Audio with English Translations for ASR and TTS

Name: German Speech Audio with English Translations for ASR and TTS
Creator: aman4014
Published: 2026-03-19T13:16:07
Keywords: Text To Speech, Machine Translation, Text, Multilingual, Audio, Large Scale, Audio Processing, Speech Recognition

by aman4014·Updated 3mo ago

Available on 1 platform

Description

A multi-source collection of German speech audio paired with transcriptions and English translations, curated by aman4014. The dataset is designed for training and evaluating Automatic Speech Recognition, Speech Translation, and Text-to-Speech systems. It was last updated on March 30, 2026.

Use Cases

Training German Automatic Speech Recognition models based on German audio and transcriptions.
Developing Speech Translation systems based on paired German audio and English translations.
Building multilingual Text-to-Speech systems based on the unified speech corpus.
Evaluating model performance on a curated mixture of established open-source speech corpora.

Strengths

The dataset is described as large-scale and multi-source.
It contains paired German audio, German transcriptions, and English translations.
It is a curated mixture of well-established open-source German and multilingual speech corpora.

Limitations

Column-level documentation is absent; field semantics must be inferred after download.
Row count is unknown, which may limit suitability assessment.
Last updated 2026-03-30 10:49:21; freshness should be verified.

Provenance

Source: A mixture of well-established open-source German and multilingual speech corpora.
Collection Method: Curated and unified under a common schema.

Text Audio Multilingual Text To Speech Machine Translation Large Scale Audio Processing Speech Recognition

Related Datasets

Quality Score

C40

Description

Source

Reputation

Quality Score

C40

Description

Source

Reputation

Access

Community

11.9K downloads

1 likes

0 views

Dataset Info

Author: aman4014
Created: Mar 19, 2026
Updated: Mar 30, 2026
Last synced: May 19, 2026

Access

Community

11.9K downloads

1 likes

0 views

Dataset Info

Author: aman4014
Created: Mar 19, 2026
Updated: Mar 30, 2026
Last synced: May 19, 2026

German Speech Audio with English Translations for ASR and TTS

Description

Use Cases

Strengths

Limitations

Provenance

Related Topics

Related Datasets

Quality Score

Community

Dataset Info

Community

Dataset Info