DataSalon

Discover quality datasets for AI training — aggregated from 40+ platforms, curated by AI.

ProductSearch Datasets Browse Topics Rankings Community API / MCP

ResourcesDocumentation Blog Changelog Status

LegalPrivacy Policy Terms of Service Cookie Policy

Espeech Podcasts: 3,200 Hours of Russian Speech Audio Segments | DataSalon

Home Speech & AudioEspeech Podcasts: 3,200 Hours of Russian Speech Audio Segments

Speech & Audio

Espeech Podcasts: 3,200 Hours of Russian Speech Audio Segments

Name: Espeech Podcasts: 3,200 Hours of Russian Speech Audio Segments
Creator: ESpeech
Published: 2025-08-22T18:06:11
Keywords: Podcasts, Russian Language, Audio

by ESpeech·Updated 6mo ago

Available on 1 platform

Description

ESpeech's Espeech Podcasts dataset contains 3,200 hours of processed audio segments extracted from various podcasts. The audio is in Russian, processed at a 44.1kHz sample rate, and is structured as segmented audio files with JSON metadata. The dataset was last updated on November 25, 2025.

Use Cases

Train text-to-speech (TTS) models based on the 3,200 hours of Russian speech audio.
Develop automatic speech recognition (ASR) systems based on the segmented podcast audio.
Conduct audio quality assessment research based on the processed 44.1kHz audio samples.

Strengths

Contains 3,200 hours of Russian speech audio, providing substantial volume for model training.
Audio is processed at a consistent 44.1kHz sample rate, which is a standard for high-quality audio.
Includes JSON metadata for each audio segment, suggesting structured information beyond raw audio.

Limitations

Column-level documentation is absent; field semantics must be inferred after download.
Row count is unknown, which may limit suitability assessment.
Data may reflect source bias inherent to the specific podcasts used.

Provenance

Source: ESpeech
Collection Method: Processed audio segments extracted from various podcasts.
Time Range: null
Freshness: Last updated 2025-11-25 11:16:26; freshness should be verified.
Geography: null

License is unknown; users must verify licensing terms before use.

Audio Podcasts Russian Language

Related Datasets

Quality Score

C41

Description

Source

Reputation

Quality Score

C41

Description

Source

Reputation

Access

Community

53 downloads

10 likes

0 views

Dataset Info

Author: ESpeech
Created: Aug 22, 2025
Updated: Nov 25, 2025
Last synced: May 31, 2026

Access

Community

53 downloads

10 likes

0 views

Dataset Info

Author: ESpeech
Created: Aug 22, 2025
Updated: Nov 25, 2025
Last synced: May 31, 2026

Espeech Podcasts: 3,200 Hours of Russian Speech Audio Segments

Description

Use Cases

Strengths

Limitations

Provenance

Related Topics

Related Datasets

Quality Score

Community

Dataset Info

Community

Dataset Info