Bangla Regional Dialects Speech Dataset

Available on 1 platform

Sign in to view source links and access this dataset

Description

A speech dataset covering multiple regional dialects of the Bangla language, intended for automatic speech recognition tasks. The dataset is hosted on Kaggle, but details on its size, collection method, and creator are unspecified. Its primary focus is on capturing linguistic diversity within the Bengali-speaking regions.

Use Cases

Train automatic speech recognition models based on regional dialect audio
Benchmark speech system performance across different Bangla dialects based on the described coverage
Study phonetic and prosodic variations in Bengali speech based on the dialectal focus

Strengths

Focuses on regional dialect variation within Bangla, a key feature for inclusive speech technology
Platform tags confirm the dataset contains audio data for speech recognition

Limitations

Description metadata is limited; actual data quality requires manual inspection after download
Row count and file size are unknown, which may limit suitability assessment
Column-level documentation is absent; field semantics must be inferred after download

Provenance

Source: Kaggle
Geography: Bengali-speaking regions

Audio Audio Data Bengali Language Regional Dialects Speech Recognition

Related Datasets

Quality Score

D20

Description

19

Source

17

Reputation

18

Access

31

Community

0 views

Dataset Info

Last synced: May 31, 2026

Access

31

Community

0 views

Dataset Info

Last synced: May 31, 2026

Bangla Regional Dialects Speech Dataset

Description

Use Cases

Strengths

Limitations

Provenance

Related Topics

Related Datasets

Quality Score

Community

Dataset Info

Community

Dataset Info