DataSalon

Discover quality datasets for AI training — aggregated from 40+ platforms, curated by AI.

ProductSearch Datasets Browse Topics Rankings Community API / MCP

ResourcesDocumentation Blog Changelog Status

LegalPrivacy Policy Terms of Service Cookie Policy

IISc-MILE Tamil ASR Corpus: Tamil Speech Recognition Data | DataSalon

Home Speech & AudioIISc-MILE Tamil ASR Corpus: Tamil Speech Recognition Data

Speech & Audio

IISc-MILE Tamil ASR Corpus: Tamil Speech Recognition Data

Available on 1 platform

Description

Tamil language audio data for automatic speech recognition (ASR). The dataset is published on Kaggle and likely contains speech recordings and corresponding transcriptions. The Indian Institute of Science (IISc) MILE lab is inferred as the source, but specific details on size, collection method, and time range are unavailable.

Use Cases

Train an acoustic model for Tamil speech recognition (inferred from domain, verify after download)
Benchmark ASR system performance on a specific Indian language (inferred from domain, verify after download)
Fine-tune a multilingual speech model on Tamil data (inferred from domain, verify after download)

Strengths

Published on Kaggle, a platform with established data hosting and versioning
Focuses on Tamil, a major Dravidian language with significant speaker population

Limitations

Metadata is minimal; actual content requires verification after download
Row count, file formats, and license are unknown, which may limit suitability assessment
Column-level documentation is absent; field semantics must be inferred after download

Provenance

Source: Likely the Indian Institute of Science (IISc) MILE lab, based on the dataset title.
Collection Method: Inferred to be collected speech recordings, but specific methodology is unknown.
Time Range: null
Freshness: Last updated date is unknown; freshness unverified
Geography: Inferred to be focused on Tamil language, which is primarily spoken in India and Sri Lanka.

null

Audio Natural Language Processing Audio Corpus Speech Recognition

Related Datasets

Quality Score

D16

Description

Source

Reputation

Quality Score

D16

Description

Source

Reputation

Access

Community

0 views

Dataset Info

Last synced: Apr 24, 2026

Access

Community

0 views

Dataset Info

Last synced: Apr 24, 2026

IISc-MILE Tamil ASR Corpus: Tamil Speech Recognition Data

Description

Use Cases

Strengths

Limitations

Provenance

Related Topics

Related Datasets

Quality Score

Community

Dataset Info

Community

Dataset Info