DataSalon

Discover quality datasets for AI training — aggregated from 40+ platforms, curated by AI.

ProductSearch Datasets Browse Topics Rankings Community API / MCP

ResourcesDocumentation Blog Changelog Status

LegalPrivacy Policy Terms of Service Cookie Policy

Chinese-LiPS: Mandarin Audio-Visual Speech Recognition Dataset with Slides | DataSalon

Home Speech & AudioChinese-LiPS: Mandarin Audio-Visual Speech Recognition Dataset with Slides

Speech & Audio

Chinese-LiPS: Mandarin Audio-Visual Speech Recognition Dataset with Slides

Name: Chinese-LiPS: Mandarin Audio-Visual Speech Recognition Dataset with Slides
Creator: BAAI
Published: 2025-03-17T05:27:14
Keywords: Audio Visual Speech Recognition, Lip Reading, Educational Speech, Mandarin Chinese, Audio, Multimodal

by BAAI·Updated 6mo ago

Available on 1 platform

Description

Chinese-LiPS is a multimodal dataset for audio-visual speech recognition in Mandarin Chinese. It combines speech, video, and textual transcriptions to enhance automatic speech recognition performance, particularly in educational contexts. The dataset was created by BAAI and was last updated on 2025-11-18.

Use Cases

Training audio-visual speech recognition models based on synchronized speech, video, and text data.
Improving speech recognition robustness in noisy environments based on the multimodal lip-reading and audio features.
Developing educational technology tools based on instructional speech and presentation slide content.

Strengths

Multimodal design integrates speech, video, and text transcriptions.
Specifically designed for Mandarin Chinese and educational scenarios.

Limitations

Description metadata is limited; actual data quality requires manual inspection after download.
Column-level documentation is absent; field semantics must be inferred after download.
Row count and total duration are unknown, which may limit suitability assessment.

Provenance

Source: BAAI
Freshness: Last updated 2025-11-18 16:41:01; freshness should be verified.

Audio Multimodal Audio Visual Speech Recognition Lip Reading Educational Speech Mandarin Chinese

Related Datasets

Quality Score

D39

Description

Source

Reputation

Quality Score

D39

Description

Source

Reputation

Access

Community

401 downloads

9 likes

0 views

Dataset Info

Author: BAAI
Created: Mar 17, 2025
Updated: Nov 18, 2025
Last synced: May 6, 2026

Access

Community

401 downloads

9 likes

0 views

Dataset Info

Author: BAAI
Created: Mar 17, 2025
Updated: Nov 18, 2025
Last synced: May 6, 2026

Chinese-LiPS: Mandarin Audio-Visual Speech Recognition Dataset with Slides

Description

Use Cases

Strengths

Limitations

Provenance

Related Topics

Related Datasets

Quality Score

Community

Dataset Info

Community

Dataset Info