DataSalon

Discover quality datasets for AI training — aggregated from 40+ platforms, curated by AI.

ProductSearch Datasets Browse Topics Rankings Community API / MCP

ResourcesDocumentation Blog Changelog Status

LegalPrivacy Policy Terms of Service Cookie Policy

MusicSem: 35,977 Text-Audio Music Pairings | DataSalon

Home Speech & AudioMusicSem: 35,977 Text-Audio Music Pairings

Speech & Audio

MusicSem: 35,977 Text-Audio Music Pairings

Name: MusicSem: 35,977 Text-Audio Music Pairings
Creator: AMSRNA
Published: 2025-05-14T18:34:18
Keywords: Machine Learning, Benchmark, Audio Text, Audio, Multimodal

by AMSRNA·Updated 1y ago

Available on 1 platform

Description

MusicSem is a multimodal dataset containing 35,977 entries of paired text and audio. It includes a withheld test set of 480 entries for leaderboard evaluation. The dataset was curated by Rebecca Salganik, Teng Tu, Fei-Yueh Chen, Xiaohao Liu, Kaifeng Lu, Ethan Luvisia, Zhiyao Duan, Guillaume Salha-Galvan, Anson Kahng, Yunshan Ma, and Jian Kang.

Use Cases

Training music captioning models based on paired audio and text descriptions.
Evaluating audio-text retrieval systems based on the withheld test set.
Developing multimodal music classification models based on the paired data structure.

Strengths

Contains 35,977 text-audio pairs, providing a substantial corpus.
Includes a dedicated test set of 480 entries for benchmarking.

Limitations

Column-level documentation is absent; field semantics must be inferred after download.
Row count for the main dataset is known, but other metadata like file formats and size is unknown.

Provenance

Source: AMSRNA via Hugging Face.
Freshness: Last updated 2025-05-15 23:40:55.

License details are not fully specified in the provided input; the full MIT license description is on the dataset page.

Audio Multimodal Machine Learning Benchmark Audio Text

Related Datasets

Quality Score

D36

Description

Source

Reputation

Quality Score

D36

Description

Source

Reputation

Access

Community

186 downloads

5 likes

0 views

Dataset Info

Author: AMSRNA
Created: May 14, 2025
Updated: May 15, 2025
Last synced: Jun 8, 2026

Access

Community

186 downloads

5 likes

0 views

Dataset Info

Author: AMSRNA
Created: May 14, 2025
Updated: May 15, 2025
Last synced: Jun 8, 2026

MusicSem: 35,977 Text-Audio Music Pairings

Description

Use Cases

Strengths

Limitations

Provenance

Related Topics

Related Datasets

Quality Score

Community

Dataset Info

Community

Dataset Info