GlobeAudio: A Multilingual Multicultural Audio-Language Benchmark

Name: GlobeAudio: A Multilingual Multicultural Audio-Language Benchmark
Creator: iNLP-Lab
Published: 2026-02-05T05:32:06
Keywords: Benchmark, Multilingual, Audio, Mcq Dataset, Audio Language Models, Naturalistic Evaluation, Multilingual Benchmark, Multimodal

by iNLP-LabUpdated 22d ago

Available on 1 platform

Sign in to view source links and access this dataset

Description

GlobeAudio is a benchmark for evaluating large audio-language models, comprising 5,637 human-authored multiple-choice questions. The dataset covers six typologically diverse languages, including English, Chinese, Thai, and Russian. It was created by iNLP-Lab and last updated in June 2026.

Use Cases

Benchmarking model performance on naturalistic audio understanding based on the described multiple-choice questions.
Evaluating cross-lingual and cross-cultural generalization of audio-language models based on the six-language coverage.
Training models for audio question-answering tasks based on the human-authored and verified MCQs.

Strengths

Contains 5,637 human-authored and verified multiple-choice questions.
Covers six typologically diverse languages, including English, Chinese, Thai, and Russian.

Limitations

Column-level documentation is absent; field semantics must be inferred after download.
Row count is unknown, which may limit suitability assessment.
Description metadata is limited; actual data quality requires manual inspection after download.

Provenance

Source: iNLP-Lab
Collection Method: Human-authored and rigorously verified, as described for the associated research paper.
Freshness: Last updated 2026-06-09 16:01:15; freshness should be verified.
Geography: Multicultural, with languages from the United States, China, Thailand, and Russia.

License is unknown; terms of use must be verified before application.

Audio Multimodal Multilingual Benchmark Mcq Dataset Audio Language Models Naturalistic Evaluation Multilingual Benchmark

Related Datasets

Quality Score

D38

Description

39

Source

39

Reputation

42

Access

26

Community

72 downloads

1 likes

0 views

Dataset Info

Author: iNLP-Lab
Created: Feb 5, 2026
Updated: Jun 9, 2026
Last synced: Jun 28, 2026

Access

26

Community

72 downloads

1 likes

0 views

Dataset Info

Author: iNLP-Lab
Created: Feb 5, 2026
Updated: Jun 9, 2026
Last synced: Jun 28, 2026

GlobeAudio: A Multilingual Multicultural Audio-Language Benchmark

Description

Use Cases

Strengths

Limitations

Provenance

Related Topics

Related Datasets

Quality Score

Community

Dataset Info

Community

Dataset Info