DataSalon

Discover quality datasets for AI training — aggregated from 40+ platforms, curated by AI.

ProductSearch Datasets Browse Topics Rankings Community API / MCP

ResourcesDocumentation Blog Changelog Status

LegalPrivacy Policy Terms of Service Cookie Policy

Multimodal Crosslingual Instruction Following Benchmark | DataSalon

Home Multimodal & LLMMultimodal Crosslingual Instruction Following Benchmark

Multimodal & LLM

Multimodal Crosslingual Instruction Following Benchmark

Name: Multimodal Crosslingual Instruction Following Benchmark
Creator: FBK-MT
Published: 2025-12-15T17:46:39
Keywords: Benchmark, Computer Vision, Multilingual, Audio, Multimodal Benchmark, Speech Recognition, Crosslingual Evaluation, Multimodal

by FBK-MT·Updated 4mo ago

Available on 1 platform

Description

MCIF is a human-annotated benchmark for evaluating instruction-following across speech, vision, and text modalities in four languages. The dataset was created by FBK-MT and was last updated in February 2026.

Use Cases

Benchmark MLLM performance on crosslingual instruction-following tasks using speech, text, and image inputs.
Evaluate model understanding of long-form scientific content across English, German, Italian, and Chinese languages.
Assess multimodal reasoning capabilities by requiring models to process and integrate information from audio transcripts, visual data, and textual instructions.

Strengths

Covers three core modalities: speech, vision, and text.
Spans four diverse languages: English, German, Italian, and Chinese.

Limitations

Specific dataset size, row count, and file formats are unknown.
Limited to content from scientific talks, which may not represent general conversational or instructional data.

Provenance

Source: FBK-MT via Hugging Face.
Collection Method: Human-annotated, based on scientific talks.
Time Range: null
Freshness: Last updated in February 2026.
Geography: null

null

Audio Multimodal Multilingual Benchmark Computer Vision Multimodal Benchmark Speech Recognition Crosslingual Evaluation

Related Datasets

Quality Score

C41

Description

Source

Reputation

Quality Score

C41

Description

Source

Reputation

Access

Community

1.0K downloads

70 likes

0 views

Dataset Info

Author: FBK-MT
Created: Dec 15, 2025
Updated: Feb 25, 2026
Last synced: Apr 13, 2026

Access

Community

1.0K downloads

70 likes

0 views

Dataset Info

Author: FBK-MT
Created: Dec 15, 2025
Updated: Feb 25, 2026
Last synced: Apr 13, 2026

Multimodal Crosslingual Instruction Following Benchmark

Description

Use Cases

Strengths

Limitations

Provenance

Related Topics

Related Datasets

Quality Score

Community

Dataset Info

Community

Dataset Info