DataSalon

Discover quality datasets for AI training — aggregated from 40+ platforms, curated by AI.

ProductSearch Datasets Browse Topics Rankings Community API / MCP

ResourcesDocumentation Blog Changelog Status

LegalPrivacy Policy Terms of Service Cookie Policy

MMLongCite: A Benchmark for Evaluating Long-Context Vision-Language Models | DataSalon

Home Computer VisionMMLongCite: A Benchmark for Evaluating Long-Context Vision-Language Models

Computer Vision

MMLongCite: A Benchmark for Evaluating Long-Context Vision-Language Models

Name: MMLongCite: A Benchmark for Evaluating Long-Context Vision-Language Models
Creator: Jonaszky123
Published: 2025-10-20T07:19:45
Keywords: Vision Language Models, Evaluation, Benchmark, Computer Vision, Multimodal

by Jonaszky123·Updated 1mo ago

Available on 1 platform

Description

MMLongCite is a benchmark dataset created by Jonaszky123 to evaluate the faithfulness of long-context vision-language models. It covers 4 task categories, including Single-Source Visual Reasoning, Multi-Source Visual Reasoning, Vision Grounding, and Video Understanding, encompassing 8 distinct long-context tasks. The dataset was last updated on May 7, 2026.

Use Cases

Benchmarking model faithfulness based on citation tasks
Evaluating visual reasoning capabilities across single and multiple sources
Testing vision grounding performance in long-context scenarios
Assessing video understanding abilities in extended contexts

Strengths

Covers 4 distinct task categories for evaluation
Encompasses 8 specific long-context tasks
Designed specifically for evaluating long-context vision-language models

Limitations

Column-level documentation is absent; field semantics must be inferred after download
Row count is unknown, which may limit suitability assessment
Description metadata is limited; actual data quality requires manual inspection after download

Provenance

Source: huggingface
Freshness: Last updated 2026-05-07 04:05:08

License is unknown; terms of use must be verified before application.

Multimodal Vision Language Models Evaluation Benchmark Computer Vision

Related Datasets

Quality Score

D37

Description

Source

Reputation

Quality Score

D37

Description

Source

Reputation

Access

Community

108 downloads

1 likes

0 views

Dataset Info

Author: Jonaszky123
Created: Oct 20, 2025
Updated: May 7, 2026
Last synced: May 22, 2026

Access

Community

108 downloads

1 likes

0 views

Dataset Info

Author: Jonaszky123
Created: Oct 20, 2025
Updated: May 7, 2026
Last synced: May 22, 2026

MMLongCite: A Benchmark for Evaluating Long-Context Vision-Language Models

Description

Use Cases

Strengths

Limitations

Provenance

Related Topics

Related Datasets

Quality Score

Community

Dataset Info

Community

Dataset Info