DataSalon

Discover quality datasets for AI training — aggregated from 40+ platforms, curated by AI.

ProductSearch Datasets Browse Topics Rankings Community API / MCP

ResourcesDocumentation Blog Changelog Status

LegalPrivacy Policy Terms of Service Cookie Policy

VLM-SubtleBench: 10,000+ Image Pairs for Subtle Comparative Reasoning | DataSalon

Home Multimodal & LLMVLM-SubtleBench: 10,000+ Image Pairs for Subtle Comparative Reasoning

Multimodal & LLM

VLM-SubtleBench: 10,000+ Image Pairs for Subtle Comparative Reasoning

Name: VLM-SubtleBench: 10,000+ Image Pairs for Subtle Comparative Reasoning
Creator: KRAFTON
Published: 2026-02-24T16:08:47
Keywords: Size Categories10 Kn100 K, Arxiv260307888, Task Categoriesimage To Text, Languageen, Task Categoriesvisual Question Answering, Comparative Reasoning, Modalityimage, Multi Image, Benchmark, Licensecc By Nc 40, Regionus, Subtle Difference, Vlm

by KRAFTON·Updated 4mo ago

Available on 1 platform

Description

VLM-SubtleBench provides between 10,000 and 100,000 image pairs to evaluate the subtle comparative reasoning capabilities of Vision-Language Models. Developed by KRAFTON and released in early 2026, the dataset targets domains where visual differences are nuanced, such as medical imaging and industrial anomaly detection.

Use Cases

Evaluating VLM performance on industrial anomaly detection using the image-to-text comparative descriptions
Testing multi-image reasoning capabilities by comparing visually similar medical imaging pairs
Benchmarking visual question answering accuracy for subtle changes in aerial surveillance imagery

Strengths

Scale of 10,000 to 100,000 records
Focus on subtle visual differences rather than salient ones
Covers specialized domains like medical and industrial imaging

Limitations

Restricted to non-commercial use via CC BY-NC 4.0 license
Lack of specific column metadata in the public repository description

Provenance

Source: KRAFTON
Freshness: Last updated March 2026.
Geography: United States

Released under CC BY-NC 4.0, which prohibits commercial use; requires tools capable of handling multi-image input for VLMs.

Size Categories10 Kn100 K Arxiv260307888 Task Categoriesimage To Text Languageen Task Categoriesvisual Question Answering Comparative Reasoning Modalityimage Multi Image Benchmark Licensecc By Nc 40 Regionus Subtle Difference Vlm

Related Datasets

Quality Score

D36

Description

Source

Reputation

Quality Score

D36

Description

Source

Reputation

Access

Community

3.8K downloads

3 likes

0 views

Dataset Info

Author: KRAFTON
Created: Feb 24, 2026
Updated: Mar 10, 2026

Access

Community

3.8K downloads

3 likes

0 views

Dataset Info

Author: KRAFTON
Created: Feb 24, 2026
Updated: Mar 10, 2026

VLM-SubtleBench: 10,000+ Image Pairs for Subtle Comparative Reasoning

Description

Use Cases

Strengths

Limitations

Provenance

Related Topics

Related Datasets

Quality Score

Community

Dataset Info

Community

Dataset Info