DataSalon

Discover quality datasets for AI training — aggregated from 40+ platforms, curated by AI.

ProductSearch Datasets Browse Topics Rankings Community API / MCP

ResourcesDocumentation Blog Changelog Status

LegalPrivacy Policy Terms of Service Cookie Policy

MM-SafetyBench: Multimodal Safety Evaluation Benchmark | DataSalon

Home Multimodal & LLMMM-SafetyBench: Multimodal Safety Evaluation Benchmark

Multimodal & LLM

MM-SafetyBench: Multimodal Safety Evaluation Benchmark

Name: MM-SafetyBench: Multimodal Safety Evaluation Benchmark
Creator: PKU-Alignment
Published: 2024-09-14T10:53:15
Keywords: Size Categories1 Kn10 K, Librarypolars, Languageen, Fraud, Modalitytext, Economic Harm, Librarymlcroissant, Modalityimage, Librarydatasets, Librarypandas, Parquet, Hate Speech, Licensecc By Nc 40, Illegal Activitiy, Regionus, Legal Opinion, Gov Decision, Malware Generation, Financial Advice

by PKU-Alignment·Updated 1y ago

Available on 1 platform

Description

5,040 text-image pairs across 13 safety scenarios including hate speech and illegal activities. The dataset provides a benchmark for evaluating the safety alignment of multimodal large language models. It specifically targets vulnerabilities in vision-language models through adversarial prompts.

Use Cases

Evaluate multimodal model safety by feeding the 'image' and 'question' columns into a model and checking the output
Perform error analysis across different safety domains using the 'category' column
Analyze the effectiveness of safety prompts by comparing model responses to the 'question' and 'image' inputs

Strengths

5,040 samples across 13 safety-related scenarios
Includes 'image', 'question', and 'category' fields
Covers 13 scenarios including 'Illegal Activities', 'Hate Speech', and 'Malicious Software'
Restricted to research use following GPT-4 and Stable Diffusion license agreements

Parquet Size Categories1 Kn10 K Librarypolars Languageen Fraud Modalitytext Economic Harm Librarymlcroissant Modalityimage Librarydatasets Librarypandas Hate Speech Licensecc By Nc 40 Illegal Activitiy Regionus Legal Opinion Gov Decision Malware Generation Financial Advice

Related Datasets

Quality Score

D38

Description

Source

Reputation

Quality Score

D38

Description

Source

Reputation

Access

Community

2.4K downloads

6 likes

0 views

Dataset Info

Author: PKU-Alignment
Created: Sep 14, 2024
Updated: Sep 19, 2024
Last synced: Jun 29, 2026

Access

Community

2.4K downloads

6 likes

0 views

Dataset Info

Author: PKU-Alignment
Created: Sep 14, 2024
Updated: Sep 19, 2024
Last synced: Jun 29, 2026

MM-SafetyBench: Multimodal Safety Evaluation Benchmark

Description

Use Cases

Strengths

Related Topics

Related Datasets

Quality Score

Community

Dataset Info

Community

Dataset Info