DataSalon

Discover quality datasets for AI training — aggregated from 40+ platforms, curated by AI.

ProductSearch Datasets Browse Topics Rankings Community API / MCP

ResourcesDocumentation Blog Changelog Status

LegalPrivacy Policy Terms of Service Cookie Policy

SafetyBench: 11,435 Multilingual Multiple-Choice Questions for LLM Safety Evaluation | DataSalon

Home PhysicsSafetyBench: 11,435 Multilingual Multiple-Choice Questions for LLM Safety Evaluation

Physics

SafetyBench: 11,435 Multilingual Multiple-Choice Questions for LLM Safety Evaluation

Name: SafetyBench: 11,435 Multilingual Multiple-Choice Questions for LLM Safety Evaluation
Creator: thu-coai
Published: 2023-09-12T02:59:06
Keywords: Evaluation, Ai Benchmark, Benchmark, Text, Multilingual, Llm Safety, Multiple Choice

by thu-coai·Updated 2y ago

Available on 1 platform

Description

SafetyBench is a benchmark dataset with 11,435 multiple-choice questions designed to evaluate the safety of large language models. The dataset spans 7 distinct categories of safety concerns and incorporates both Chinese and English data. It was created by thu-coai and last updated on September 14, -2023.

Use Cases

Benchmarking LLM safety performance based on 7 distinct categories of safety concerns.
Evaluating multilingual model safety using the incorporated Chinese and English data.
Analyzing model failure modes across different safety question types.

Strengths

Contains 11,435 diverse multiple-choice questions.
Covers 7 distinct categories of safety concerns.
Includes data in both Chinese and English languages.

Limitations

Row count for individual test splits is unknown.
Column-level documentation is absent; field semantics must be inferred after download.
Last updated 2023-09-14 05:25:39; freshness should be verified.

Provenance

Source: thu-coai
Collection Method: Likely curated for research purposes as a benchmark.
Time Range: null
Freshness: Last updated 2023-09-14 05:25:39.
Geography: null

null

Text Multilingual Evaluation Ai Benchmark Benchmark Llm Safety Multiple Choice

Related Datasets

Quality Score

D35

Description

Source

Reputation

Quality Score

D35

Description

Source

Reputation

Access

Community

1.1K downloads

34 likes

0 views

Dataset Info

Author: thu-coai
Created: Sep 12, 2023
Updated: Sep 14, 2023
Last synced: Jun 7, 2026

Access

Community

1.1K downloads

34 likes

0 views

Dataset Info

Author: thu-coai
Created: Sep 12, 2023
Updated: Sep 14, 2023
Last synced: Jun 7, 2026

SafetyBench: 11,435 Multilingual Multiple-Choice Questions for LLM Safety Evaluation

Description

Use Cases

Strengths

Limitations

Provenance

Related Topics

Related Datasets

Quality Score

Community

Dataset Info

Community

Dataset Info