DataSalon

Discover quality datasets for AI training — aggregated from 40+ platforms, curated by AI.

ProductSearch Datasets Browse Topics Rankings Community API / MCP

ResourcesDocumentation Blog Changelog Status

LegalPrivacy Policy Terms of Service Cookie Policy

SCR-Bench: Skill Composition Risk Benchmark for AI Agents | DataSalon

Home Machine LearningSCR-Bench: Skill Composition Risk Benchmark for AI Agents

Machine Learning

SCR-Bench: Skill Composition Risk Benchmark for AI Agents

Name: SCR-Bench: Skill Composition Risk Benchmark for AI Agents
Creator: kyle-X1e
Published: 2026-06-11T17:49:29
Keywords: Ai Safety, Agent Evaluation, Security Benchmark, Benchmark, Tabular, Skill Composition

by kyle-X1e·Updated 22d ago

Available on 1 platform

Description

SCR-Bench is a benchmark for evaluating security risks that emerge when individually benign skills are composed into agent workflows. The dataset, authored by kyle-X1e, was last updated on Hugging Face on June 11, 2026. It focuses on harmful outcomes arising from capability flow, trust transfer, or authorization confusion along composition paths.

Use Cases

Evaluating emergent security risks in AI agent workflows based on skill composition.
Testing for harmful outcomes from capability flow between individually safe skills.
Assessing risks from trust transfer across composed agent skills.
Identifying vulnerabilities from authorization confusion in multi-skill systems.

Strengths

Focuses on a specific, emerging risk area in AI safety: composition of benign skills.
Benchmark is designed to evaluate three concrete risk mechanisms: capability flow, trust transfer, and authorization confusion.

Limitations

Description metadata is limited; actual data quality requires manual inspection after download.
Column-level documentation is absent; field semantics must be inferred after download.
Row count and file formats are unknown, which may limit suitability assessment.

Provenance

Source: kyle-X1e on Hugging Face.
Freshness: Last updated 2026-06-11 18:59:43; freshness should be verified.

License is unknown; users should verify permissions before use.

Tabular Ai Safety Agent Evaluation Security Benchmark Benchmark Skill Composition

Related Datasets

Quality Score

D37

Description

Source

Reputation

Quality Score

D37

Description

Source

Reputation

Access

Community

7 downloads

1 likes

0 views

Dataset Info

Author: kyle-X1e
Created: Jun 11, 2026
Updated: Jun 11, 2026
Last synced: Jun 20, 2026

Access

Community

7 downloads

1 likes

0 views

Dataset Info

Author: kyle-X1e
Created: Jun 11, 2026
Updated: Jun 11, 2026
Last synced: Jun 20, 2026

SCR-Bench: Skill Composition Risk Benchmark for AI Agents

Description

Use Cases

Strengths

Limitations

Provenance

Related Topics

Related Datasets

Quality Score

Community

Dataset Info

Community

Dataset Info