DataSalon

Discover quality datasets for AI training — aggregated from 40+ platforms, curated by AI.

ProductSearch Datasets Browse Topics Rankings Community API / MCP

ResourcesDocumentation Blog Changelog Status

LegalPrivacy Policy Terms of Service Cookie Policy

CO-Bench: Benchmarking Language Model Agents on 36 Combinatorial Optimization Problems | DataSalon

Home Mathematics & StatisticsCO-Bench: Benchmarking Language Model Agents on 36 Combinatorial Optimization Problems

Mathematics & Statistics

CO-Bench: Benchmarking Language Model Agents on 36 Combinatorial Optimization Problems

Name: CO-Bench: Benchmarking Language Model Agents on 36 Combinatorial Optimization Problems
Creator: CO-Bench
Published: 2025-04-05T06:17:08
Keywords: Benchmark, Tabular, Algorithm Search, Language Model Agents

by CO-Bench·Updated 5mo ago

Available on 1 platform

Description

CO-Bench is a benchmark suite featuring 36 real-world Combinatorial Optimization problems drawn from a broad range of domains and complexity levels. The dataset contains the data for the paper 'CO-Bench: Benchmarking Language Model Agents in Algorithm Search for Combinatorial Optimization'. The dataset page was last updated on 2026-01-12.

Use Cases

Benchmarking agent performance based on the suite of 36 combinatorial optimization problems.
Evaluating algorithm search strategies across different domains and complexity levels.
Training or testing language model agents on structured problem-solving tasks.

Strengths

Includes 36 distinct combinatorial optimization problems.
Problems are drawn from a broad range of domains.
Problems span multiple complexity levels.

Limitations

Description metadata is limited; actual data quality requires manual inspection after download.
Column-level documentation is absent; field semantics must be inferred after download.
Row count is unknown, which may limit suitability assessment.

Provenance

Source: CO-Bench
Freshness: Last updated 2026-01-12 05:56:55; freshness should be verified.

Tabular Benchmark Algorithm Search Language Model Agents

Related Datasets

Quality Score

D39

Description

Source

Reputation

Quality Score

D39

Description

Source

Reputation

Access

Community

742 downloads

3 likes

0 views

Dataset Info

Author: CO-Bench
Created: Apr 5, 2025
Updated: Jan 12, 2026
Last synced: May 30, 2026

Access

Community

742 downloads

3 likes

0 views

Dataset Info

Author: CO-Bench
Created: Apr 5, 2025
Updated: Jan 12, 2026
Last synced: May 30, 2026

CO-Bench: Benchmarking Language Model Agents on 36 Combinatorial Optimization Problems

Description

Use Cases

Strengths

Limitations

Provenance

Related Topics

Related Datasets

Quality Score

Community

Dataset Info

Community

Dataset Info