DataSalon

Discover quality datasets for AI training — aggregated from 40+ platforms, curated by AI.

ProductSearch Datasets Browse Topics Rankings Community API / MCP

ResourcesDocumentation Blog Changelog Status

LegalPrivacy Policy Terms of Service Cookie Policy

GSM8K Math Problem Dataset for ES and GRPO Comparison | DataSalon

Home Mathematics & StatisticsGSM8K Math Problem Dataset for ES and GRPO Comparison

Mathematics & Statistics

GSM8K Math Problem Dataset for ES and GRPO Comparison

Name: GSM8K Math Problem Dataset for ES and GRPO Comparison
Creator: alphaXiv
Published: 2026-03-05T14:58:53
Keywords: Mathematics, Benchmark, Text, Evolution Strategies, Llm Fine Tuning

by alphaXiv·Updated 3mo ago

Available on 1 platform

Description

AlphaXiv's dataset contains prepared splits of the GSM8K grade school math problems for comparing Evolution Strategies and Group Relative Policy Optimization methods in LLM fine-tuning. It includes 6,725 training samples, 1,867 validation samples, and 200 test samples. The dataset was last updated on March 5, 2026.

Use Cases

Fine-tuning LLMs for mathematical reasoning using the 'data' input field containing math problems.
Benchmarking Evolution Strategies against Group Relative Policy Optimization using the provided training, validation, and test splits.
Evaluating model performance on grade school math problems via the reserved test set of 200 samples.

Strengths

Contains 6,725 training examples for model fine-tuning.
Provides a structured split with 1,867 validation and 200 test samples for evaluation.

Limitations

Dataset size is moderate, with under 10,000 total samples.
Specific column structure and data format details are not fully described.

Provenance

Source: AlphaXiv on Hugging Face.
Collection Method: Prepared splits of the GSM8K dataset.
Freshness: Last updated on March 5, 2026.

Full data format and column details require visiting the Hugging Face dataset page. License information is unknown.

Text Mathematics Benchmark Evolution Strategies Llm Fine Tuning

Related Datasets

Quality Score

C44

Description

Source

Reputation

Quality Score

C44

Description

Source

Reputation

Access

Community

34 downloads

1 likes

0 views

Dataset Info

Author: alphaXiv
Created: Mar 5, 2026
Updated: Mar 5, 2026
Last synced: Apr 11, 2026

Access

Community

34 downloads

1 likes

0 views

Dataset Info

Author: alphaXiv
Created: Mar 5, 2026
Updated: Mar 5, 2026
Last synced: Apr 11, 2026

GSM8K Math Problem Dataset for ES and GRPO Comparison

Description

Use Cases

Strengths

Limitations

Provenance

Related Topics

Related Datasets

Quality Score

Community

Dataset Info

Community

Dataset Info