Ornstein: 100K Multi-Domain Reasoning Tasks

Name: Ornstein: 100K Multi-Domain Reasoning Tasks
Creator: DJLougen
Published: 2026-04-20T19:41:44
Keywords: Language Model Training, Curriculum Learning, Text, Multi Domain Reasoning

by DJLougenUpdated 2mo ago

Available on 1 platform

Sign in to view source links and access this dataset

Description

Ornstein Curated 100K is a dataset of 100,000 samples designed for training large language models on explicit multi-step reasoning across diverse cognitive domains. It was created by DJLougen and last updated on April 20, 2026. The dataset implements curriculum learning principles through difficulty-based sequencing.

Use Cases

Training language models on multi-step reasoning based on the described multi-domain tasks
Implementing curriculum learning strategies based on the difficulty-based sequencing
Benchmarking model performance on progressive reasoning tasks based on the foundational-to-complex structure

Strengths

Contains 100,000 samples for training
Designed for explicit multi-step reasoning across diverse cognitive domains
Implements curriculum learning principles through difficulty-based sequencing

Limitations

Column-level documentation is absent; field semantics must be inferred after download
Row count is unknown, which may limit suitability assessment
Description metadata is limited; actual data quality requires manual inspection after download

Provenance

Source: DJLougen on Hugging Face
Freshness: Last updated 2026-04-20 21:58:30; freshness should be verified

Text Language Model Training Curriculum Learning Multi Domain Reasoning

Related Datasets

Quality Score

D38

Description

42

Source

39

Reputation

38

Access

26

Community

3 likes

0 views

Dataset Info

Author: DJLougen
Created: Apr 20, 2026
Updated: Apr 20, 2026
Last synced: May 18, 2026

Access

26

Community

3 likes

0 views

Dataset Info

Author: DJLougen
Created: Apr 20, 2026
Updated: Apr 20, 2026
Last synced: May 18, 2026

Ornstein: 100K Multi-Domain Reasoning Tasks

Description

Use Cases

Strengths

Limitations

Provenance

Related Topics

Related Datasets

Quality Score

Community

Dataset Info

Community

Dataset Info