DataSalon

Discover quality datasets for AI training — aggregated from 40+ platforms, curated by AI.

ProductSearch Datasets Browse Topics Rankings Community API / MCP

ResourcesDocumentation Blog Changelog Status

LegalPrivacy Policy Terms of Service Cookie Policy

Nemotron Cascade RLHF Training Prompts and Metadata | DataSalon

Home Multimodal & LLMNemotron Cascade RLHF Training Prompts and Metadata

Multimodal & LLM

Nemotron Cascade RLHF Training Prompts and Metadata

Name: Nemotron Cascade RLHF Training Prompts and Metadata
Creator: nvidia
Published: 2025-12-16T02:13:23
Keywords: Rlhf, Prompt Engineering, Text, Language Model Alignment, Reinforcement Learning

by nvidia·Updated 7mo ago

Available on 1 platform

Description

A collection of 45,882 prompt samples designed for Reinforcement Learning from Human Feedback training. Created by NVIDIA, this dataset supports language model alignment and was last updated in December 2025.

Use Cases

Training reward models by scoring generated responses against the provided prompts.
Fine-tuning language models for alignment using the prompt and category fields.
Analyzing data source distribution for bias detection in RLHF training corpora.

Strengths

Contains 45,882 samples for RLHF training.
Includes metadata such as data sources and categories.

Limitations

Sample size is moderate for RLHF, potentially limiting model generalization.
Specific column names and data distributions are not publicly detailed.

Provenance

Source: NVIDIA.
Collection Method: Designed for RLHF training; specific gathering method not detailed.
Freshness: Last updated in December 2025.

The full description, including specific columns and license details, is hosted externally on Hugging Face.

Text Rlhf Prompt Engineering Language Model Alignment Reinforcement Learning

Related Datasets

Quality Score

C42

Description

Source

Reputation

Quality Score

C42

Description

Source

Reputation

Access

Community

51 downloads

11 likes

0 views

Dataset Info

Author: nvidia
Created: Dec 16, 2025
Updated: Dec 16, 2025

Access

Community

51 downloads

11 likes

0 views

Dataset Info

Author: nvidia
Created: Dec 16, 2025
Updated: Dec 16, 2025

Nemotron Cascade RLHF Training Prompts and Metadata

Description

Use Cases

Strengths

Limitations

Provenance

Related Topics

Related Datasets

Quality Score

Community

Dataset Info

Community

Dataset Info