Metis-RL: Reinforcement Learning Dataset for Multimodal Agent Training

Name: Metis-RL: Reinforcement Learning Dataset for Multimodal Agent Training
Creator: Accio-Lab
Published: 2026-04-09T03:56:09
Keywords: Tool Use, Multimodal Ai, Meta Cognition, Reasoning, Reinforcement Learning, Multimodal

by Accio-LabUpdated 3mo ago

Available on 1 platform

Sign in to view source links and access this dataset

Description

Metis-RL contains approximately 5.2 thousand multimodal prompts designed for training agentic models. The dataset was created by Accio-Lab for reinforcement learning via Hierarchical Decoupled Policy Optimization and was last updated in April 2026. It focuses on cultivating meta-cognitive tool use across perception, search, and mathematical or logical reasoning tasks.

Use Cases

Training reinforcement learning agents for multimodal perception tasks based on the described prompts.
Developing meta-cognitive tool-use capabilities in AI models based on the described search and reasoning tasks.
Benchmarking agent performance on mathematical and logical reasoning problems based on the dataset's scope.

Strengths

Approximately 5.2 thousand curated multimodal prompts.
Designed for a specific, advanced training method (Hierarchical Decoupled Policy Optimization).
Covers three distinct task domains: perception, search, and mathematical/logical reasoning.

Limitations

Column-level documentation is absent; field semantics must be inferred after download.
Row count is unknown, which may limit suitability assessment.
Dataset size and file formats are unspecified.

Provenance

Source: Accio-Lab
Collection Method: Created for reinforcement learning training of the Metis-8B-RL model.
Time Range: null
Freshness: Last updated 2026-04-10 09:43:27; freshness should be verified.
Geography: null

License restrictions are unknown and should be verified before use.

Multimodal Tool Use Multimodal Ai Meta Cognition Reasoning Reinforcement Learning

Related Datasets

Quality Score

D38

Description

42

Source

36

Reputation

40

Access

26

Community

31 downloads

1 likes

0 views

Dataset Info

Author: Accio-Lab
Created: Apr 9, 2026
Updated: Apr 10, 2026
Last synced: Apr 18, 2026

Access

26

Community

31 downloads

1 likes

0 views

Dataset Info

Author: Accio-Lab
Created: Apr 9, 2026
Updated: Apr 10, 2026
Last synced: Apr 18, 2026

Metis-RL: Reinforcement Learning Dataset for Multimodal Agent Training

Description

Use Cases

Strengths

Limitations

Provenance

Related Topics

Related Datasets

Quality Score

Community

Dataset Info

Community

Dataset Info