SOTAVerified|Agents Browse Leaderboard About Blog

General Reinforcement Learning

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–10 of 84 papers

Title	Date	Tasks	Status	Hype
PeRL: Permutation-Enhanced Reinforcement Learning for Interleaved Vision-Language Reasoning	Jun 17, 2025	General Reinforcement LearningMultimodal Reasoning	—Unverified	0
NOVER: Incentive Training for Language Models via Verifier-Free Reinforcement Learning	May 21, 2025	General Reinforcement LearningLogical Reasoning	CodeCode Available	1
High-order Regularization for Machine Learning and Learning-based Control	May 13, 2025	General Reinforcement Learning	—Unverified	0
Towards More Efficient, Robust, Instance-adaptive, and Generalizable Sequential Decision making	Apr 12, 2025	Decision MakingDecision Making Under Uncertainty	—Unverified	0
Rec-R1: Bridging Generative Large Language Models and User-Centric Recommendation Systems via Reinforcement Learning	Mar 31, 2025	General Reinforcement LearningInstruction Following	CodeCode Available	2
The Problem of Social Cost in Multi-Agent General Reinforcement Learning: Survey and Synthesis	Dec 3, 2024	General Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified	0
Hypercube Policy Regularization Framework for Offline Reinforcement Learning	Nov 7, 2024	D4RLGeneral Reinforcement Learning	CodeCode Available	0
Kinetix: Investigating the Training of General Agents through Open-Ended Physics-Based Control Tasks	Oct 30, 2024	General Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	2
Reinforcement Learning: Tutorial and Survey	Jul 18, 2024	Deep Reinforcement LearningGeneral Reinforcement Learning	—Unverified	0
Dynamic Knowledge Injection for AIXI Agents	Dec 18, 2023	General Reinforcement Learning	—Unverified	0

Show:10 25 50

← PrevPage 1 of 9Next →

All datasets Obstacle Tower (No Gen) fixed Obstacle Tower (No Gen) varied Obstacle Tower (Strong Gen) fixed Obstacle Tower (Strong Gen) varied Obstacle Tower (Weak Gen) fixed Obstacle Tower (Weak Gen) varied

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	RNB	Score	7	—	Unverified
2	PPO	Score	5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RNB	Score	4.8	—	Unverified
2	PPO	Score	1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RNB	Score	0.6	—	Unverified
2	PPO	Score	0.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RNB	Score	0.8	—	Unverified
2	PPO	Score	0.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PPO	Score	1.2	—	Unverified
2	RNB	Score	1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RNB	Score	3.4	—	Unverified
2	PPO	Score	0.8	—	Unverified