SOTAVerified|Agents Browse Leaderboard About Blog

General Reinforcement Learning

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 71–80 of 84 papers

Title	Date	Tasks	Status	Hype	Score
Low-Resource Machine Translation based on Asynchronous Dynamic Programming	Aug 1, 2021	General Reinforcement LearningLow Resource Neural Machine Translation	—Unverified	0	0
L-SA: Learning Under-Explored Targets in Multi-Target Reinforcement Learning	May 23, 2023	General Reinforcement Learningreinforcement-learning	—Unverified	0	0
Macro Action Reinforcement Learning with Sequence Disentanglement using Variational Autoencoder	Mar 22, 2019	DisentanglementGeneral Reinforcement Learning	—Unverified	0	0
Model-Free Mean-Field Reinforcement Learning: Mean-Field MDP and Mean-Field Q-Learning	Oct 28, 2019	General Reinforcement LearningQ-Learning	—Unverified	0	0
Nonparametric General Reinforcement Learning	Nov 28, 2016	General Reinforcement Learningreinforcement-learning	—Unverified	0	0
PeRL: Permutation-Enhanced Reinforcement Learning for Interleaved Vision-Language Reasoning	Jun 17, 2025	General Reinforcement LearningMultimodal Reasoning	—Unverified	0	0
Policy Mirror Descent Inherently Explores Action Space	Mar 8, 2023	Efficient ExplorationGeneral Reinforcement Learning	—Unverified	0	0
Reducing Planning Complexity of General Reinforcement Learning with Non-Markovian Abstractions	Dec 26, 2021	Decision MakingGeneral Reinforcement Learning	—Unverified	0	0
Compositional Transfer in Hierarchical Reinforcement Learning	Jun 26, 2019	General Reinforcement LearningHierarchical Reinforcement Learning	—Unverified	0	0
Reinforcement Learning of Speech Recognition System Based on Policy Gradient and Hypothesis Selection	Nov 10, 2017	General Reinforcement Learningreinforcement-learning	—Unverified	0	0

Show:10 25 50

← PrevPage 8 of 9Next →

All datasets Obstacle Tower (No Gen) fixed Obstacle Tower (No Gen) varied Obstacle Tower (Strong Gen) fixed Obstacle Tower (Strong Gen) varied Obstacle Tower (Weak Gen) fixed Obstacle Tower (Weak Gen) varied

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	RNB	Score	7	—	Unverified
2	PPO	Score	5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RNB	Score	4.8	—	Unverified
2	PPO	Score	1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RNB	Score	0.6	—	Unverified
2	PPO	Score	0.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RNB	Score	0.8	—	Unverified
2	PPO	Score	0.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PPO	Score	1.2	—	Unverified
2	RNB	Score	1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RNB	Score	3.4	—	Unverified
2	PPO	Score	0.8	—	Unverified