SOTAVerified|Agents Browse Leaderboard About Blog

General Reinforcement Learning

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11–20 of 84 papers

Title	Date	Tasks	Status	Hype
Dropout Strategy in Reinforcement Learning: Limiting the Surrogate Objective Variance in Policy Optimization Methods	Oct 31, 2023	General Reinforcement Learningreinforcement-learning	—Unverified	0
ReMax: A Simple, Effective, and Efficient Reinforcement Learning Method for Aligning Large Language Models	Oct 16, 2023	General Reinforcement LearningGPU	CodeCode Available	2
Discovering General Reinforcement Learning Algorithms with Adversarial Environment Design	Oct 4, 2023	Deep Reinforcement LearningGeneral Reinforcement Learning	CodeCode Available	1
Image Transformation Sequence Retrieval with General Reinforcement Learning	Jul 13, 2023	General Reinforcement LearningModel-based Reinforcement Learning	—Unverified	0
L-SA: Learning Under-Explored Targets in Multi-Target Reinforcement Learning	May 23, 2023	General Reinforcement Learningreinforcement-learning	—Unverified	0
Computably Continuous Reinforcement-Learning Objectives are PAC-learnable	Mar 9, 2023	General Reinforcement Learningreinforcement-learning	—Unverified	0
Policy Mirror Descent Inherently Explores Action Space	Mar 8, 2023	Efficient ExplorationGeneral Reinforcement Learning	—Unverified	0
Learning to Backdoor Federated Learning	Mar 6, 2023	Backdoor AttackFederated Learning	CodeCode Available	0
Computational Dualism and Objective Superintelligence	Feb 2, 2023	General Reinforcement Learning	—Unverified	0
Accuracy-Guaranteed Collaborative DNN Inference in Industrial IoT via Deep Reinforcement Learning	Dec 31, 2022	Deep Reinforcement LearningEdge-computing	—Unverified	0

Show:10 25 50

← PrevPage 2 of 9Next →

All datasets Obstacle Tower (No Gen) fixed Obstacle Tower (No Gen) varied Obstacle Tower (Strong Gen) fixed Obstacle Tower (Strong Gen) varied Obstacle Tower (Weak Gen) fixed Obstacle Tower (Weak Gen) varied

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	RNB	Score	7	—	Unverified
2	PPO	Score	5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RNB	Score	4.8	—	Unverified
2	PPO	Score	1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RNB	Score	0.6	—	Unverified
2	PPO	Score	0.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RNB	Score	0.8	—	Unverified
2	PPO	Score	0.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PPO	Score	1.2	—	Unverified
2	RNB	Score	1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RNB	Score	3.4	—	Unverified
2	PPO	Score	0.8	—	Unverified