SOTAVerified|Agents Browse Leaderboard About

MuJoCo Games

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–8 of 8 papers

Title	Date	Tasks	Status	Hype
Surrogate-Assisted Evolutionary Reinforcement Learning Based on Autoencoder and Hyperbolic Neural Network	May 26, 2025	Evolutionary AlgorithmsMuJoCo	—Unverified	0
LS-IQ: Implicit Reward Regularization for Inverse Reinforcement Learning	Mar 1, 2023	Continuous ControlImitation Learning	CodeCode Available	1
A Unified Approach to Reinforcement Learning, Quantal Response Equilibria, and Two-Player Zero-Sum Games	Jun 12, 2022	Deep Reinforcement LearningMuJoCo Games	CodeCode Available	1
EDGE: Explaining Deep Reinforcement Learning Policies	Dec 1, 2021	Deep Reinforcement LearningMuJoCo	CodeCode Available	1
Particle Based Stochastic Policy Optimization	Sep 29, 2021	Deep Reinforcement LearningMuJoCo Games	—Unverified	0
IQ-Learn: Inverse soft-Q Learning for Imitation	Jun 23, 2021	Atari GamesContinuous Control	CodeCode Available	1
Weak Human Preference Supervision For Deep Reinforcement Learning	Jul 25, 2020	Deep Reinforcement LearningMuJoCo	CodeCode Available	0
RL Unplugged: A Suite of Benchmarks for Offline Reinforcement Learning	Jun 24, 2020	Atari GamesDQN Replay Dataset	CodeCode Available	0

Show:10 25 50

All datasets Ant Walker2d Ant-v3 HalfCheetah HalfCHeetah-v3 Hopper Hopper-v3 Humanoid-v2 Humanoid-v3 InvertedDoublePendulum InvertedPendulum Point Maze

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IQ-Learn	Average Return	4,362.9	—	Unverified
2	PEMIRL	Average Return	846.18	—	Unverified
3	AIRL Fu et al. (2017)	Average Return	127.61	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	IQ-Learn	Mean	5,134	—	Unverified
2	POP3D	Mean	3,966.01	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ParPI	Average Reward	5,142	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POP3D	Mean	3,184.54	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ParPI	Average Reward	11,738	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POP3D	Mean	1,452.09	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ParPI	Average Reward	3,042	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	IQ-Learn	Return	5,227.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ParPI	Average Reward	4,912	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POP3D	Mean	4,907.64	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POP3D	Mean	741.94	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PEMIRL	Average Return	-7.37	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POP3D	Mean	-4.29	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PEMIRL	Average Return	-27.16	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PEMIRL	Average Return	-74.17	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POP3D	Mean	111.08	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ParPI	Average Reward	5,201	—	Unverified