MuJoCo

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 351–400 of 677 papers

Title	Date	Tasks	Status
MESA: Cooperative Meta-Exploration in Multi-Agent Learning through Exploiting State-Action Space Structure	May 1, 2024	Efficient ExplorationMuJoCo	—Unverified
MetaDiffuser: Diffusion Model as Conditional Planner for Offline Meta-RL	May 31, 2023	MuJoCoReinforcement Learning (RL)	—Unverified
Meta-Reinforcement Learning Based on Self-Supervised Task Representation Learning	Apr 29, 2023	Meta Reinforcement LearningMuJoCo	—Unverified
Meta-Reinforcement Learning via Exploratory Task Clustering	Feb 15, 2023	ClusteringMeta Reinforcement Learning	—Unverified
Meta Reinforcement Learning with Distribution of Exploration Parameters Learned by Evolution Strategies	Dec 29, 2018	Meta-LearningMeta Reinforcement Learning	—Unverified
Mind's Eye: Grounded Language Model Reasoning through Simulation	Oct 11, 2022	Language ModelingLanguage Modelling	—Unverified
Model-based Adversarial Imitation Learning	Dec 7, 2016	Imitation Learningmodel	—Unverified
Model-Based Reward Shaping for Adversarial Inverse Reinforcement Learning in Stochastic Environments	Oct 4, 2024	MuJoCo	—Unverified
Model-Invariant State Abstractions for Model-Based Reinforcement Learning	Feb 19, 2021	continuous-controlContinuous Control	—Unverified
MQES: Max-Q Entropy Search for Efficient Exploration in Continuous Reinforcement Learning	Jan 1, 2021	Efficient ExplorationMuJoCo	—Unverified
Multi-Object Grasping in the Plane	Jun 1, 2022	MuJoCoObject	—Unverified
Multi-Objective Algorithms for Learning Open-Ended Robotic Problems	Nov 11, 2024	DiversityEvolutionary Algorithms	—Unverified
Multi-Path Policy Optimization	Nov 11, 2019	Deep Reinforcement LearningEfficient Exploration	—Unverified
Multi-step Greedy Reinforcement Learning Algorithms	Oct 7, 2019	Continuous ControlGame of Go	—Unverified
Multi-task Reinforcement Learning with a Planning Quasi-Metric	Feb 8, 2020	MuJoCoreinforcement-learning	—Unverified
Mutual-Information Regularization in Markov Decision Processes and Actor-Critic Learning	Sep 11, 2019	MuJoCoQ-Learning	—Unverified
NADPEx: An on-policy temporally consistent exploration method for deep reinforcement learning	Dec 21, 2018	continuous-controlContinuous Control	—Unverified
Neural Episodic Control with State Abstraction	Jan 27, 2023	Deep Reinforcement LearningMuJoCo	—Unverified
Neural Population Learning beyond Symmetric Zero-sum Games	Jan 10, 2024	MuJoCoTransfer Learning	—Unverified
Neuroplastic Expansion in Deep Reinforcement Learning	Oct 10, 2024	Deep Reinforcement LearningMuJoCo	—Unverified
Non-local Policy Optimization via Diversity-regularized Collaborative Exploration	Jun 14, 2020	DiversityMuJoCo	—Unverified
OER: Offline Experience Replay for Continual Offline Reinforcement Learning	May 23, 2023	Continual LearningMuJoCo	—Unverified
Offline Imitation Learning with a Misspecified Simulator	Dec 1, 2020	Decision MakingFriction	—Unverified
Offline Multi-agent Reinforcement Learning via Score Decomposition	May 9, 2025	continuous-controlContinuous Control	—Unverified
Offline Robot Reinforcement Learning with Uncertainty-Guided Human Expert Sampling	Dec 16, 2022	MuJoCoQ-Learning	—Unverified
Off-OAB: Off-Policy Policy Gradient Method with Optimal Action-Dependent Baseline	May 4, 2024	Computational EfficiencyMuJoCo	—Unverified
Off-Policy Deep Reinforcement Learning Algorithms for Handling Various Robotic Manipulator Tasks	Dec 11, 2022	Deep Reinforcement LearningMuJoCo	—Unverified
One is More: Diverse Perspectives within a Single Network for Efficient DRL	Oct 21, 2023	Deep Reinforcement LearningMuJoCo	—Unverified
On-Policy Model Errors in Reinforcement Learning	Oct 15, 2021	modelMuJoCo	—Unverified
On-Policy Policy Gradient Reinforcement Learning Without On-Policy Sampling	Nov 14, 2023	MuJoCoreinforcement-learning	—Unverified
On Proximal Policy Optimization's Heavy-tailed Gradients	Feb 20, 2021	continuous-controlContinuous Control	—Unverified
On Representation Complexity of Model-based and Model-free Reinforcement Learning	Oct 3, 2023	modelMuJoCo	—Unverified
On the Convergence Theory of Meta Reinforcement Learning with Personalized Policies	Sep 21, 2022	continuous-controlContinuous Control	—Unverified
On the Geometry of Reinforcement Learning in Continuous State and Action Spaces	Dec 29, 2022	MuJoCoreinforcement-learning	—Unverified
OPAC: Opportunistic Actor-Critic	Dec 11, 2020	continuous-controlContinuous Control	—Unverified
OVD-Explorer: A General Information-theoretic Exploration Approach for Reinforcement Learning	Sep 29, 2021	MuJoCoreinforcement-learning	—Unverified
OVD-Explorer: Optimism Should Not Be the Sole Pursuit of Exploration in Noisy Environments	Dec 19, 2023	continuous-controlContinuous Control	—Unverified
Overcoming Model Bias for Robust Offline Deep Reinforcement Learning	Aug 12, 2020	continuous-controlContinuous Control	—Unverified
Parareal with a Learned Coarse Model for Robotic Manipulation	Dec 12, 2019	MuJoCo	—Unverified
PGPS : Coupling Policy Gradient with Population-based Search	Jan 1, 2021	Deep Reinforcement LearningMuJoCo	—Unverified
Phasic Diversity Optimization for Population-Based Reinforcement Learning	Mar 17, 2024	DiversityMuJoCo	—Unverified
Policy-Driven World Model Adaptation for Robust Offline Model-based Reinforcement Learning	May 19, 2025	D4RLmodel	—Unverified
Policy Gradient with Kernel Quadrature	Oct 23, 2023	Causal DiscoveryMuJoCo	—Unverified
Policy Gradient With Serial Markov Chain Reasoning	Oct 13, 2022	Decision MakingMuJoCo	—Unverified
Policy Optimization by Genetic Distillation	Nov 3, 2017	Deep Reinforcement LearningImitation Learning	—Unverified
Certifiably Robust Reinforcement Learning through Model-Based Abstract Interpretation	Jan 26, 2023	Adversarial RobustnessMuJoCo	—Unverified
Policy Prediction Network: Model-Free Behavior Policy with Model-Based Learning in Continuous Action Space	Sep 15, 2019	continuous-controlContinuous Control	—Unverified
Policy Search by Target Distribution Learning for Continuous Control	May 27, 2019	continuous-controlContinuous Control	—Unverified
Policy Search using Dynamic Mirror Descent MPC for Model Free Off Policy RL	Oct 23, 2021	Model Predictive ControlMuJoCo	—Unverified
Policy Tree Network	Sep 25, 2019	Model-based Reinforcement LearningMuJoCo	—Unverified

Show:10 25 50

← PrevPage 8 of 14Next →

No leaderboard results yet.