MuJoCo

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 201–250 of 677 papers

Title	Date	Tasks	Status
Effects of sparse rewards of different magnitudes in the speed of learning of model-based actor critic methods	Jan 18, 2020	Deep Reinforcement LearningMuJoCo	—Unverified
Efficient Diversity-based Experience Replay for Deep Reinforcement Learning	Oct 27, 2024	Atari GamesDecision Making	—Unverified
Efficiently Training On-Policy Actor-Critic Networks in Robotic Deep Reinforcement Learning with Demonstration-like Sampled Exploration	Sep 27, 2021	Deep Reinforcement LearningMuJoCo	—Unverified
Efficient Model-Based Reinforcement Learning Through Optimistic Thompson Sampling	Oct 7, 2024	continuous-controlContinuous Control	—Unverified
Boosting Exploration in Actor-Critic Algorithms by Incentivizing Plausible Novel States	Oct 1, 2022	continuous-controlContinuous Control	—Unverified
ELSIM: End-to-end learning of reusable skills through intrinsic motivation	Jun 23, 2020	Developmental LearningMuJoCo	—Unverified
Beyond Conservatism: Diffusion Policies in Offline Multi-agent Reinforcement Learning	Jul 4, 2023	Data AugmentationDiversity	—Unverified
Disentangling Dynamics and Returns: Value Function Decomposition with Future Prediction	May 27, 2019	continuous-controlContinuous Control	—Unverified
Benchmarking the Sim-to-Real Gap in Cloth Manipulation	Oct 14, 2023	BenchmarkingMuJoCo	—Unverified
ALOHA 2: An Enhanced Low-Cost Hardware for Bimanual Teleoperation	Feb 7, 2024	MuJoCo	—Unverified
EnsembleDAgger: A Bayesian Approach to Safe Imitation Learning	Jul 22, 2018	Imitation LearningMuJoCo	—Unverified
Entropy Augmented Reinforcement Learning	Aug 19, 2022	Deep Reinforcement LearningMuJoCo	—Unverified
Adaptive Ensemble Q-learning: Minimizing Estimation Bias via Error Feedback	Jun 20, 2023	MuJoCoQ-Learning	—Unverified
Behavioral Entropy-Guided Dataset Generation for Offline Reinforcement Learning	Feb 6, 2025	Dataset GenerationMuJoCo	—Unverified
Bridging Physics-Informed Neural Networks with Reinforcement Learning: Hamilton-Jacobi-Bellman Proximal Policy Optimization (HJBPPO)	Feb 1, 2023	MuJoCoreinforcement-learning	—Unverified
Episodic Reinforcement Learning with Expanded State-reward Space	Jan 19, 2024	Autonomous DrivingDeep Reinforcement Learning	—Unverified
Estimating Disentangled Belief about Hidden State and Hidden Task for Meta-RL	May 14, 2021	Inductive BiasMeta Reinforcement Learning	—Unverified
Evaluating Robustness of Cooperative MARL	Sep 29, 2021	continuous-controlContinuous Control	—Unverified
DIDA: Denoised Imitation Learning based on Domain Adaptation	Apr 4, 2024	Domain AdaptationImitation Learning	—Unverified
Evolutionary Strategy Guided Reinforcement Learning via MultiBuffer Communication	Jun 20, 2023	Deep Reinforcement LearningEvolutionary Algorithms	—Unverified
DexDLO: Learning Goal-Conditioned Dexterous Policy for Dynamic Manipulation of Deformable Linear Objects	Dec 23, 2023	MuJoCoPosition	—Unverified
Evolving Rewards to Automate Reinforcement Learning	May 18, 2019	continuous-controlContinuous Control	—Unverified
Bayesian Reparameterization of Reward-Conditioned Reinforcement Learning with Energy-based Models	May 18, 2023	MuJoCoOffline RL	—Unverified
A Logarithmic Barrier Method For Proximal Policy Optimization	Dec 16, 2018	MuJoCoReinforcement Learning	—Unverified
Can Reinforcement Learning for Continuous Control Generalize Across Physics Engines?	Oct 27, 2020	continuous-controlContinuous Control	—Unverified
Hard Contacts with Soft Gradients: Refining Differentiable Simulators for Learning and Control	Jun 17, 2025	MuJoCo	—Unverified
Detecting and Mitigating Reward Hacking in Reinforcement Learning Systems: A Comprehensive Empirical Study	Jul 8, 2025	MuJoCoRecommendation Systems	—Unverified
A Tractable Inference Perspective of Offline RL	Oct 31, 2023	MuJoCoOffline RL	—Unverified
CasIL: Cognizing and Imitating Skills via a Dual Cognition-Action Architecture	Sep 28, 2023	Imitation LearningMuJoCo	—Unverified
Extrinsicaly Rewarded Soft Q Imitation Learning with Discriminator	Jan 30, 2024	Imitation LearningMuJoCo	—Unverified
Aligning Humans and Robots via Reinforcement Learning from Implicit Human Feedback	Jul 17, 2025	EEGMuJoCo	—Unverified
Delay-Adapted Policy Optimization and Improved Regret for Adversarial MDP with Delayed Bandit Feedback	May 13, 2023	MuJoCoReinforcement Learning (RL)	—Unverified
Fast Convergence of Softmax Policy Mirror Ascent	Nov 18, 2024	MuJoCo	—Unverified
FastTD3: Simple, Fast, and Capable Reinforcement Learning for Humanoid Control	May 28, 2025	GPUHumanoid Control	—Unverified
A Perspective of Q-value Estimation on Offline-to-Online Reinforcement Learning	Dec 12, 2023	MuJoCoOffline RL	—Unverified
Feasible Adversarial Robust Reinforcement Learning for Underspecified Environments	Jul 19, 2022	MuJoCoreinforcement-learning	—Unverified
C-GAIL: Stabilizing Generative Adversarial Imitation Learning with Control Theory	Feb 26, 2024	Imitation LearningMuJoCo	—Unverified
Fight fire with fire: countering bad shortcuts in imitation learning with good shortcuts	Sep 29, 2021	Autonomous Drivingcontinuous-control	—Unverified
Fighting Fire with Fire: Avoiding DNN Shortcuts through Priming	Jun 22, 2022	Autonomous DrivingClassification	—Unverified
Fine-Tuning Offline Reinforcement Learning with Model-Based Policy Optimization	Jan 1, 2021	D4RLMuJoCo	—Unverified
First Go, then Post-Explore: the Benefits of Post-Exploration in Intrinsic Motivation	Dec 6, 2022	continuous-controlContinuous Control	—Unverified
DEFENDER: DTW-Based Episode Filtering Using Demonstrations for Enhancing RL Safety	May 8, 2023	MuJoCo	—Unverified
Follow the Object: Curriculum Learning for Manipulation Tasks with Imagined Goals	Aug 5, 2020	Deep Reinforcement LearningMuJoCo	—Unverified
Bayesian Distributional Policy Gradients	Mar 20, 2021	Atari GamesContrastive Learning	—Unverified
Formal Language Constrained Markov Decision Processes	Jan 1, 2021	MuJoCo	—Unverified
CLARE: Conservative Model-Based Reward Learning for Offline Inverse Reinforcement Learning	Feb 9, 2023	continuous-controlContinuous Control	—Unverified
FP3O: Enabling Proximal Policy Optimization in Multi-Agent Cooperation with Parameter-Sharing Versatility	Oct 8, 2023	MuJoCoMulti-agent Reinforcement Learning	—Unverified
From proprioception to long-horizon planning in novel environments: A hierarchical RL model	Jun 11, 2020	Efficient ExplorationModel Predictive Control	—Unverified
Gaussian Process Policy Optimization	Mar 2, 2020	MuJoCoreinforcement-learning	—Unverified
Hamiltonian Policy Optimization	Feb 28, 2021	continuous-controlContinuous Control	—Unverified

Show:10 25 50

← PrevPage 5 of 14Next →

No leaderboard results yet.