MuJoCo

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 451–500 of 677 papers

Title	Date	Tasks	Status
Skill Transfer in Deep Reinforcement Learning under Morphological Heterogeneity	Aug 14, 2019	DecoderDeep Reinforcement Learning	—Unverified
Small Dataset, Big Gains: Enhancing Reinforcement Learning by Offline Pre-Training with Model Based Augmentation	Dec 15, 2023	Data AugmentationMuJoCo	—Unverified
Smooth Imitation Learning via Smooth Costs and Smooth Policies	Nov 3, 2021	continuous-controlContinuous Control	—Unverified
SOAC: The Soft Option Actor-Critic Architecture	Jun 25, 2020	MuJoCoTransfer Learning	—Unverified
Soft Actor-Critic Algorithm with Truly-satisfied Inequality Constraint	Mar 8, 2023	MuJoCo	—Unverified
SoftDICE for Imitation Learning: Rethinking Off-policy Distribution Matching	Jun 6, 2021	Imitation LearningMuJoCo	—Unverified
Soft policy optimization using dual-track advantage estimator	Sep 15, 2020	MuJoCoReinforcement Learning (RL)	—Unverified
Solving Minimum-Cost Reach Avoid using Reinforcement Learning	Oct 29, 2024	MuJoCoreinforcement-learning	—Unverified
SparseDice: Imitation Learning for Temporally Sparse Data via Regularization	Jun 13, 2021	Imitation LearningMuJoCo	—Unverified
SPP-RL: State Planning Policy Reinforcement Learning	Sep 29, 2021	MuJoCoreinforcement-learning	—Unverified
Stabilizing Off-Policy Reinforcement Learning with Conservative Policy Gradients	Sep 25, 2019	Deep Reinforcement LearningMuJoCo	—Unverified
Multiagent Model-based Credit Assignment for Continuous Control	Dec 27, 2021	continuous-controlContinuous Control	—Unverified
Stochastic Variance Reduction for Policy Gradient Estimation	Oct 17, 2017	continuous-controlContinuous Control	—Unverified
Structural Estimation of Markov Decision Processes in High-Dimensional State Space with Finite-Time Guarantees	Oct 4, 2022	Imitation LearningMuJoCo	—Unverified
Supported Trust Region Optimization for Offline Reinforcement Learning	Nov 15, 2023	MuJoCoreinforcement-learning	—Unverified
Surrogate-Assisted Evolutionary Reinforcement Learning Based on Autoencoder and Hyperbolic Neural Network	May 26, 2025	Evolutionary AlgorithmsMuJoCo	—Unverified
Symmetric Q-learning: Reducing Skewness of Bellman Error in Online Reinforcement Learning	Mar 12, 2024	continuous-controlContinuous Control	—Unverified
Temporal Abstraction in Reinforcement Learning with Offline Data	Jul 21, 2024	Hierarchical Reinforcement LearningMuJoCo	—Unverified
Temporal-adaptive Hierarchical Reinforcement Learning	Feb 6, 2020	Atari GamesHierarchical Reinforcement Learning	—Unverified
MinMaxMin Q-learning	Feb 3, 2024	MuJoCoQ-Learning	—Unverified
SQT -- std Q-target	Feb 3, 2024	MuJoCoQ-Learning	—Unverified
Text-to-Decision Agent: Learning Generalist Policies from Natural Language Supervision	Apr 21, 2025	MuJoCoZero-shot Generalization	—Unverified
The Courage to Stop: Overcoming Sunk Cost Fallacy in Deep Reinforcement Learning	Jun 16, 2025	Deep Reinforcement LearningMuJoCo	—Unverified
The Exploration-Exploitation Dilemma Revisited: An Entropy Perspective	Aug 19, 2024	MuJoCo	—Unverified
The Intentional Unintentional Agent: Learning to Solve Many Continuous Control Tasks Simultaneously	Jul 11, 2017	continuous-controlContinuous Control	—Unverified
The Ladder in Chaos: A Simple and Effective Improvement to General DRL Algorithms by Policy Path Trimming and Boosting	Mar 2, 2023	MuJoCoReinforcement Learning (RL)	—Unverified
Theoretically Guaranteed Policy Improvement Distilled from Model-Based Planning	Jul 24, 2023	continuous-controlContinuous Control	—Unverified
Theoretically Principled Deep RL Acceleration via Nearest Neighbor Function Approximation	Oct 9, 2021	Deep Reinforcement LearningMuJoCo	—Unverified
Mind the Model, Not the Agent: The Primacy Bias in Model-based RL	Oct 23, 2023	continuous-controlContinuous Control	—Unverified
Time-Efficient Reward Learning via Visually Assisted Cluster Ranking	Nov 30, 2022	Dimensionality ReductionMuJoCo	—Unverified
TIMRL: A Novel Meta-Reinforcement Learning Framework for Non-Stationary and Multi-Task Environments	Jan 13, 2025	Decision MakingMeta Reinforcement Learning	—Unverified
TOM: Learning Policy-Aware Models for Model-Based Reinforcement Learning via Transition Occupancy Matching	May 22, 2023	Model-based Reinforcement LearningMuJoCo	—Unverified
STOPS: Short-Term-based Volatility-controlled Policy Search and its Global Convergence	Jan 24, 2022	MuJoCo	—Unverified
Toward Evaluating Robustness of Deep Reinforcement Learning with Continuous Control	May 1, 2020	continuous-controlContinuous Control	—Unverified
Towards Characterizing Divergence in Deep Q-Learning	Mar 21, 2019	continuous-controlContinuous Control	—Unverified
Towards Simplicity in Deep Reinforcement Learning: Streamlined Off-Policy Learning	Sep 25, 2019	continuous-controlContinuous Control	—Unverified
Transferable Reward Learning by Dynamics-Agnostic Discriminator Ensemble	Jun 1, 2022	Imitation LearningMuJoCo	—Unverified
Tsallis Reinforcement Learning: A Unified Framework for Maximum Entropy Reinforcement Learning	Jan 31, 2019	MuJoCoreinforcement-learning	—Unverified
Turning Sand to Gold: Recycling Data to Bridge On-Policy and Off-Policy Learning via Causal Bound	Jul 15, 2025	counterfactualDecision Making	—Unverified
Uncertainty-aware Low-Rank Q-Matrix Estimation for Deep Reinforcement Learning	Nov 19, 2021	continuous-controlContinuous Control	—Unverified
Understanding the Asymptotic Performance of Model-Based RL Methods	Sep 27, 2018	Model-based Reinforcement LearningMuJoCo	—Unverified
Unified Policy Optimization for Continuous-action Reinforcement Learning in Non-stationary Tasks and Games	Aug 19, 2022	MuJoCoReinforcement Learning (RL)	—Unverified
Universal Successor Features for Transfer Reinforcement Learning	Jan 5, 2020	MuJoCoreinforcement-learning	—Unverified
Unsupervised Discovery of Continuous Skills on a Sphere	May 21, 2023	MuJoCoUnsupervised Reinforcement Learning	—Unverified
User-Oriented Robust Reinforcement Learning	Feb 15, 2022	MuJoCoreinforcement-learning	—Unverified
Value Improved Actor Critic Algorithms	Jun 3, 2024	MuJoCo	—Unverified
Value Summation: A Novel Scoring Function for MPC-based Model-based Reinforcement Learning	Sep 16, 2022	Model-based Reinforcement LearningMuJoCo	—Unverified
Variance Reduction for Reinforcement Learning in Input-Driven Environments	Jul 6, 2018	Meta-LearningMuJoCo	—Unverified
Variational OOD State Correction for Offline Reinforcement Learning	May 1, 2025	Decision MakingMuJoCo	—Unverified
V-MAO: Generative Modeling for Multi-Arm Manipulation of Articulated Objects	Nov 7, 2021	MuJoCoObject	—Unverified

Show:10 25 50

← PrevPage 10 of 14Next →

No leaderboard results yet.