MuJoCo

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 201–250 of 677 papers

Title	Date	Tasks	Status
Learning Loss Landscapes in Preference Optimization	Nov 10, 2024	MuJoCo	—Unverified
Scalable Kernel Inverse Optimization	Oct 31, 2024	MuJoCo	CodeCode Available
Solving Minimum-Cost Reach Avoid using Reinforcement Learning	Oct 29, 2024	MuJoCoreinforcement-learning	—Unverified
Efficient Diversity-based Experience Replay for Deep Reinforcement Learning	Oct 27, 2024	Atari GamesDecision Making	—Unverified
Bayes Adaptive Monte Carlo Tree Search for Offline Model-based Reinforcement Learning	Oct 15, 2024	D4RLModel-based Reinforcement Learning	CodeCode Available
Neuroplastic Expansion in Deep Reinforcement Learning	Oct 10, 2024	Deep Reinforcement LearningMuJoCo	—Unverified
Quality Diversity Imitation Learning	Oct 8, 2024	continuous-controlContinuous Control	—Unverified
Efficient Model-Based Reinforcement Learning Through Optimistic Thompson Sampling	Oct 7, 2024	continuous-controlContinuous Control	—Unverified
Model-Based Reward Shaping for Adversarial Inverse Reinforcement Learning in Stochastic Environments	Oct 4, 2024	MuJoCo	—Unverified
ComaDICE: Offline Cooperative Multi-Agent Reinforcement Learning with Stationary Distribution Shift Regularization	Oct 2, 2024	MuJoCoMulti-agent Reinforcement Learning	—Unverified
Learning to enhance multi-legged robot on rugged landscapes	Sep 14, 2024	MuJoCo	—Unverified
Latent Space Energy-based Neural ODEs	Sep 5, 2024	MuJoCo	—Unverified
Simultaneous Training of First- and Second-Order Optimizers in Population-Based Reinforcement Learning	Aug 27, 2024	MuJoCoReinforcement Learning (RL)	—Unverified
The Exploration-Exploitation Dilemma Revisited: An Entropy Perspective	Aug 19, 2024	MuJoCo	—Unverified
Markov Balance Satisfaction Improves Performance in Strictly Batch Offline Imitation Learning	Aug 17, 2024	Density EstimationImitation Learning	—Unverified
Cooperative Multi-Agent Deep Reinforcement Learning in Content Ranking Optimization	Aug 8, 2024	Deep Reinforcement LearningInformation Retrieval	—Unverified
SelfBC: Self Behavior Cloning for Offline Reinforcement Learning	Aug 4, 2024	AttributeD4RL	—Unverified
On the Perturbed States for Transformed Input-robust Reinforcement Learning	Jul 31, 2024	DenoisingMuJoCo	CodeCode Available
SOAP-RL: Sequential Option Advantage Propagation for Reinforcement Learning in POMDP Environments	Jul 26, 2024	MuJoCo	CodeCode Available
Maximum Entropy On-Policy Actor-Critic via Entropy Advantage Estimation	Jul 25, 2024	MuJoCo	—Unverified
Learning Constraint Network from Demonstrations via Positive-Unlabeled Learning with Memory Replay	Jul 23, 2024	MuJoCo	—Unverified
Temporal Abstraction in Reinforcement Learning with Offline Data	Jul 21, 2024	Hierarchical Reinforcement LearningMuJoCo	—Unverified
Proximal Policy Distillation	Jul 21, 2024	continuous-controlContinuous Control	CodeCode Available
Constrained Intrinsic Motivation for Reinforcement Learning	Jul 12, 2024	MuJoCoreinforcement-learning	CodeCode Available
A Review of Nine Physics Engines for Reinforcement Learning Research	Jul 11, 2024	Decision MakingMuJoCo	—Unverified
ROER: Regularized Optimal Experience Replay	Jul 4, 2024	continuous-controlContinuous Control	CodeCode Available
Memory Sequence Length of Data Sampling Impacts the Adaptation of Meta-Reinforcement Learning Agents	Jun 18, 2024	continuous-controlContinuous Control	—Unverified
Robust Model-Based Reinforcement Learning with an Adversarial Auxiliary Model	Jun 14, 2024	Board Gamesmodel	CodeCode Available
Residual Learning and Context Encoding for Adaptive Offline-to-Online Reinforcement Learning	Jun 12, 2024	D4RLMuJoCo	CodeCode Available
Learning Reward and Policy Jointly from Demonstration and Preference Improves Alignment	Jun 11, 2024	MuJoCoreinforcement-learning	—Unverified
DEER: A Delay-Resilient Framework for Reinforcement Learning with Variable Delays	Jun 5, 2024	MuJoCoReinforcement Learning (RL)	—Unverified
Value Improved Actor Critic Algorithms	Jun 3, 2024	MuJoCo	—Unverified
Trust the Model Where It Trusts Itself -- Model-Based Actor-Critic with Uncertainty-Aware Rollout Adaption	May 29, 2024	modelModel-based Reinforcement Learning	CodeCode Available
A Pontryagin Perspective on Reinforcement Learning	May 28, 2024	MuJoCoreinforcement-learning	—Unverified
Imitating from auxiliary imperfect demonstrations via Adversarial Density Weighted Regression	May 28, 2024	Imitation LearningMuJoCo	CodeCode Available
Symmetric Reinforcement Learning Loss for Robust Learning on Diverse Tasks and Model Scales	May 27, 2024	Atari GamesMuJoCo	CodeCode Available
Adaptive Q-Network: On-the-fly Target Selection for Deep Reinforcement Learning	May 25, 2024	Atari GamesAutoML	—Unverified
Variational Delayed Policy Optimization	May 23, 2024	MuJoCoReinforcement Learning (RL)	CodeCode Available
Learning rigid-body simulators over implicit shapes for large-scale scenes and vision	May 22, 2024	MuJoCo	—Unverified
Pure Planning to Pure Policies and In Between with a Recursive Tree Planner	May 21, 2024	MuJoCo	—Unverified
Is Mamba Compatible with Trajectory Optimization in Offline Reinforcement Learning?	May 20, 2024	Atari GamesMamba	CodeCode Available
Robust Deep Reinforcement Learning with Adaptive Adversarial Perturbations in Action Space	May 20, 2024	Deep Reinforcement LearningMuJoCo	CodeCode Available
Adaptive Exploration for Data-Efficient General Value Function Evaluations	May 13, 2024	MuJoCo	CodeCode Available
Off-OAB: Off-Policy Policy Gradient Method with Optimal Action-Dependent Baseline	May 4, 2024	Computational EfficiencyMuJoCo	—Unverified
Hard-Thresholding Meets Evolution Strategies in Reinforcement Learning	May 2, 2024	Decision MakingMuJoCo	CodeCode Available
Markov flow policy -- deep MC	May 1, 2024	MuJoCo	—Unverified
MESA: Cooperative Meta-Exploration in Multi-Agent Learning through Exploiting State-Action Space Structure	May 1, 2024	Efficient ExplorationMuJoCo	—Unverified
Closed Loop Interactive Embodied Reasoning for Robot Manipulation	Apr 23, 2024	MuJoCoRobot Manipulation	—Unverified
Asynchronous Federated Reinforcement Learning with Policy Gradient Updates: Algorithm Design and Convergence Analysis	Apr 9, 2024	MuJoCoReinforcement Learning (RL)	—Unverified
DIDA: Denoised Imitation Learning based on Domain Adaptation	Apr 4, 2024	Domain AdaptationImitation Learning	—Unverified

Show:10 25 50

← PrevPage 5 of 14Next →

No leaderboard results yet.