MuJoCo

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 501–550 of 677 papers

Title	Date	Tasks	Status
Wasserstein Actor-Critic: Directed Exploration via Optimism for Continuous-Actions Control	Mar 4, 2023	MuJoCoQ-Learning	—Unverified
Wasserstein Unsupervised Reinforcement Learning	Oct 15, 2021	Hierarchical Reinforcement LearningMuJoCo	—Unverified
Weighted Entropy Modification for Soft Actor-Critic	Nov 18, 2020	MuJoCoreinforcement-learning	—Unverified
What About Taking Policy as Input of Value Function: Policy-extended Value Function Approximator	Sep 28, 2020	continuous-controlContinuous Control	—Unverified
Provably Robust Blackbox Optimization for Reinforcement Learning	Mar 7, 2019	MuJoCoreinforcement-learning	—Unverified
Membership Inference Attacks Against Temporally Correlated Data in Deep Reinforcement Learning	Sep 8, 2021	Adversarial Attackcontinuous-control	—Unverified
Yes, Q-learning Helps Offline In-Context RL	Feb 24, 2025	In-Context Reinforcement LearningMuJoCo	—Unverified
LLM-Explorer: A Plug-in Reinforcement Learning Policy Exploration Enhancement Driven by Large Language Models	May 21, 2025	MuJoCoReinforcement Learning (RL)	—Unverified
Low-Rank Agent-Specific Adaptation (LoRASA) for Multi-Agent Policy Learning	Feb 8, 2025	MuJoCoMulti-agent Reinforcement Learning	—Unverified
Lyceum: An efficient and scalable ecosystem for robot learning	Jan 21, 2020	Model Predictive ControlMuJoCo	—Unverified
MANGA: Method Agnostic Neural-policy Generalization and Adaptation	Nov 19, 2019	Imitation LearningMuJoCo	—Unverified
Markov Balance Satisfaction Improves Performance in Strictly Batch Offline Imitation Learning	Aug 17, 2024	Density EstimationImitation Learning	—Unverified
Markov flow policy -- deep MC	May 1, 2024	MuJoCo	—Unverified
Masked Imitation Learning: Discovering Environment-Invariant Modalities in Multimodal Demonstrations	Sep 16, 2022	Decision MakingImitation Learning	—Unverified
Maximizing Ensemble Diversity in Deep Reinforcement Learning	Sep 29, 2021	Atari GamesDecision Making	—Unverified
Maximum Entropy On-Policy Actor-Critic via Entropy Advantage Estimation	Jul 25, 2024	MuJoCo	—Unverified
Maximum-Likelihood Inverse Reinforcement Learning with Finite-Time Guarantees	Oct 4, 2022	counterfactualImitation Learning	—Unverified
Mean-Semivariance Policy Optimization via Risk-Averse Reinforcement Learning	Jun 15, 2022	Autonomous Drivingcontinuous-control	—Unverified
Measure gradients, not activations! Enhancing neuronal activity in deep reinforcement learning	May 29, 2025	Deep Reinforcement LearningMuJoCo	—Unverified
Memory Sequence Length of Data Sampling Impacts the Adaptation of Meta-Reinforcement Learning Agents	Jun 18, 2024	continuous-controlContinuous Control	—Unverified
MESA: Cooperative Meta-Exploration in Multi-Agent Learning through Exploiting State-Action Space Structure	May 1, 2024	Efficient ExplorationMuJoCo	—Unverified
MetaDiffuser: Diffusion Model as Conditional Planner for Offline Meta-RL	May 31, 2023	MuJoCoReinforcement Learning (RL)	—Unverified
Meta-Reinforcement Learning Based on Self-Supervised Task Representation Learning	Apr 29, 2023	Meta Reinforcement LearningMuJoCo	—Unverified
Meta-Reinforcement Learning via Exploratory Task Clustering	Feb 15, 2023	ClusteringMeta Reinforcement Learning	—Unverified
Meta Reinforcement Learning with Distribution of Exploration Parameters Learned by Evolution Strategies	Dec 29, 2018	Meta-LearningMeta Reinforcement Learning	—Unverified
Live in the Moment: Learning Dynamics Model Adapted to Evolving Policy	Jul 25, 2022	continuous-controlContinuous Control	CodeCode Available
Leveraging exploration in off-policy algorithms via normalizing flows	May 16, 2019	continuous-controlContinuous Control	CodeCode Available
DNS: Determinantal Point Process Based Neural Network Sampler for Ensemble Reinforcement Learning	Jan 31, 2022	continuous-controlContinuous Control	CodeCode Available
LLMs for sensory-motor control: Combining in-context and iterative learning	Jun 5, 2025	MuJoCo	CodeCode Available
Online Reinforcement Learning in Non-Stationary Context-Driven Environments	Feb 4, 2023	MuJoCoreinforcement-learning	CodeCode Available
Locally Persistent Exploration in Continuous Control Tasks with Sparse Rewards	Dec 26, 2020	continuous-controlContinuous Control	CodeCode Available
Variance Control for Distributional Reinforcement Learning	Jul 30, 2023	Distributional Reinforcement LearningMuJoCo	CodeCode Available
Lyapunov-based Safe Policy Optimization for Continuous Control	Jan 28, 2019	continuous-controlContinuous Control	CodeCode Available
Beyond Worst-case Attacks: Robust RL with Adaptive Defense via Non-dominated Policies	Feb 20, 2024	Adversarial AttackMuJoCo	CodeCode Available
ReLU to the Rescue: Improve Your On-Policy Actor-Critic with Positive Advantages	Jun 2, 2023	Bayesian Inferencecontinuous-control	CodeCode Available
Directly Forecasting Belief for Reinforcement Learning with Delays	May 1, 2025	D4RLMuJoCo	CodeCode Available
Residual Learning and Context Encoding for Adaptive Offline-to-Online Reinforcement Learning	Jun 12, 2024	D4RLMuJoCo	CodeCode Available
Decision Transformer under Random Frame Dropping	Mar 3, 2023	Deep Reinforcement LearningMuJoCo	CodeCode Available
Learning What To Do by Simulating the Past	Apr 8, 2021	MuJoCo	CodeCode Available
Towards Model-based Reinforcement Learning for Industry-near Environments	Jul 27, 2019	Deep Reinforcement LearningModel-based Reinforcement Learning	CodeCode Available
Learning to Play Cup-and-Ball with Noisy Camera Observations	Jul 19, 2020	MuJoCo	CodeCode Available
Residual Policy Learning	Dec 15, 2018	Deep Reinforcement LearningMuJoCo	CodeCode Available
Learning Task Belief Similarity with Latent Dynamics for Meta-Reinforcement Learning	Jun 24, 2025	Meta Reinforcement LearningMuJoCo	CodeCode Available
Learning Powerful Policies by Using Consistent Dynamics Model	Jun 11, 2019	Atari Gamesmodel	CodeCode Available
Bayesian Policy Gradients via Alpha Divergence Dropout Inference	Dec 6, 2017	continuous-controlContinuous Control	CodeCode Available
Learning non-Markovian Decision-Making from State-only Sequences	Jun 27, 2023	Decision MakingImitation Learning	CodeCode Available
MDP Playground: An Analysis and Debug Testbed for Reinforcement Learning	Sep 17, 2019	MuJoCoOpenAI Gym	CodeCode Available
Debiased Offline Representation Learning for Fast Online Adaptation in Non-stationary Dynamics	Feb 17, 2024	MuJoCoRepresentation Learning	CodeCode Available
Asynchronous Methods for Model-Based Reinforcement Learning	Oct 28, 2019	modelModel-based Reinforcement Learning	CodeCode Available
Asynchronous Episodic Deep Deterministic Policy Gradient: Towards Continuous Control in Computationally Complex Environments	Mar 3, 2019	continuous-controlContinuous Control	CodeCode Available

Show:10 25 50

← PrevPage 11 of 14Next →

No leaderboard results yet.