MuJoCo

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 251–300 of 677 papers

Title	Date	Tasks	Status
DeepSafeMPC: Deep Learning-Based Model Predictive Control for Safe Multi-Agent Reinforcement Learning	Mar 11, 2024	Model Predictive ControlMuJoCo	—Unverified
A K-fold Method for Baseline Estimation in Policy Gradient Algorithms	Jan 3, 2017	MuJoCoPolicy Gradient Methods	—Unverified
Generalized Hidden Parameter MDPs Transferable Model-based RL in a Handful of Trials	Feb 8, 2020	MuJoCo	—Unverified
Generalized Maximum Entropy Reinforcement Learning via Reward Shaping	Sep 29, 2021	MuJoCoreinforcement-learning	—Unverified
Accelerating Inverse Reinforcement Learning with Expert Bootstrapping	Feb 4, 2024	Imitation LearningMuJoCo	—Unverified
Learning from Good Trajectories in Offline Multi-Agent Reinforcement Learning	Nov 28, 2022	continuous-controlContinuous Control	—Unverified
Learning Constraint Network from Demonstrations via Positive-Unlabeled Learning with Memory Replay	Jul 23, 2024	MuJoCo	—Unverified
Deep Reinforcement Learning for Dexterous Manipulation with Concept Networks	Sep 20, 2017	Deep Reinforcement LearningMuJoCo	—Unverified
Balancing Constraints and Rewards with Meta-Gradient D4PG	Oct 13, 2020	MuJoCoReinforcement Learning (RL)	—Unverified
Deep exploration by novelty-pursuit with maximum state entropy	Sep 25, 2019	Efficient ExplorationMuJoCo	—Unverified
Aggressive Q-Learning with Ensembles: Achieving Both High Sample Efficiency and High Asymptotic Performance	Nov 17, 2021	continuous-controlContinuous Control	—Unverified
Decorrelated Double Q-learning	Jun 12, 2020	continuous-controlContinuous Control	—Unverified
Adapting Double Q-Learning for Continuous Reinforcement Learning	Sep 25, 2023	MuJoCoQ-Learning	—Unverified
AgentMixer: Multi-Agent Correlated Policy Factorization	Jan 16, 2024	Imitation LearningMuJoCo	—Unverified
SrSv: Integrating Sequential Rollouts with Sequential Value Estimation for Multi-agent Reinforcement Learning	Mar 3, 2025	MuJoCoMulti-agent Reinforcement Learning	—Unverified
Learn a Prior for RHEA for Better Online Planning	Feb 14, 2019	Evolutionary AlgorithmsMuJoCo	—Unverified
Dealing with Sparse Rewards in Continuous Control Robotics via Heavy-Tailed Policies	Jun 12, 2022	continuous-controlContinuous Control	—Unverified
DDPG++: Striving for Simplicity in Continuous-control Off-Policy Reinforcement Learning	Jun 26, 2020	continuous-controlContinuous Control	—Unverified
Backward Imitation and Forward Reinforcement Learning via Bi-directional Model Rollouts	Aug 4, 2022	Generative Adversarial NetworkModel-based Reinforcement Learning	—Unverified
Data Valuation for Offline Reinforcement Learning	May 19, 2022	Data ValuationDeep Reinforcement Learning	—Unverified
A Generalized Training Approach for Multiagent Learning	Sep 27, 2019	MuJoCo	—Unverified
A Game-Theoretic Perspective of Generalization in Reinforcement Learning	Aug 7, 2022	Few-Shot LearningMeta-Learning	—Unverified
AVG-DICE: Stationary Distribution Correction by Regression	Mar 3, 2025	AvgMuJoCo	—Unverified
CrossNorm: On Normalization for Off-Policy Reinforcement Learning	Sep 25, 2019	MuJoCoreinforcement-learning	—Unverified
Average-Reward Reinforcement Learning with Trust Region Methods	Jun 7, 2021	continuous-controlContinuous Control	—Unverified
Accelerating Diffusion Models in Offline RL via Reward-Aware Consistency Trajectory Distillation	Jun 9, 2025	Decision MakingMuJoCo	—Unverified
Latent Space Energy-based Neural ODEs	Sep 5, 2024	MuJoCo	—Unverified
Learning Complicated Manipulation Skills via Deterministic Policy with Limited Demonstrations	Mar 29, 2023	Deep Reinforcement LearningMuJoCo	—Unverified
Learning Intrinsic Symbolic Rewards in Reinforcement Learning	Oct 8, 2020	Deep Reinforcement LearningMuJoCo	—Unverified
Cross-Domain Imitation Learning with a Dual Structure	Jun 2, 2020	Imitation LearningMuJoCo	—Unverified
Cooperative Multi-Agent Deep Reinforcement Learning in Content Ranking Optimization	Aug 8, 2024	Deep Reinforcement LearningInformation Retrieval	—Unverified
Autoregressive Dynamics Models for Offline Policy Evaluation and Optimization	Apr 28, 2021	continuous-controlContinuous Control	—Unverified
Cooperative Heterogeneous Deep Reinforcement Learning	Nov 2, 2020	continuous-controlContinuous Control	—Unverified
Auto-Encoding Inverse Reinforcement Learning	Sep 29, 2021	Decision MakingImitation Learning	—Unverified
Control Transformer: Robot Navigation in Unknown Environments through PRM-Guided Return-Conditioned Sequence Modeling	Nov 11, 2022	MuJoCoNavigate	—Unverified
AutoDIME: Automatic Design of Interesting Multi-Agent Environments	Mar 4, 2022	DiagnosticMuJoCo	—Unverified
Active Reinforcement Learning Strategies for Offline Policy Improvement	Dec 17, 2024	Active Learningcontinuous-control	—Unverified
A Unifying Framework for Causal Imitation Learning with Hidden Confounders	Feb 11, 2025	Imitation LearningMuJoCo	—Unverified
Actor-Director-Critic: A Novel Deep Reinforcement Learning Framework	Jan 10, 2023	Action ClassificationDecision Making	—Unverified
Keyframe-Focused Visual Imitation Learning	Jun 11, 2021	continuous-controlContinuous Control	—Unverified
Continuous Neural Algorithmic Planners	Nov 29, 2022	continuous-controlContinuous Control	—Unverified
Continuous Mean-Zero Disagreement-Regularized Imitation Learning (CMZ-DRIL)	Mar 2, 2024	Imitation LearningMuJoCo	—Unverified
A Unified Bellman Optimality Principle Combining Reward Maximization and Empowerment	Jul 26, 2019	MuJoCoReinforcement Learning	—Unverified
Improving Context-Based Meta-Reinforcement Learning with Self-Supervised Trajectory Contrastive Learning	Mar 10, 2021	Contrastive LearningMeta Reinforcement Learning	—Unverified
Improving Actor-Critic Reinforcement Learning via Hamiltonian Monte Carlo Method	Mar 22, 2021	continuous-controlContinuous Control	—Unverified
Continuously Discovering Novel Strategies via Reward-Switching Policy Optimization	Apr 4, 2022	continuous-controlContinuous Control	—Unverified
Improved Soft Actor-Critic: Mixing Prioritized Off-Policy Samples with On-Policy Experience	Sep 24, 2021	continuous-controlContinuous Control	—Unverified
Improved Communication Efficiency in Federated Natural Policy Gradient via ADMM-based Gradient Updates	Oct 9, 2023	MuJoCo	—Unverified
Attraction-Repulsion Actor-Critic for Continuous Control Reinforcement Learning	Sep 17, 2019	continuous-controlContinuous Control	—Unverified
Adversarial Imitation Learning via Random Search	Aug 21, 2020	Computational EfficiencyDeep Reinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 6 of 14Next →

No leaderboard results yet.