MuJoCo

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 401–450 of 677 papers

Title	Date	Tasks	Status
Live in the Moment: Learning Dynamics Model Adapted to Evolving Policy	Jul 25, 2022	continuous-controlContinuous Control	CodeCode Available
Resolving Copycat Problems in Visual Imitation Learning via Residual Action Prediction	Jul 20, 2022	Imitation LearningMuJoCo	—Unverified
Feasible Adversarial Robust Reinforcement Learning for Underspecified Environments	Jul 19, 2022	MuJoCoreinforcement-learning	—Unverified
Prompting Decision Transformer for Few-Shot Policy Generalization	Jun 27, 2022	Few-Shot LearningInductive Bias	—Unverified
CGAR: Critic Guided Action Redistribution in Reinforcement Leaning	Jun 23, 2022	MuJoCoReinforcement Learning (RL)	CodeCode Available
Fighting Fire with Fire: Avoiding DNN Shortcuts through Priming	Jun 22, 2022	Autonomous DrivingClassification	—Unverified
Beyond Rewards: a Hierarchical Perspective on Offline Multiagent Behavioral Analysis	Jun 17, 2022	MuJoCoStarcraft	—Unverified
Mean-Semivariance Policy Optimization via Risk-Averse Reinforcement Learning	Jun 15, 2022	Autonomous Drivingcontinuous-control	—Unverified
Relative Policy-Transition Optimization for Fast Policy Transfer	Jun 13, 2022	continuous-controlContinuous Control	—Unverified
Dealing with Sparse Rewards in Continuous Control Robotics via Heavy-Tailed Policies	Jun 12, 2022	continuous-controlContinuous Control	—Unverified
Hybrid Value Estimation for Off-policy Evaluation and Offline Reinforcement Learning	Jun 4, 2022	MuJoCoOff-policy evaluation	—Unverified
Transferable Reward Learning by Dynamics-Agnostic Discriminator Ensemble	Jun 1, 2022	Imitation LearningMuJoCo	—Unverified
Multi-Object Grasping in the Plane	Jun 1, 2022	MuJoCoObject	—Unverified
TaSIL: Taylor Series Imitation Learning	May 30, 2022	continuous-controlContinuous Control	CodeCode Available
Efficient Reward Poisoning Attacks on Online Deep Reinforcement Learning	May 30, 2022	Data PoisoningDeep Reinforcement Learning	CodeCode Available
SEREN: Knowing When to Explore and When to Exploit	May 30, 2022	MuJoCoReinforcement Learning (RL)	—Unverified
Data Valuation for Offline Reinforcement Learning	May 19, 2022	Data ValuationDeep Reinforcement Learning	—Unverified
Imitation Learning from Observations under Transition Model Disparity	Apr 25, 2022	Imitation Learningmodel	CodeCode Available
A Computational Theory of Learning Flexible Reward-Seeking Behavior with Place Cells	Apr 22, 2022	MuJoCoOpen-Ended Question Answering	—Unverified
Continuously Discovering Novel Strategies via Reward-Switching Policy Optimization	Apr 4, 2022	continuous-controlContinuous Control	—Unverified
Hierarchical Reinforcement Learning of Locomotion Policies in Response to Approaching Objects: A Preliminary Study	Mar 20, 2022	Deep Reinforcement LearningHierarchical Reinforcement Learning	—Unverified
Safe adaptation in multiagent competition	Mar 14, 2022	MuJoCo	—Unverified
Context is Everything: Implicit Identification for Dynamics Adaptation	Mar 10, 2022	MuJoCo	—Unverified
AutoDIME: Automatic Design of Interesting Multi-Agent Environments	Mar 4, 2022	DiagnosticMuJoCo	—Unverified
A Recurrent Differentiable Engine for Modeling Tensegrity Robots Trainable with Low-Frequency Data	Feb 28, 2022	MuJoCo	—Unverified
User-Oriented Robust Reinforcement Learning	Feb 15, 2022	MuJoCoreinforcement-learning	—Unverified
DNS: Determinantal Point Process Based Neural Network Sampler for Ensemble Reinforcement Learning	Jan 31, 2022	continuous-controlContinuous Control	CodeCode Available
STOPS: Short-Term-based Volatility-controlled Policy Search and its Global Convergence	Jan 24, 2022	MuJoCo	—Unverified
Recursive Least Squares Advantage Actor-Critic Algorithms	Jan 15, 2022	Computational Efficiencycontinuous-control	—Unverified
Comparing Model-free and Model-based Algorithms for Offline Reinforcement Learning	Jan 14, 2022	modelMuJoCo	—Unverified
Self Reward Design with Fine-grained Interpretability	Dec 30, 2021	Deep Reinforcement LearningFairness	CodeCode Available
Multiagent Model-based Credit Assignment for Continuous Control	Dec 27, 2021	continuous-controlContinuous Control	—Unverified
CEM-GD: Cross-Entropy Method with Gradient Descent Planner for Model-Based Reinforcement Learning	Dec 14, 2021	continuous-controlContinuous Control	CodeCode Available
Continuous Control With Ensemble Deep Deterministic Policy Gradients	Nov 30, 2021	continuous-controlContinuous Control	CodeCode Available
Uncertainty-aware Low-Rank Q-Matrix Estimation for Deep Reinforcement Learning	Nov 19, 2021	continuous-controlContinuous Control	—Unverified
Aggressive Q-Learning with Ensembles: Achieving Both High Sample Efficiency and High Asymptotic Performance	Nov 17, 2021	continuous-controlContinuous Control	—Unverified
Improving Learning from Demonstrations by Learning from Experience	Nov 16, 2021	Imitation LearningMuJoCo	—Unverified
GRI: General Reinforced Imitation and its Application to Vision-Based Autonomous Driving	Nov 16, 2021	Autonomous DrivingCARLA MAP Leaderboard	—Unverified
V-MAO: Generative Modeling for Multi-Arm Manipulation of Articulated Objects	Nov 7, 2021	MuJoCoObject	—Unverified
Time Discretization-Invariant Safe Action Repetition for Policy Gradient Methods	Nov 6, 2021	MuJoCoPolicy Gradient Methods	CodeCode Available
Smooth Imitation Learning via Smooth Costs and Smooth Policies	Nov 3, 2021	continuous-controlContinuous Control	—Unverified
Policy Search using Dynamic Mirror Descent MPC for Model Free Off Policy RL	Oct 23, 2021	Model Predictive ControlMuJoCo	—Unverified
CIM-PPO:Proximal Policy Optimization with Liu-Correntropy Induced Metric	Oct 20, 2021	Deep Reinforcement LearningMuJoCo	—Unverified
Balancing Value Underestimation and Overestimation with Realistic Actor-Critic	Oct 19, 2021	continuous-controlContinuous Control	CodeCode Available
On-Policy Model Errors in Reinforcement Learning	Oct 15, 2021	modelMuJoCo	—Unverified
Wasserstein Unsupervised Reinforcement Learning	Oct 15, 2021	Hierarchical Reinforcement LearningMuJoCo	—Unverified
Theoretically Principled Deep RL Acceleration via Nearest Neighbor Function Approximation	Oct 9, 2021	Deep Reinforcement LearningMuJoCo	—Unverified
Generalized Maximum Entropy Reinforcement Learning via Reward Shaping	Sep 29, 2021	MuJoCoreinforcement-learning	—Unverified
Auto-Encoding Inverse Reinforcement Learning	Sep 29, 2021	Decision MakingImitation Learning	—Unverified
Distributional Decision Transformer for Hindsight Information Matching	Sep 29, 2021	continuous-controlContinuous Control	—Unverified

Show:10 25 50

← PrevPage 9 of 14Next →

No leaderboard results yet.