MuJoCo

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 451–500 of 677 papers

Title	Date	Tasks	Status
Diverse Imitation Learning via Self-OrganizingGenerative Models	Sep 29, 2021	Imitation LearningMuJoCo	—Unverified
Evaluating Robustness of Cooperative MARL	Sep 29, 2021	continuous-controlContinuous Control	—Unverified
Fight fire with fire: countering bad shortcuts in imitation learning with good shortcuts	Sep 29, 2021	Autonomous Drivingcontinuous-control	—Unverified
Hypothesis Driven Coordinate Ascent for Reinforcement Learning	Sep 29, 2021	MuJoCoOpenAI Gym	—Unverified
Maximizing Ensemble Diversity in Deep Reinforcement Learning	Sep 29, 2021	Atari GamesDecision Making	—Unverified
OVD-Explorer: A General Information-theoretic Exploration Approach for Reinforcement Learning	Sep 29, 2021	MuJoCoreinforcement-learning	—Unverified
SPP-RL: State Planning Policy Reinforcement Learning	Sep 29, 2021	MuJoCoreinforcement-learning	—Unverified
Efficiently Training On-Policy Actor-Critic Networks in Robotic Deep Reinforcement Learning with Demonstration-like Sampled Exploration	Sep 27, 2021	Deep Reinforcement LearningMuJoCo	—Unverified
Improved Soft Actor-Critic: Mixing Prioritized Off-Policy Samples with On-Policy Experience	Sep 24, 2021	continuous-controlContinuous Control	—Unverified
Parameter-free Reduction of the Estimation Bias in Deep Reinforcement Learning for Deterministic Policy Gradients	Sep 24, 2021	continuous-controlContinuous Control	CodeCode Available
Membership Inference Attacks Against Temporally Correlated Data in Deep Reinforcement Learning	Sep 8, 2021	Adversarial Attackcontinuous-control	—Unverified
Hindsight Reward Tweaking via Conditional Deep Reinforcement Learning	Sep 6, 2021	Deep Reinforcement LearningMuJoCo	—Unverified
Improved Robustness and Safety for Pre-Adaptation of Meta Reinforcement Learning with Prior Regularization	Aug 19, 2021	Autonomous VehiclesDecision Making	—Unverified
A general class of surrogate functions for stable and efficient reinforcement learning	Aug 12, 2021	MuJoCoPolicy Gradient Methods	CodeCode Available
A Pragmatic Look at Deep Imitation Learning	Aug 4, 2021	Behavioural cloningD4RL	—Unverified
Understanding Adversarial Attacks on Observations in Deep Reinforcement Learning	Jun 30, 2021	Deep Reinforcement LearningMuJoCo	CodeCode Available
On the Benefits of Inducing Local Lipschitzness for Robust Generative Adversarial Imitation Learning	Jun 30, 2021	Imitation LearningMuJoCo	—Unverified
SparseDice: Imitation Learning for Temporally Sparse Data via Regularization	Jun 13, 2021	Imitation LearningMuJoCo	—Unverified
Keyframe-Focused Visual Imitation Learning	Jun 11, 2021	continuous-controlContinuous Control	—Unverified
Average-Reward Reinforcement Learning with Trust Region Methods	Jun 7, 2021	continuous-controlContinuous Control	—Unverified
SoftDICE for Imitation Learning: Rethinking Off-policy Distribution Matching	Jun 6, 2021	Imitation LearningMuJoCo	—Unverified
DisTop: Discovering a Topological representation to learn diverse and rewarding skills	Jun 6, 2021	Deep Reinforcement LearningHierarchical Reinforcement Learning	—Unverified
Regret Minimization Experience Replay in Off-Policy Reinforcement Learning	May 15, 2021	MuJoCoreinforcement-learning	CodeCode Available
Estimating Disentangled Belief about Hidden State and Hidden Task for Meta-RL	May 14, 2021	Inductive BiasMeta Reinforcement Learning	—Unverified
Context-Based Soft Actor Critic for Environments with Non-stationary Dynamics	May 7, 2021	continuous-controlContinuous Control	CodeCode Available
Autoregressive Dynamics Models for Offline Policy Evaluation and Optimization	Apr 28, 2021	continuous-controlContinuous Control	—Unverified
Reinforcement Learning using Guided Observability	Apr 22, 2021	Decision MakingMuJoCo	—Unverified
Probabilistic Mixture-of-Experts for Efficient Deep Reinforcement Learning	Apr 19, 2021	Deep Reinforcement LearningMixture-of-Experts	CodeCode Available
Reward function shape exploration in adversarial imitation learning: an empirical study	Apr 14, 2021	continuous-controlContinuous Control	—Unverified
Learning What To Do by Simulating the Past	Apr 8, 2021	MuJoCo	CodeCode Available
No Need for Interactions: Robust Model-Based Imitation Learning using Neural ODE	Apr 3, 2021	Imitation LearningMuJoCo	CodeCode Available
Hamiltonian Policy Optimization in Reinforcement Learning	Mar 23, 2021	continuous-controlContinuous Control	—Unverified
Improving Actor-Critic Reinforcement Learning via Hamiltonian Monte Carlo Method	Mar 22, 2021	continuous-controlContinuous Control	—Unverified
Bayesian Distributional Policy Gradients	Mar 20, 2021	Atari GamesContrastive Learning	—Unverified
A Quadratic Actor Network for Model-Free Reinforcement Learning	Mar 11, 2021	continuous-controlContinuous Control	CodeCode Available
Improving Context-Based Meta-Reinforcement Learning with Self-Supervised Trajectory Contrastive Learning	Mar 10, 2021	Contrastive LearningMeta Reinforcement Learning	—Unverified
Hamiltonian Policy Optimization	Feb 28, 2021	continuous-controlContinuous Control	—Unverified
Action Redundancy in Reinforcement Learning	Feb 22, 2021	MuJoCoreinforcement-learning	—Unverified
On Proximal Policy Optimization's Heavy-tailed Gradients	Feb 20, 2021	continuous-controlContinuous Control	—Unverified
Model-Invariant State Abstractions for Model-Based Reinforcement Learning	Feb 19, 2021	continuous-controlContinuous Control	—Unverified
CKNet: A Convolutional Neural Network Based on Koopman Operator for Modeling Latent Dynamics from Pixels	Feb 19, 2021	MuJoCo	—Unverified
Q-Value Weighted Regression: Reinforcement Learning with Limited Data	Feb 12, 2021	Atari Gamescontinuous-control	CodeCode Available
Robust Policy Gradient against Strong Data Corruption	Feb 11, 2021	continuous-controlContinuous Control	CodeCode Available
Variance Penalized On-Policy and Off-Policy Actor-Critic	Feb 3, 2021	MuJoCo	CodeCode Available
GST: Group-Sparse Training for Accelerating Deep Reinforcement Learning	Jan 24, 2021	Decision MakingDeep Reinforcement Learning	—Unverified
Hellinger Distance Constrained Regression	Jan 1, 2021	MuJoCoregression	—Unverified
Addressing Distribution Shift in Online Reinforcement Learning with Offline Datasets	Jan 1, 2021	D4RLMuJoCo	—Unverified
Self-Supervised Continuous Control without Policy Gradient	Jan 1, 2021	continuous-controlContinuous Control	—Unverified
MQES: Max-Q Entropy Search for Efficient Exploration in Continuous Reinforcement Learning	Jan 1, 2021	Efficient ExplorationMuJoCo	—Unverified
Formal Language Constrained Markov Decision Processes	Jan 1, 2021	MuJoCo	—Unverified

Show:10 25 50

← PrevPage 10 of 14Next →

No leaderboard results yet.