MuJoCo

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 251–300 of 677 papers

Title	Date	Tasks	Status
Active Learning of Dynamics Using Prior Domain Knowledge in the Sampling Process	Mar 25, 2024	Active LearningMuJoCo	—Unverified
Robust Model Based Reinforcement Learning Using L_1 Adaptive Control	Mar 21, 2024	Model-based Reinforcement LearningMuJoCo	—Unverified
Phasic Diversity Optimization for Population-Based Reinforcement Learning	Mar 17, 2024	DiversityMuJoCo	—Unverified
A Simple Mixture Policy Parameterization for Improving Sample Efficiency of CVaR Optimization	Mar 17, 2024	MuJoCo	—Unverified
Symmetric Q-learning: Reducing Skewness of Bellman Error in Online Reinforcement Learning	Mar 12, 2024	continuous-controlContinuous Control	—Unverified
DeepSafeMPC: Deep Learning-Based Model Predictive Control for Safe Multi-Agent Reinforcement Learning	Mar 11, 2024	Model Predictive ControlMuJoCo	—Unverified
Conservative DDPG -- Pessimistic RL without Ensemble	Mar 8, 2024	MuJoCo	—Unverified
Iterated Q-Network: Beyond One-Step Bellman Updates in Deep Reinforcement Learning	Mar 4, 2024	Atari Gamescontinuous-control	—Unverified
Continuous Mean-Zero Disagreement-Regularized Imitation Learning (CMZ-DRIL)	Mar 2, 2024	Imitation LearningMuJoCo	—Unverified
Snapshot Reinforcement Learning: Leveraging Prior Trajectories for Efficiency	Mar 1, 2024	Deep Reinforcement LearningMuJoCo	CodeCode Available
C-GAIL: Stabilizing Generative Adversarial Imitation Learning with Control Theory	Feb 26, 2024	Imitation LearningMuJoCo	—Unverified
Beyond Worst-case Attacks: Robust RL with Adaptive Defense via Non-dominated Policies	Feb 20, 2024	Adversarial AttackMuJoCo	CodeCode Available
Debiased Offline Representation Learning for Fast Online Adaptation in Non-stationary Dynamics	Feb 17, 2024	MuJoCoRepresentation Learning	CodeCode Available
Learn to Teach: Sample-Efficient Privileged Learning for Humanoid Locomotion over Diverse Terrains	Feb 9, 2024	Depth EstimationMuJoCo	—Unverified
ALOHA 2: An Enhanced Low-Cost Hardware for Bimanual Teleoperation	Feb 7, 2024	MuJoCo	—Unverified
Compressing Deep Reinforcement Learning Networks with a Dynamic Structured Pruning Method for Autonomous Driving	Feb 7, 2024	Autonomous DrivingDeep Reinforcement Learning	—Unverified
Accelerating Inverse Reinforcement Learning with Expert Bootstrapping	Feb 4, 2024	Imitation LearningMuJoCo	—Unverified
MinMaxMin Q-learning	Feb 3, 2024	MuJoCoQ-Learning	—Unverified
SQT -- std Q-target	Feb 3, 2024	MuJoCoQ-Learning	—Unverified
Expert Proximity as Surrogate Rewards for Single Demonstration Imitation Learning	Feb 1, 2024	Imitation LearningMuJoCo	CodeCode Available
A Reinforcement Learning Based Controller to Minimize Forces on the Crutches of a Lower-Limb Exoskeleton	Jan 31, 2024	Deep Reinforcement LearningMuJoCo	—Unverified
Extrinsicaly Rewarded Soft Q Imitation Learning with Discriminator	Jan 30, 2024	Imitation LearningMuJoCo	—Unverified
Episodic Reinforcement Learning with Expanded State-reward Space	Jan 19, 2024	Autonomous DrivingDeep Reinforcement Learning	—Unverified
AgentMixer: Multi-Agent Correlated Policy Factorization	Jan 16, 2024	Imitation LearningMuJoCo	—Unverified
Neural Population Learning beyond Symmetric Zero-sum Games	Jan 10, 2024	MuJoCoTransfer Learning	—Unverified
An Invariant Information Geometric Method for High-Dimensional Online Optimization	Jan 3, 2024	Bayesian OptimizationMuJoCo	CodeCode Available
Global Convergence of Natural Policy Gradient with Hessian-aided Momentum Variance Reduction	Jan 2, 2024	MuJoCoPolicy Gradient Methods	—Unverified
Adaptive trajectory-constrained exploration strategy for deep reinforcement learning	Dec 27, 2023	Deep Reinforcement LearningMuJoCo	CodeCode Available
DexDLO: Learning Goal-Conditioned Dexterous Policy for Dynamic Manipulation of Deformable Linear Objects	Dec 23, 2023	MuJoCoPosition	—Unverified
OVD-Explorer: Optimism Should Not Be the Sole Pursuit of Exploration in Noisy Environments	Dec 19, 2023	continuous-controlContinuous Control	—Unverified
GO-DICE: Goal-Conditioned Option-Aware Offline Imitation Learning via Stationary Distribution Correction Estimation	Dec 17, 2023	Imitation LearningMuJoCo	CodeCode Available
Small Dataset, Big Gains: Enhancing Reinforcement Learning by Offline Pre-Training with Model Based Augmentation	Dec 15, 2023	Data AugmentationMuJoCo	—Unverified
A Perspective of Q-value Estimation on Offline-to-Online Reinforcement Learning	Dec 12, 2023	MuJoCoOffline RL	—Unverified
A dynamical clipping approach with task feedback for Proximal Policy Optimization	Dec 12, 2023	Language ModellingLarge Language Model	CodeCode Available
Similarity-based Knowledge Transfer for Cross-Domain Reinforcement Learning	Dec 5, 2023	MuJoCoreinforcement-learning	—Unverified
Supported Trust Region Optimization for Offline Reinforcement Learning	Nov 15, 2023	MuJoCoreinforcement-learning	—Unverified
On-Policy Policy Gradient Reinforcement Learning Without On-Policy Sampling	Nov 14, 2023	MuJoCoreinforcement-learning	—Unverified
An Intelligent Social Learning-based Optimization Strategy for Black-box Robotic Control with Reinforcement Learning	Nov 11, 2023	continuous-controlContinuous Control	—Unverified
Robust Adversarial Reinforcement Learning via Bounded Rationality Curricula	Nov 3, 2023	MuJoCoreinforcement-learning	—Unverified
A Tractable Inference Perspective of Offline RL	Oct 31, 2023	MuJoCoOffline RL	—Unverified
Good Better Best: Self-Motivated Imitation Learning for noisy Demonstrations	Oct 24, 2023	Imitation LearningMuJoCo	—Unverified
Mind the Model, Not the Agent: The Primacy Bias in Model-based RL	Oct 23, 2023	continuous-controlContinuous Control	—Unverified
Policy Gradient with Kernel Quadrature	Oct 23, 2023	Causal DiscoveryMuJoCo	—Unverified
One is More: Diverse Perspectives within a Single Network for Efficient DRL	Oct 21, 2023	Deep Reinforcement LearningMuJoCo	—Unverified
Benchmarking the Sim-to-Real Gap in Cloth Manipulation	Oct 14, 2023	BenchmarkingMuJoCo	—Unverified
LightZero: A Unified Benchmark for Monte Carlo Tree Search in General Sequential Decision Scenarios	Oct 12, 2023	Board GamesDecision Making	—Unverified
Imitation Learning from Purified Demonstrations	Oct 11, 2023	Decision MakingImitation Learning	CodeCode Available
Improved Communication Efficiency in Federated Natural Policy Gradient via ADMM-based Gradient Updates	Oct 9, 2023	MuJoCo	—Unverified
FP3O: Enabling Proximal Policy Optimization in Multi-Agent Cooperation with Parameter-Sharing Versatility	Oct 8, 2023	MuJoCoMulti-agent Reinforcement Learning	—Unverified
On Representation Complexity of Model-based and Model-free Reinforcement Learning	Oct 3, 2023	modelMuJoCo	—Unverified

Show:10 25 50

← PrevPage 6 of 14Next →

No leaderboard results yet.