MuJoCo

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 201–250 of 677 papers

Title	Date	Tasks	Status	Hype
Imitation Learning from Purified Demonstrations	Oct 11, 2023	Decision MakingImitation Learning	CodeCode Available	0
Improved Communication Efficiency in Federated Natural Policy Gradient via ADMM-based Gradient Updates	Oct 9, 2023	MuJoCo	—Unverified	0
FP3O: Enabling Proximal Policy Optimization in Multi-Agent Cooperation with Parameter-Sharing Versatility	Oct 8, 2023	MuJoCoMulti-agent Reinforcement Learning	—Unverified	0
On Representation Complexity of Model-based and Model-free Reinforcement Learning	Oct 3, 2023	modelMuJoCo	—Unverified	0
CasIL: Cognizing and Imitating Skills via a Dual Cognition-Action Architecture	Sep 28, 2023	Imitation LearningMuJoCo	—Unverified	0
Adapting Double Q-Learning for Continuous Reinforcement Learning	Sep 25, 2023	MuJoCoQ-Learning	—Unverified	0
Iterative Reachability Estimation for Safe Reinforcement Learning	Sep 24, 2023	MuJoCoreinforcement-learning	—Unverified	0
Practical Probabilistic Model-based Deep Reinforcement Learning by Integrating Dropout Uncertainty and Trajectory Sampling	Sep 20, 2023	Deep Reinforcement LearningModel-based Reinforcement Learning	CodeCode Available	1
Text2Reward: Reward Shaping with Language Models for Reinforcement Learning	Sep 20, 2023	MuJoCoreinforcement-learning	CodeCode Available	2
A Bayesian Approach to Robust Inverse Reinforcement Learning	Sep 15, 2023	Imitation LearningMuJoCo	CodeCode Available	1
Distributionally Robust Statistical Verification with Imprecise Neural Networks	Aug 28, 2023	Active LearningMuJoCo	—Unverified	0
Careful at Estimation and Bold at Exploration	Aug 22, 2023	MuJoCo	—Unverified	0
Heterogeneous Multi-Agent Reinforcement Learning via Mirror Descent Policy Optimization	Aug 13, 2023	LEMMAMuJoCo	CodeCode Available	0
BiERL: A Meta Evolutionary Reinforcement Learning Framework via Bilevel Optimization	Aug 1, 2023	Bilevel OptimizationDiversity	CodeCode Available	0
DMFC-GraspNet: Differentiable Multi-Fingered Robotic Grasp Generation in Cluttered Scenes	Aug 1, 2023	Computational EfficiencyGrasp Generation	—Unverified	0
Variance Control for Distributional Reinforcement Learning	Jul 30, 2023	Distributional Reinforcement LearningMuJoCo	CodeCode Available	0
Theoretically Guaranteed Policy Improvement Distilled from Model-Based Planning	Jul 24, 2023	continuous-controlContinuous Control	—Unverified	0
Offline Multi-Agent Reinforcement Learning with Implicit Global-to-Local Value Regularization	Jul 21, 2023	ManagementMuJoCo	CodeCode Available	1
Scalable Multi-agent Covering Option Discovery based on Kronecker Graphs	Jul 21, 2023	MuJoCoRepresentation Learning	—Unverified	0
Exploring reinforcement learning techniques for discrete and continuous control tasks in the MuJoCo environment	Jul 20, 2023	continuous-controlContinuous Control	CodeCode Available	0
Natural Actor-Critic for Robust Reinforcement Learning with Function Approximation	Jul 17, 2023	MuJoCoreinforcement-learning	CodeCode Available	1
Beyond Conservatism: Diffusion Policies in Offline Multi-agent Reinforcement Learning	Jul 4, 2023	Data AugmentationDiversity	—Unverified	0
Learning non-Markovian Decision-Making from State-only Sequences	Jun 27, 2023	Decision MakingImitation Learning	CodeCode Available	0
CEIL: Generalized Contextual Imitation Learning	Jun 26, 2023	D4RLImitation Learning	—Unverified	0
Comparing the Efficacy of Fine-Tuning and Meta-Learning for Few-Shot Policy Imitation	Jun 23, 2023	Few-Shot Image ClassificationFew-Shot Imitation Learning	CodeCode Available	0
Adaptive Ensemble Q-learning: Minimizing Estimation Bias via Error Feedback	Jun 20, 2023	MuJoCoQ-Learning	—Unverified	0
Evolutionary Strategy Guided Reinforcement Learning via MultiBuffer Communication	Jun 20, 2023	Deep Reinforcement LearningEvolutionary Algorithms	—Unverified	0
Surfer: Progressive Reasoning with World Models for Robotic Manipulation	Jun 20, 2023	Decision MakingMuJoCo	—Unverified	0
Maximum Entropy Heterogeneous-Agent Reinforcement Learning	Jun 19, 2023	MuJoCoMulti-agent Reinforcement Learning	CodeCode Available	2
AdaStop: adaptive statistical testing for sound comparisons of Deep RL agents	Jun 19, 2023	Deep Reinforcement LearningMuJoCo	CodeCode Available	0
Mimicking Better by Matching the Approximate Action Distribution	Jun 16, 2023	Imitation LearningMuJoCo	CodeCode Available	0
Recurrent Action Transformer with Memory	Jun 15, 2023	Atari GamesMuJoCo	CodeCode Available	0
Language to Rewards for Robotic Skill Synthesis	Jun 14, 2023	In-Context LearningLogical Reasoning	—Unverified	0
Robust Reinforcement Learning through Efficient Adversarial Herding	Jun 12, 2023	MuJoCoreinforcement-learning	—Unverified	0
Mildly Constrained Evaluation Policy for Offline Reinforcement Learning	Jun 6, 2023	D4RLMuJoCo	CodeCode Available	0
ReLU to the Rescue: Improve Your On-Policy Actor-Critic with Positive Advantages	Jun 2, 2023	Bayesian Inferencecontinuous-control	CodeCode Available	0
MetaDiffuser: Diffusion Model as Conditional Planner for Offline Meta-RL	May 31, 2023	MuJoCoReinforcement Learning (RL)	—Unverified	0
Maximize to Explore: One Objective Function Fusing Estimation, Planning, and Exploration	May 29, 2023	MuJoCo	CodeCode Available	1
A Model-Based Solution to the Offline Multi-Agent Reinforcement Learning Coordination Problem	May 26, 2023	MuJoCoMulti-agent Reinforcement Learning	—Unverified	0
Inverse Reinforcement Learning with the Average Reward Criterion	May 24, 2023	MuJoCoreinforcement-learning	—Unverified	0
OER: Offline Experience Replay for Continual Offline Reinforcement Learning	May 23, 2023	Continual LearningMuJoCo	—Unverified	0
Policy Representation via Diffusion Probability Model for Reinforcement Learning	May 22, 2023	continuous-controlContinuous Control	CodeCode Available	1
TOM: Learning Policy-Aware Models for Model-Based Reinforcement Learning via Transition Occupancy Matching	May 22, 2023	Model-based Reinforcement LearningMuJoCo	—Unverified	0
Unsupervised Discovery of Continuous Skills on a Sphere	May 21, 2023	MuJoCoUnsupervised Reinforcement Learning	—Unverified	0
Off-Policy Average Reward Actor-Critic with Deterministic Policy Search	May 20, 2023	MuJoCo	CodeCode Available	0
Bayesian Reparameterization of Reward-Conditioned Reinforcement Learning with Energy-based Models	May 18, 2023	MuJoCoOffline RL	—Unverified	0
Client Selection for Federated Policy Optimization with Environment Heterogeneity	May 18, 2023	MuJoCoPolicy Gradient Methods	CodeCode Available	0
Coagent Networks: Generalized and Scaled	May 16, 2023	MuJoCoReinforcement Learning (RL)	—Unverified	0
Delay-Adapted Policy Optimization and Improved Regret for Adversarial MDP with Delayed Bandit Feedback	May 13, 2023	MuJoCoReinforcement Learning (RL)	—Unverified	0
DEFENDER: DTW-Based Episode Filtering Using Demonstrations for Enhancing RL Safety	May 8, 2023	MuJoCo	—Unverified	0

Show:10 25 50

← PrevPage 5 of 14Next →

No leaderboard results yet.