Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3276–3300 of 15113 papers

Title	Date	Tasks	Status	Hype
ENOTO: Improving Offline-to-Online Reinforcement Learning with Q-Ensembles	Jun 12, 2023	Offline RLreinforcement-learning	—Unverified	0
Policy Regularization with Dataset Constraint for Offline Reinforcement Learning	Jun 11, 2023	Offline RLreinforcement-learning	CodeCode Available	1
Digital Twin-Enhanced Wireless Indoor Navigation: Achieving Efficient Environment Sensing with Zero-Shot Reinforcement Learning	Jun 11, 2023	Navigatereinforcement-learning	CodeCode Available	1
Reinforcement Learning in Robotic Motion Planning by Combined Experience-based Planning and Self-Imitation Learning	Jun 11, 2023	Imitation LearningMotion Planning	—Unverified	0
PEAR: Primitive enabled Adaptive Relabeling for boosting Hierarchical Reinforcement Learning	Jun 10, 2023	Decision MakingHierarchical Reinforcement Learning	—Unverified	0
Bring Your Own (Non-Robust) Algorithm to Solve Robust MDPs by Estimating The Worst Kernel	Jun 9, 2023	Decision Makingreinforcement-learning	—Unverified	0
The Role of Diverse Replay for Generalisation in Reinforcement Learning	Jun 9, 2023	Diversityreinforcement-learning	—Unverified	0
Confidence-Controlled Exploration: Efficient Sparse-Reward Policy Learning for Robot Navigation	Jun 9, 2023	Policy Gradient Methodsreinforcement-learning	—Unverified	0
On the Importance of Feature Decorrelation for Unsupervised Representation Learning in Reinforcement Learning	Jun 9, 2023	Reinforcement Learning (RL)Representation Learning	CodeCode Available	1
Iteratively Refined Behavior Regularization for Offline Reinforcement Learning	Jun 9, 2023	D4RLOffline RL	—Unverified	0
Learning Not to Spoof	Jun 9, 2023	Reinforcement Learning (RL)	—Unverified	0
Approximate information state based convergence analysis of recurrent Q-learning	Jun 9, 2023	Q-LearningReinforcement Learning (RL)	—Unverified	0
An End-to-End Reinforcement Learning Approach for Job-Shop Scheduling Problems Based on Constraint Programming	Jun 9, 2023	Combinatorial OptimizationFeature Engineering	CodeCode Available	1
Decoupled Prioritized Resampling for Offline RL	Jun 8, 2023	Offline RLReinforcement Learning (RL)	CodeCode Available	1
Instructed Diffuser with Temporal Condition Guidance for Offline Reinforcement Learning	Jun 8, 2023	Decision MakingOffline RL	—Unverified	0
Look Beneath the Surface: Exploiting Fundamental Symmetry for Sample-Efficient Offline RL	Jun 7, 2023	Data AugmentationOffline RL	CodeCode Available	1
Timing Process Interventions with Causal Inference and Reinforcement Learning	Jun 7, 2023	Causal Inferencereinforcement-learning	—Unverified	0
Stabilizing Contrastive RL: Techniques for Robotic Goal Reaching from Offline Data	Jun 6, 2023	Contrastive LearningData Augmentation	CodeCode Available	1
CAVEN: An Embodied Conversational Agent for Efficient Audio-Visual Navigation in Noisy Environments	Jun 6, 2023	Hierarchical Reinforcement LearningNavigate	—Unverified	0
Value Functions are Control Barrier Functions: Verification of Safe Policies using Control Theory	Jun 6, 2023	DiversityReinforcement Learning (RL)	CodeCode Available	1
Mildly Constrained Evaluation Policy for Offline Reinforcement Learning	Jun 6, 2023	D4RLMuJoCo	CodeCode Available	0
Model-Based Reinforcement Learning with Multi-Task Offline Pretraining	Jun 6, 2023	Knowledge DistillationModel-based Reinforcement Learning	CodeCode Available	0
Boosting Offline Reinforcement Learning with Action Preference Query	Jun 6, 2023	Autonomous DrivingD4RL	—Unverified	0
PEARL: Zero-shot Cross-task Preference Alignment and Robust Reward Learning for Robotic Manipulation	Jun 6, 2023	Offline RLReinforcement Learning (RL)	—Unverified	0
RLtools: A Fast, Portable Deep Reinforcement Learning Library for Continuous Control	Jun 6, 2023	continuous-controlContinuous Control	CodeCode Available	2

Show:10 25 50

← PrevPage 132 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified