Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5101–5150 of 15113 papers

Title	Date	Tasks	Status	Hype
A Bayesian Approach to Learning Bandit Structure in Markov Decision Processes	Jul 30, 2022	Decision Makingreinforcement-learning	—Unverified	0
Unified Automatic Control of Vehicular Systems with Reinforcement Learning	Jul 30, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Solving the vehicle routing problem with deep reinforcement learning	Jul 30, 2022	Combinatorial OptimizationDeep Reinforcement Learning	—Unverified	0
Reinforcement learning with experience replay and adaptation of action dispersion	Jul 30, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Sampling Attacks on Meta Reinforcement Learning: A Minimax Formulation and Complexity Analysis	Jul 29, 2022	Meta-LearningMeta Reinforcement Learning	CodeCode Available	0
Sample-efficient Safe Learning for Online Nonlinear Control with Control Barrier Functions	Jul 29, 2022	Decision MakingReinforcement Learning (RL)	—Unverified	0
Meta Reinforcement Learning with Successor Feature Based Context	Jul 29, 2022	continuous-controlContinuous Control	—Unverified	0
Combining Evolutionary Search with Behaviour Cloning for Procedurally Generated Content	Jul 29, 2022	Reinforcement Learning (RL)valid	—Unverified	0
Cyclic Policy Distillation: Sample-Efficient Sim-to-Real Reinforcement Learning with Domain Randomization	Jul 29, 2022	Deep Reinforcement LearningMuJoCo	CodeCode Available	0
Deep Reinforcement Learning for System-on-Chip: Myths and Realities	Jul 29, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Contrastive UCB: Provably Efficient Contrastive Self-Supervised Learning in Online Reinforcement Learning	Jul 29, 2022	Contrastive LearningDeep Reinforcement Learning	CodeCode Available	1
Graph Inverse Reinforcement Learning from Diverse Videos	Jul 28, 2022	Diversityreinforcement-learning	—Unverified	0
Latent Properties of Lifelong Learning Systems	Jul 28, 2022	Lifelong learningreinforcement-learning	—Unverified	0
RangL: A Reinforcement Learning Competition Platform	Jul 28, 2022	OpenAI Gymreinforcement-learning	—Unverified	0
Playing a 2D Game Indefinitely using NEAT and Reinforcement Learning	Jul 28, 2022	Q-Learningreinforcement-learning	—Unverified	0
Raising Student Completion Rates with Adaptive Curriculum and Contextual Bandits	Jul 28, 2022	Model-based Reinforcement LearningMulti-Armed Bandits	—Unverified	0
POSET-RL: Phase ordering for Optimizing Size and Execution Time using Reinforcement Learning	Jul 27, 2022	CPUreinforcement-learning	—Unverified	0
Multi-Objective Provisioning of Network Slices using Deep Reinforcement Learning	Jul 27, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Structural Similarity for Improved Transfer in Reinforcement Learning	Jul 27, 2022	Q-Learningreinforcement-learning	—Unverified	0
Distributional Actor-Critic Ensemble for Uncertainty-Aware Continuous Control	Jul 27, 2022	continuous-controlContinuous Control	—Unverified	0
Dynamic Shielding for Reinforcement Learning in Black-Box Environments	Jul 27, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
A Contact-Safe Reinforcement Learning Framework for Contact-Rich Robot Manipulation	Jul 27, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Safe and Robust Experience Sharing for Deterministic Policy Gradient Algorithms	Jul 27, 2022	continuous-controlContinuous Control	CodeCode Available	0
Unsupervised Training for Neural TSP Solver	Jul 27, 2022	Graph Neural Networkreinforcement-learning	—Unverified	0
Branch Ranking for Efficient Mixed-Integer Programming via Offline Ranking-based Policy Learning	Jul 26, 2022	Decision MakingReinforcement Learning (RL)	—Unverified	0
Learning Bipedal Walking On Planned Footsteps For Humanoid Robots	Jul 26, 2022	Deep Reinforcement LearningMuJoCo	CodeCode Available	3
Offline Reinforcement Learning at Multiple Frequencies	Jul 26, 2022	Offline RLreinforcement-learning	—Unverified	0
Semi-analytical Industrial Cooling System Model for Reinforcement Learning	Jul 26, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Planning and Learning: Path-Planning for Autonomous Vehicles, a Review of the Literature	Jul 26, 2022	Autonomous Vehiclesreinforcement-learning	—Unverified	0
Dynamic Planning in Open-Ended Dialogue using Reinforcement Learning	Jul 25, 2022	Natural Language Understandingreinforcement-learning	—Unverified	0
Cooperative Actor-Critic via TD Error Aggregation	Jul 25, 2022	Multi-agent Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Flowsheet synthesis through hierarchical reinforcement learning and graph neural networks	Jul 25, 2022	Chemical ProcessDecision Making	—Unverified	0
Live in the Moment: Learning Dynamics Model Adapted to Evolving Policy	Jul 25, 2022	continuous-controlContinuous Control	CodeCode Available	0
Online Reinforcement Learning for Periodic MDP	Jul 25, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Adaptive Asynchronous Control Using Meta-learned Neural Ordinary Differential Equations	Jul 25, 2022	Decision MakingMeta-Learning	—Unverified	0
Post-processing Networks: Method for Optimizing Pipeline Task-oriented Dialogue Systems using Reinforcement Learning	Jul 25, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	0
REPNP: Plug-and-Play with Deep Reinforcement Learning Prior for Robust Image Restoration	Jul 25, 2022	DeblurringDeep Reinforcement Learning	—Unverified	0
Lifelong Machine Learning of Functionally Compositional Structures	Jul 25, 2022	BIG-bench Machine LearningContinual Learning	CodeCode Available	1
Learning Soccer Juggling Skills with Layer-wise Mixture-of-Experts	Jul 24, 2022	Deep Reinforcement LearningHumanoid Control	CodeCode Available	1
Adaptive Decision Making at the Intersection for Autonomous Vehicles Based on Skill Discovery	Jul 24, 2022	Autonomous DrivingAutonomous Vehicles	—Unverified	0
Anti-Overestimation Dialogue Policy Learning for Task-Completion Dialogue System	Jul 24, 2022	Reinforcement Learning (RL)	—Unverified	0
Driver Dojo: A Benchmark for Generalizable Reinforcement Learning for Autonomous Driving	Jul 23, 2022	Autonomous Drivingreinforcement-learning	CodeCode Available	1
Halftoning with Multi-Agent Deep Reinforcement Learning	Jul 23, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Epersist: A Self Balancing Robot Using PID Controller And Deep Reinforcement Learning	Jul 23, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Hierarchical Kickstarting for Skill Transfer in Reinforcement Learning	Jul 23, 2022	Inductive BiasNetHack	CodeCode Available	1
Learn Continuously, Act Discretely: Hybrid Action-Space Reinforcement Learning For Optimal Execution	Jul 22, 2022	Algorithmic Tradingcontinuous-control	—Unverified	0
Robust Knowledge Adaptation for Dynamic Graph Neural Networks	Jul 22, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1
Towards Robust On-Ramp Merging via Augmented Multimodal Reinforcement Learning	Jul 21, 2022	Autonomous Drivingreinforcement-learning	—Unverified	0
Solving the optimal stopping problem with reinforcement learning: an application in financial option exercise	Jul 21, 2022	ManagementReinforcement Learning (RL)	CodeCode Available	0
Strategising template-guided needle placement for MR-targeted prostate biopsy	Jul 21, 2022	AnatomyDecision Making	—Unverified	0

Show:10 25 50

← PrevPage 103 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified