Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11151–11200 of 15113 papers

Title	Date	Tasks	Status
Safe Reinforcement Learning via Projection on a Safe Set: How to Achieve Optimality?	Apr 2, 2020	Policy Gradient MethodsQ-Learning	—Unverified
Statistically Model Checking PCTL Specifications on Markov Decision Processes via Reinforcement Learning	Apr 1, 2020	NegationQ-Learning	—Unverified
Counterfactual Multi-Agent Reinforcement Learning with Graph Convolution Communication	Apr 1, 2020	counterfactualMulti-agent Reinforcement Learning	—Unverified
Learning Sparse Rewarded Tasks from Sub-Optimal Demonstrations	Apr 1, 2020	continuous-controlContinuous Control	CodeCode Available
Constrained-Space Optimization and Reinforcement Learning for Complex Tasks	Apr 1, 2020	reinforcement-learningReinforcement Learning	—Unverified
Controlling Rayleigh-Bénard convection via Reinforcement Learning	Mar 31, 2020	reinforcement-learningReinforcement Learning	—Unverified
Learning to Ask Medical Questions using Reinforcement Learning	Mar 31, 2020	feature selectionreinforcement-learning	CodeCode Available
Leverage the Average: an Analysis of KL Regularization in RL	Mar 31, 2020	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Augmented Q Imitation Learning (AQIL)	Mar 31, 2020	Deep Reinforcement LearningImitation Learning	CodeCode Available
Exploration in Action Space	Mar 31, 2020	continuous-controlContinuous Control	CodeCode Available
Straight to the Point: Fast-forwarding Videos via Reinforcement Learning Using Textual Data	Mar 31, 2020	reinforcement-learningReinforcement Learning	CodeCode Available
Mimicking Evolution with Reinforcement Learning	Mar 31, 2020	Evolutionary Algorithmsreinforcement-learning	—Unverified
Robotic Table Tennis with Model-Free Reinforcement Learning	Mar 31, 2020	modelreinforcement-learning	—Unverified
Optimal Bidding Strategy without Exploration in Real-time Bidding	Mar 31, 2020	reinforcement-learningReinforcement Learning	—Unverified
Optimising Lockdown Policies for Epidemic Control using Reinforcement Learning	Mar 31, 2020	reinforcement-learningReinforcement Learning	CodeCode Available
Suphx: Mastering Mahjong with Deep Reinforcement Learning	Mar 30, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Model-Reference Reinforcement Learning Control of Autonomous Surface Vehicles with Uncertainties	Mar 30, 2020	Autonomous VehiclesDeep Reinforcement Learning	—Unverified
Parallel Knowledge Transfer in Multi-Agent Reinforcement Learning	Mar 29, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
When Autonomous Systems Meet Accuracy and Transferability through AI: A Survey	Mar 29, 2020	DeblurringDecision Making	—Unverified
Obstacle Avoidance and Navigation Utilizing Reinforcement Learning with Reward Shaping	Mar 28, 2020	reinforcement-learningReinforcement Learning	CodeCode Available
Policy Teaching via Environment Poisoning: Training-time Adversarial Attacks against Reinforcement Learning	Mar 28, 2020	reinforcement-learningReinforcement Learning	CodeCode Available
Learning medical triage from clinicians using Deep Q-Learning	Mar 28, 2020	Decision MakingDeep Reinforcement Learning	—Unverified
AirRL: A Reinforcement Learning Approach to Urban Air Quality Inference	Mar 27, 2020	Air Quality Inferencereinforcement-learning	—Unverified
Adaptive Reward-Poisoning Attacks against Reinforcement Learning	Mar 27, 2020	reinforcement-learningReinforcement Learning	—Unverified
A Distributional Analysis of Sampling-Based Reinforcement Learning Algorithms	Mar 27, 2020	Q-Learningreinforcement-learning	—Unverified
Towards Better Opioid Antagonists Using Deep Reinforcement Learning	Mar 26, 2020	Deep Reinforcement LearningDrug Discovery	—Unverified
ACNMP: Skill Transfer and Task Extrapolation through Learning from Demonstration and Reinforcement Learning via Representation Sharing	Mar 25, 2020	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Learning to Play Soccer by Reinforcement and Applying Sim-to-Real to Compete in the Real World	Mar 24, 2020	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Black-box Off-policy Estimation for Infinite-Horizon Reinforcement Learning	Mar 24, 2020	reinforcement-learningReinforcement Learning	—Unverified
Finite-Time Analysis of Stochastic Gradient Descent under Markov Randomness	Mar 24, 2020	reinforcement-learningReinforcement Learning	—Unverified
Distributional Reinforcement Learning with Ensembles	Mar 24, 2020	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Learning Compact Reward for Image Captioning	Mar 24, 2020	DiversityImage Captioning	—Unverified
Driver Modeling through Deep Reinforcement Learning and Behavioral Game Theory	Mar 24, 2020	Autonomous VehiclesDeep Reinforcement Learning	—Unverified
Q-Learning in Regularized Mean-field Games	Mar 24, 2020	Q-Learningreinforcement-learning	—Unverified
Multi-Agent Reinforcement Learning for Problems with Combined Individual and Team Reward	Mar 24, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Incorporating Relational Background Knowledge into Reinforcement Learning via Differentiable Inductive Logic Programming	Mar 23, 2020	Deep Reinforcement LearningInductive logic programming	—Unverified
Importance of using appropriate baselines for evaluation of data-efficiency in deep reinforcement learning for Atari	Mar 23, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Learning to Walk: Spike Based Reinforcement Learning for Hexapod Robot Central Pattern Generation	Mar 22, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Reinforcement Learning in Economics and Finance	Mar 22, 2020	reinforcement-learningReinforcement Learning	—Unverified
Autonomous UAV Navigation: A DDPG-based Deep Reinforcement Learning Approach	Mar 21, 2020	Deep Reinforcement LearningNavigate	—Unverified
Comprehensive Review of Deep Reinforcement Learning Methods and Applications in Economics	Mar 21, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Distributed Reinforcement Learning for Cooperative Multi-Robot Object Manipulation	Mar 21, 2020	ObjectQ-Learning	—Unverified
Deep Reinforcement Learning with Robust and Smooth Policy	Mar 21, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Deep Sets for Generalization in RL	Mar 20, 2020	NavigateObject	—Unverified
Deep Reinforcement Learning with Weighted Q-Learning	Mar 20, 2020	Deep Reinforcement LearningGaussian Processes	—Unverified
Deep Constrained Q-learning	Mar 20, 2020	Autonomous DrivingDecision Making	—Unverified
Safe Reinforcement Learning of Control-Affine Systems with Vertex Networks	Mar 20, 2020	reinforcement-learningReinforcement Learning	CodeCode Available
Towards Cognitive Routing based on Deep Reinforcement Learning	Mar 19, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Reinforcement learning enabled cooperative spectrum sensing in cognitive radio networks	Mar 19, 2020	reinforcement-learningReinforcement Learning	—Unverified
Exchangeable Input Representations for Reinforcement Learning	Mar 19, 2020	Deep Reinforcement LearningPolicy Gradient Methods	—Unverified

Show:10 25 50

← PrevPage 224 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified