Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10851–10900 of 15113 papers

Title	Date	Tasks	Status	Hype
Action Space Shaping in Deep Reinforcement Learning	Apr 2, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Information State Embedding in Partially Observable Cooperative Multi-Agent Reinforcement Learning	Apr 2, 2020	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	0
Exploration of Reinforcement Learning for Event Camera using Car-like Robots	Apr 2, 2020	Autonomous VehiclesCollision Avoidance	—Unverified	0
Value Driven Representation for Human-in-the-Loop Reinforcement Learning	Apr 2, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Safe Reinforcement Learning via Projection on a Safe Set: How to Achieve Optimality?	Apr 2, 2020	Policy Gradient MethodsQ-Learning	—Unverified	0
Constrained-Space Optimization and Reinforcement Learning for Complex Tasks	Apr 1, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Learning Sparse Rewarded Tasks from Sub-Optimal Demonstrations	Apr 1, 2020	continuous-controlContinuous Control	CodeCode Available	0
Counterfactual Multi-Agent Reinforcement Learning with Graph Convolution Communication	Apr 1, 2020	counterfactualMulti-agent Reinforcement Learning	—Unverified	0
Statistically Model Checking PCTL Specifications on Markov Decision Processes via Reinforcement Learning	Apr 1, 2020	NegationQ-Learning	—Unverified	0
Mimicking Evolution with Reinforcement Learning	Mar 31, 2020	Evolutionary Algorithmsreinforcement-learning	—Unverified	0
Augmented Q Imitation Learning (AQIL)	Mar 31, 2020	Deep Reinforcement LearningImitation Learning	CodeCode Available	0
Exploration in Action Space	Mar 31, 2020	continuous-controlContinuous Control	CodeCode Available	0
Learning to Ask Medical Questions using Reinforcement Learning	Mar 31, 2020	feature selectionreinforcement-learning	CodeCode Available	0
Controlling Rayleigh-Bénard convection via Reinforcement Learning	Mar 31, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Leverage the Average: an Analysis of KL Regularization in RL	Mar 31, 2020	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Robotic Table Tennis with Model-Free Reinforcement Learning	Mar 31, 2020	modelreinforcement-learning	—Unverified	0
Optimal Bidding Strategy without Exploration in Real-time Bidding	Mar 31, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Optimising Lockdown Policies for Epidemic Control using Reinforcement Learning	Mar 31, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	0
Straight to the Point: Fast-forwarding Videos via Reinforcement Learning Using Textual Data	Mar 31, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	0
Ultrasound-Guided Robotic Navigation with Deep Reinforcement Learning	Mar 30, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Model-Reference Reinforcement Learning Control of Autonomous Surface Vehicles with Uncertainties	Mar 30, 2020	Autonomous VehiclesDeep Reinforcement Learning	—Unverified	0
Agent57: Outperforming the Atari Human Benchmark	Mar 30, 2020	Atari GamesReinforcement Learning	CodeCode Available	1
Deep reinforcement learning for large-scale epidemic control	Mar 30, 2020	Computational EfficiencyDeep Reinforcement Learning	CodeCode Available	1
Multi-Task Reinforcement Learning with Soft Modularization	Mar 30, 2020	Meta-LearningMulti-Task Learning	CodeCode Available	1
Suphx: Mastering Mahjong with Deep Reinforcement Learning	Mar 30, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
When Autonomous Systems Meet Accuracy and Transferability through AI: A Survey	Mar 29, 2020	DeblurringDecision Making	—Unverified	0
Parallel Knowledge Transfer in Multi-Agent Reinforcement Learning	Mar 29, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Sample Efficient Ensemble Learning with Catalyst.RL	Mar 29, 2020	Ensemble Learningreinforcement-learning	CodeCode Available	1
Obstacle Avoidance and Navigation Utilizing Reinforcement Learning with Reward Shaping	Mar 28, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	0
Policy Teaching via Environment Poisoning: Training-time Adversarial Attacks against Reinforcement Learning	Mar 28, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	0
Learning medical triage from clinicians using Deep Q-Learning	Mar 28, 2020	Decision MakingDeep Reinforcement Learning	—Unverified	0
Adaptive Reward-Poisoning Attacks against Reinforcement Learning	Mar 27, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
AirRL: A Reinforcement Learning Approach to Urban Air Quality Inference	Mar 27, 2020	Air Quality Inferencereinforcement-learning	—Unverified	0
A Distributional Analysis of Sampling-Based Reinforcement Learning Algorithms	Mar 27, 2020	Q-Learningreinforcement-learning	—Unverified	0
Modeling 3D Shapes by Reinforcement Learning	Mar 27, 2020	Deep Reinforcement LearningImitation Learning	CodeCode Available	1
Machine Learning in Asset Management—Part 2: Portfolio Construction—Weight Optimization. The Journal of Financial Data Science	Mar 26, 2020	ArticlesAsset Management	CodeCode Available	2
Towards Better Opioid Antagonists Using Deep Reinforcement Learning	Mar 26, 2020	Deep Reinforcement LearningDrug Discovery	—Unverified	0
ACNMP: Skill Transfer and Task Extrapolation through Learning from Demonstration and Reinforcement Learning via Representation Sharing	Mar 25, 2020	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Fiber: A Platform for Efficient Development and Distributed Training for Reinforcement Learning and Population-Based Methods	Mar 25, 2020	Distributed ComputingReinforcement Learning	CodeCode Available	2
An empirical investigation of the challenges of real-world reinforcement learning	Mar 24, 2020	continuous-controlContinuous Control	CodeCode Available	1
Learning to Play Soccer by Reinforcement and Applying Sim-to-Real to Compete in the Real World	Mar 24, 2020	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Driver Modeling through Deep Reinforcement Learning and Behavioral Game Theory	Mar 24, 2020	Autonomous VehiclesDeep Reinforcement Learning	—Unverified	0
Black-box Off-policy Estimation for Infinite-Horizon Reinforcement Learning	Mar 24, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Multi-Agent Reinforcement Learning for Problems with Combined Individual and Team Reward	Mar 24, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Q-Learning in Regularized Mean-field Games	Mar 24, 2020	Q-Learningreinforcement-learning	—Unverified	0
Finite-Time Analysis of Stochastic Gradient Descent under Markov Randomness	Mar 24, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Distributional Reinforcement Learning with Ensembles	Mar 24, 2020	Distributional Reinforcement Learningreinforcement-learning	—Unverified	0
Learning Compact Reward for Image Captioning	Mar 24, 2020	DiversityImage Captioning	—Unverified	0
Importance of using appropriate baselines for evaluation of data-efficiency in deep reinforcement learning for Atari	Mar 23, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Evolutionary Population Curriculum for Scaling Multi-Agent Reinforcement Learning	Mar 23, 2020	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1

Show:10 25 50

← PrevPage 218 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified