Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11001–11050 of 15113 papers

Title	Date	Tasks	Status	Hype
AutoPhase: Juggling HLS Phase Orderings in Random Forests with Deep Reinforcement Learning	Mar 2, 2020	Deep Reinforcement LearningHigh-Level Synthesis	CodeCode Available	1
Learning Force Control for Contact-rich Manipulation Tasks with Rigid Position-controlled Robots	Mar 2, 2020	Contact-rich ManipulationPosition	—Unverified	0
Fully Asynchronous Policy Evaluation in Distributed Reinforcement Learning over Networks	Mar 1, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
A Hybrid Stochastic Policy Gradient Algorithm for Reinforcement Learning	Mar 1, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	0
Learning When and Where to Zoom with Deep Reinforcement Learning	Mar 1, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Learning Near Optimal Policies with Low Inherent Bellman Error	Feb 29, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Contextual Policy Transfer in Reinforcement Learning Domains via Deep Mixtures-of-Experts	Feb 29, 2020	Mixture-of-ExpertsOpenAI Gym	—Unverified	0
TAdam: A Robust Stochastic Gradient Optimizer	Feb 29, 2020	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	0
Mixed Reinforcement Learning with Additive Stochastic Uncertainty	Feb 28, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
A Self-Tuning Actor-Critic Algorithm	Feb 28, 2020	Atari Gamesreinforcement-learning	—Unverified	0
On Catastrophic Interference in Atari 2600 Games	Feb 28, 2020	Atari GamesDeep Reinforcement Learning	CodeCode Available	0
Deep Reinforcement Learning for FlipIt Security Game	Feb 28, 2020	Deep Reinforcement LearningQ-Learning	—Unverified	0
Reinforcement Learning through Active Inference	Feb 28, 2020	Decision Makingreinforcement-learning	—Unverified	0
Deep Reinforcement Learning Based Intelligent Reflecting Surface for Secure Wireless Communications	Feb 27, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Towards Modular Algorithm Induction	Feb 27, 2020	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Learning to Resolve Alliance Dilemmas in Many-Player Zero-Sum Games	Feb 27, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Learning in Markov Decision Processes under Constraints	Feb 27, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
A Visual Communication Map for Multi-Agent Deep Reinforcement Learning	Feb 27, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Autonomous robotic nanofabrication with reinforcement learning	Feb 27, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	0
Assembly robots with optimized control stiffness through reinforcement learning	Feb 27, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Acceleration of Actor-Critic Deep Reinforcement Learning for Visual Grasping in Clutter by State Representation Learning Based on Disentanglement of a Raw Input Image	Feb 27, 2020	Deep Reinforcement LearningDisentanglement	—Unverified	0
Analysis of diversity-accuracy tradeoff in image captioning	Feb 27, 2020	DiversityImage Captioning	CodeCode Available	1
Cautious Reinforcement Learning via Distributional Risk in the Dual Domain	Feb 27, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Review, Analysis and Design of a Comprehensive Deep Reinforcement Learning Framework	Feb 27, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Training Adversarial Agents to Exploit Weaknesses in Deep Control Policies	Feb 27, 2020	Autonomous DrivingAutonomous Vehicles	CodeCode Available	0
Sub-Goal Trees -- a Framework for Goal-Based Reinforcement Learning	Feb 27, 2020	Motion Planningreinforcement-learning	—Unverified	0
Reinforcement Learning of Risk-Constrained Policies in Markov Decision Processes	Feb 27, 2020	Decision Makingreinforcement-learning	CodeCode Available	0
Neural Ordinary Differential Equation Value Networks for Parametrized Action Spaces	Feb 26, 2020	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified	0
Optimistic Exploration even with a Pessimistic Initialisation	Feb 26, 2020	Efficient ExplorationQ-Learning	CodeCode Available	1
Using Reinforcement Learning in the Algorithmic Trading Problem	Feb 26, 2020	Algorithmic Tradingreinforcement-learning	CodeCode Available	1
Cautious Reinforcement Learning with Logical Constraints	Feb 26, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Efficient reinforcement learning control for continuum robots based on Inexplicit Prior Knowledge	Feb 26, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	0
Generalized Hindsight for Reinforcement Learning	Feb 26, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Mid-flight Propeller Failure Detection and Control of Propeller-deficient Quadcopter using Reinforcement Learning	Feb 26, 2020	Fault Detectionreinforcement-learning	CodeCode Available	0
When Do Drivers Concentrate? Attention-based Driver Behavior Modeling With Deep Reinforcement Learning	Feb 26, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Scalable Multi-Task Imitation Learning with Autonomous Improvement	Feb 25, 2020	Imitation Learningreinforcement-learning	—Unverified	0
Whole-Body Control of a Mobile Manipulator using End-to-End Reinforcement Learning	Feb 25, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1
Simultaneously Evolving Deep Reinforcement Learning Models using Multifactorial Optimization	Feb 25, 2020	Deep Reinforcement LearningQ-Learning	—Unverified	0
On Reinforcement Learning for Turn-based Zero-sum Markov Games	Feb 25, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Model-Based Reinforcement Learning for Physical Systems Without Velocity and Acceleration Measurements	Feb 25, 2020	GPRModel-based Reinforcement Learning	—Unverified	0
Rewriting History with Inverse RL: Hindsight Inference for Policy Improvement	Feb 25, 2020	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	1
Off-Policy Deep Reinforcement Learning with Analogous Disentangled Exploration	Feb 25, 2020	continuous-controlContinuous Control	CodeCode Available	0
Reward Shaping for Human Learning via Inverse Reinforcement Learning	Feb 25, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	0
G-Learner and GIRL: Goal Based Wealth Management with Reinforcement Learning	Feb 25, 2020	ManagementQ-Learning	—Unverified	0
Backpropamine: training self-modifying neural networks with differentiable neuromodulated plasticity	Feb 24, 2020	Language ModelingLanguage Modelling	—Unverified	0
Safe reinforcement learning for probabilistic reachability and safety specifications: A Lyapunov-based approach	Feb 24, 2020	Autonomous Drivingcontinuous-control	CodeCode Available	0
Millimeter Wave Communications with an Intelligent Reflector: Performance Optimization and Distributional Reinforcement Learning	Feb 24, 2020	Distributional Reinforcement LearningQ-Learning	—Unverified	0
Reconfigurable Intelligent Surface Assisted Multiuser MISO Systems Exploiting Deep Reinforcement Learning	Feb 24, 2020	Deep Reinforcement LearningNeural Network simulation	CodeCode Available	1
Scalable Multi-Agent Inverse Reinforcement Learning via Actor-Attention-Critic	Feb 24, 2020	Open-Ended Question Answeringreinforcement-learning	—Unverified	0
Wireless 2.0: Towards an Intelligent Radio Environment Empowered by Reconfigurable Meta-Surfaces and Artificial Intelligence	Feb 23, 2020	Managementreinforcement-learning	—Unverified	0

Show:10 25 50

← PrevPage 221 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified