Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11376–11400 of 15113 papers

Title	Date	Tasks	Status
Learning State Abstractions for Transfer in Continuous Control	Feb 8, 2020	continuous-controlContinuous Control	CodeCode Available
A data-driven choice of misfit function for FWI using reinforcement learning	Feb 8, 2020	reinforcement-learningReinforcement Learning	—Unverified
Analyzing Policy Distillation on Multi-Task Learning and Meta-Reinforcement Learning in Meta-World	Feb 8, 2020	Meta-LearningMeta Reinforcement Learning	—Unverified
Description Based Text Classification with Reinforcement Learning	Feb 8, 2020	ClassificationGeneral Classification	—Unverified
Causally Correct Partial Models for Reinforcement Learning	Feb 7, 2020	reinforcement-learningReinforcement Learning	—Unverified
Explicit Mean-Square Error Bounds for Monte-Carlo and Linear Stochastic Approximation	Feb 7, 2020	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Accelerating Reinforcement Learning for Reaching using Continuous Curriculum Learning	Feb 7, 2020	Decision Makingreinforcement-learning	—Unverified
Automated Lane Change Strategy using Proximal Policy Optimization-based Deep Reinforcement Learning	Feb 7, 2020	Autonomous DrivingDeep Reinforcement Learning	—Unverified
Bayesian Residual Policy Optimization: Scalable Bayesian Reinforcement Learning with Clairvoyant Experts	Feb 7, 2020	Decision MakingPolicy Gradient Methods	—Unverified
Representation of Reinforcement Learning Policies in Reproducing Kernel Hilbert Spaces	Feb 7, 2020	reinforcement-learningReinforcement Learning	—Unverified
Manipulating Reinforcement Learning: Poisoning Attacks on Cost Signals	Feb 7, 2020	Q-Learningreinforcement-learning	—Unverified
Reward-Free Exploration for Reinforcement Learning	Feb 7, 2020	reinforcement-learningReinforcement Learning	—Unverified
Student/Teacher Advising through Reward Augmentation	Feb 7, 2020	General Reinforcement Learningreinforcement-learning	—Unverified
Reinforcement Learning in Factored MDPs: Oracle-Efficient Algorithms and Tighter Regret Bounds for the Non-Episodic Setting	Feb 6, 2020	reinforcement-learningReinforcement Learning	—Unverified
Temporal-adaptive Hierarchical Reinforcement Learning	Feb 6, 2020	Atari GamesHierarchical Reinforcement Learning	—Unverified
Social diversity and social preferences in mixed-motive reinforcement learning	Feb 6, 2020	Diversityreinforcement-learning	—Unverified
Mutual Information-based State-Control for Intrinsically Motivated Reinforcement Learning	Feb 5, 2020	reinforcement-learningReinforcement Learning	—Unverified
Deep Radial-Basis Value Functions for Continuous Control	Feb 5, 2020	continuous-controlContinuous Control	—Unverified
Learning Task-Driven Control Policies via Information Bottlenecks	Feb 4, 2020	reinforcement-learningReinforcement Learning	—Unverified
Finite Time Analysis of Linear Two-timescale Stochastic Approximation with Markovian Noise	Feb 4, 2020	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Bootstrapping a DQN Replay Memory with Synthetic Experiences	Feb 4, 2020	Deep Reinforcement LearningReinforcement Learning	—Unverified
Policy Gradient based Quantum Approximate Optimization Algorithm	Feb 4, 2020	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Finite-Sample Analysis of Stochastic Approximation Using Smooth Convex Envelopes	Feb 3, 2020	Q-LearningReinforcement Learning	—Unverified
Evolutionary algorithms for constructing an ensemble of decision trees	Feb 3, 2020	Evolutionary Algorithmsreinforcement-learning	—Unverified
Deep Reinforcement Learning for Autonomous Driving: A Survey	Feb 2, 2020	Autonomous DrivingDeep Reinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 456 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified