Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 13601–13650 of 15113 papers

Title	Date	Tasks	Status	Hype
A Dissection of Overfitting and Generalization in Continuous Reinforcement Learning	Jun 20, 2018	BIG-bench Machine LearningDeep Reinforcement Learning	—Unverified	0
Skilled Experience Catalogue: A Skill-Balancing Mechanism for Non-Player Characters using Reinforcement Learning	Jun 20, 2018	Decision Makingreinforcement-learning	—Unverified	0
Sim-to-Real Reinforcement Learning for Deformable Object Manipulation	Jun 20, 2018	Deep Reinforcement LearningDeformable Object Manipulation	CodeCode Available	0
Reinforcement Learning using Augmented Neural Networks	Jun 20, 2018	Q-Learningreinforcement-learning	—Unverified	0
RUDDER: Return Decomposition for Delayed Rewards	Jun 20, 2018	Atari Gamesreinforcement-learning	CodeCode Available	0
A Survey of Inverse Reinforcement Learning: Challenges, Methods and Progress	Jun 18, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
A unified strategy for implementing curiosity and empowerment driven reinforcement learning	Jun 18, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Learning from Outside the Viability Kernel: Why we Should Build Robots that can Fall with Grace	Jun 18, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Learning Policy Representations in Multiagent Systems	Jun 17, 2018	Clusteringcontinuous-control	—Unverified	0
Handling Cold-Start Collaborative Filtering with Reinforcement Learning	Jun 16, 2018	Collaborative FilteringRecommendation Systems	—Unverified	0
BaRC: Backward Reachability Curriculum for Robotic Reinforcement Learning	Jun 16, 2018	continuous-controlContinuous Control	CodeCode Available	0
Scheduled Policy Optimization for Natural Language Communication with Intelligent Agents	Jun 16, 2018	Efficient Explorationreinforcement-learning	CodeCode Available	0
Multi-Level Policy and Reward Reinforcement Learning for Image Captioning	Jun 15, 2018	Image CaptioningNatural Language Understanding	—Unverified	0
Surprising Negative Results for Generative Adversarial Tree Search	Jun 15, 2018	Atari GamesDeep Reinforcement Learning	CodeCode Available	0
Improving width-based planning with compact policies	Jun 15, 2018	Atari GamesDeep Reinforcement Learning	—Unverified	0
An Online Prediction Algorithm for Reinforcement Learning with Linear Function Approximation using Cross Entropy Method	Jun 15, 2018	Computational EfficiencyReinforcement Learning	—Unverified	0
Automated Image Data Preprocessing with Deep Reinforcement Learning	Jun 15, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Implicit Quantile Networks for Distributional Reinforcement Learning	Jun 14, 2018	Atari GamesDistributional Reinforcement Learning	CodeCode Available	0
Qualitative Measurements of Policy Discrepancy for Return-Based Deep Q-Network	Jun 14, 2018	OpenAI Gymreinforcement-learning	—Unverified	0
Maximum a Posteriori Policy Optimisation	Jun 14, 2018	continuous-controlContinuous Control	CodeCode Available	1
Adaptive Shooting for Bots in First Person Shooter Games Using Reinforcement Learning	Jun 14, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Deep Reinforcement Learning for Dynamic Urban Transportation Problems	Jun 14, 2018	Deep LearningDeep Reinforcement Learning	—Unverified	0
Reinforcement Learning with Function-Valued Action Spaces for Partial Differential Equation Control	Jun 13, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Marginal Policy Gradients: A Unified Family of Estimators for Bounded Action Spaces with Applications	Jun 13, 2018	continuous-controlContinuous Control	CodeCode Available	0
Structured Variational Learning of Bayesian Neural Networks with Horseshoe Priors	Jun 13, 2018	Model SelectionOpen-Ended Question Answering	CodeCode Available	0
Learning to Shoot in First Person Shooter Games by Stabilizing Actions and Clustering Rewards for Reinforcement Learning	Jun 13, 2018	Board GamesClustering	—Unverified	0
Meta-Learning Transferable Active Learning Policies by Deep Reinforcement Learning	Jun 12, 2018	Active LearningDeep Reinforcement Learning	—Unverified	0
Unsupervised Meta-Learning for Reinforcement Learning	Jun 12, 2018	Meta-LearningMeta Reinforcement Learning	—Unverified	0
Multi-Agent Deep Reinforcement Learning with Human Strategies	Jun 12, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
The Potential of the Return Distribution for Exploration in RL	Jun 11, 2018	reinforcement-learningReinforcement Learning	CodeCode Available	0
An Efficient, Generalized Bellman Update For Cooperative Inverse Reinforcement Learning	Jun 11, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Implicit Policy for Reinforcement Learning	Jun 10, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Deep Curiosity Loops in Social Environments	Jun 10, 2018	Hand DetectionOptical Flow Estimation	—Unverified	0
Deep Reinforcement Learning for Chinese Zero pronoun Resolution	Jun 10, 2018	Chinese Zero Pronoun ResolutionDecision Making	CodeCode Available	0
Continuous-time Value Function Approximation in Reproducing Kernel Hilbert Spaces	Jun 8, 2018	Atari GamesGaussian Processes	—Unverified	0
Program Synthesis Through Reinforcement Learning Guided Tree Search	Jun 8, 2018	Program Synthesisreinforcement-learning	—Unverified	0
Temporal Difference Variational Auto-Encoder	Jun 8, 2018	reinforcement-learningReinforcement Learning	CodeCode Available	0
Randomized Prior Functions for Deep Reinforcement Learning	Jun 8, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Automatic View Planning with Multi-scale Deep Reinforcement Learning Agents	Jun 8, 2018	AnatomyDeep Reinforcement Learning	—Unverified	0
Self-Consistent Trajectory Autoencoder: Hierarchical Reinforcement Learning with Trajectory Embeddings	Jun 7, 2018	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified	0
Deep Variational Reinforcement Learning for POMDPs	Jun 6, 2018	Decision MakingInductive Bias	CodeCode Available	0
Deep Reinforcement Learning for General Video Game AI	Jun 6, 2018	Atari GamesBenchmarking	CodeCode Available	0
Discovering and Removing Exogenous State Variables and Rewards for Reinforcement Learning	Jun 5, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Relational Deep Reinforcement Learning	Jun 5, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Mix&Match - Agent Curricula for Reinforcement Learning	Jun 5, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Playing Atari with Six Neurons	Jun 4, 2018	Atari GamesDecision Making	CodeCode Available	0
Mitigation of Policy Manipulation Attacks on Deep Q-Networks with Parameter-Space Noise	Jun 4, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
TD or not TD: Analyzing the Role of Temporal Differencing in Deep Reinforcement Learning	Jun 4, 2018	Deep Reinforcement LearningReinforcement Learning	CodeCode Available	0
Sequential Test for the Lowest Mean: From Thompson to Murphy Sampling	Jun 4, 2018	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Adversarial Reinforcement Learning Framework for Benchmarking Collision Avoidance Mechanisms in Autonomous Vehicles	Jun 4, 2018	Autonomous NavigationAutonomous Vehicles	—Unverified	0

Show:10 25 50

← PrevPage 273 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified