Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 13701–13750 of 15113 papers

Title	Date	Tasks	Status
A unified strategy for implementing curiosity and empowerment driven reinforcement learning	Jun 18, 2018	reinforcement-learningReinforcement Learning	—Unverified
Learning from Outside the Viability Kernel: Why we Should Build Robots that can Fall with Grace	Jun 18, 2018	reinforcement-learningReinforcement Learning	—Unverified
A Survey of Inverse Reinforcement Learning: Challenges, Methods and Progress	Jun 18, 2018	reinforcement-learningReinforcement Learning	—Unverified
Learning Policy Representations in Multiagent Systems	Jun 17, 2018	Clusteringcontinuous-control	—Unverified
Handling Cold-Start Collaborative Filtering with Reinforcement Learning	Jun 16, 2018	Collaborative FilteringRecommendation Systems	—Unverified
BaRC: Backward Reachability Curriculum for Robotic Reinforcement Learning	Jun 16, 2018	continuous-controlContinuous Control	CodeCode Available
Scheduled Policy Optimization for Natural Language Communication with Intelligent Agents	Jun 16, 2018	Efficient Explorationreinforcement-learning	CodeCode Available
Surprising Negative Results for Generative Adversarial Tree Search	Jun 15, 2018	Atari GamesDeep Reinforcement Learning	CodeCode Available
Multi-Level Policy and Reward Reinforcement Learning for Image Captioning	Jun 15, 2018	Image CaptioningNatural Language Understanding	—Unverified
Improving width-based planning with compact policies	Jun 15, 2018	Atari GamesDeep Reinforcement Learning	—Unverified
An Online Prediction Algorithm for Reinforcement Learning with Linear Function Approximation using Cross Entropy Method	Jun 15, 2018	Computational EfficiencyReinforcement Learning	—Unverified
Automated Image Data Preprocessing with Deep Reinforcement Learning	Jun 15, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Implicit Quantile Networks for Distributional Reinforcement Learning	Jun 14, 2018	Atari GamesDistributional Reinforcement Learning	CodeCode Available
Deep Reinforcement Learning for Dynamic Urban Transportation Problems	Jun 14, 2018	Deep LearningDeep Reinforcement Learning	—Unverified
Adaptive Shooting for Bots in First Person Shooter Games Using Reinforcement Learning	Jun 14, 2018	reinforcement-learningReinforcement Learning	—Unverified
Qualitative Measurements of Policy Discrepancy for Return-Based Deep Q-Network	Jun 14, 2018	OpenAI Gymreinforcement-learning	—Unverified
Structured Variational Learning of Bayesian Neural Networks with Horseshoe Priors	Jun 13, 2018	Model SelectionOpen-Ended Question Answering	CodeCode Available
Marginal Policy Gradients: A Unified Family of Estimators for Bounded Action Spaces with Applications	Jun 13, 2018	continuous-controlContinuous Control	CodeCode Available
Reinforcement Learning with Function-Valued Action Spaces for Partial Differential Equation Control	Jun 13, 2018	reinforcement-learningReinforcement Learning	—Unverified
Learning to Shoot in First Person Shooter Games by Stabilizing Actions and Clustering Rewards for Reinforcement Learning	Jun 13, 2018	Board GamesClustering	—Unverified
Meta-Learning Transferable Active Learning Policies by Deep Reinforcement Learning	Jun 12, 2018	Active LearningDeep Reinforcement Learning	—Unverified
Multi-Agent Deep Reinforcement Learning with Human Strategies	Jun 12, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
Unsupervised Meta-Learning for Reinforcement Learning	Jun 12, 2018	Meta-LearningMeta Reinforcement Learning	—Unverified
The Potential of the Return Distribution for Exploration in RL	Jun 11, 2018	reinforcement-learningReinforcement Learning	CodeCode Available
An Efficient, Generalized Bellman Update For Cooperative Inverse Reinforcement Learning	Jun 11, 2018	reinforcement-learningReinforcement Learning	—Unverified
Deep Reinforcement Learning for Chinese Zero pronoun Resolution	Jun 10, 2018	Chinese Zero Pronoun ResolutionDecision Making	CodeCode Available
Deep Curiosity Loops in Social Environments	Jun 10, 2018	Hand DetectionOptical Flow Estimation	—Unverified
Implicit Policy for Reinforcement Learning	Jun 10, 2018	reinforcement-learningReinforcement Learning	—Unverified
Continuous-time Value Function Approximation in Reproducing Kernel Hilbert Spaces	Jun 8, 2018	Atari GamesGaussian Processes	—Unverified
Automatic View Planning with Multi-scale Deep Reinforcement Learning Agents	Jun 8, 2018	AnatomyDeep Reinforcement Learning	—Unverified
Temporal Difference Variational Auto-Encoder	Jun 8, 2018	reinforcement-learningReinforcement Learning	CodeCode Available
Program Synthesis Through Reinforcement Learning Guided Tree Search	Jun 8, 2018	Program Synthesisreinforcement-learning	—Unverified
Randomized Prior Functions for Deep Reinforcement Learning	Jun 8, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Self-Consistent Trajectory Autoencoder: Hierarchical Reinforcement Learning with Trajectory Embeddings	Jun 7, 2018	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified
Deep Variational Reinforcement Learning for POMDPs	Jun 6, 2018	Decision MakingInductive Bias	CodeCode Available
Deep Reinforcement Learning for General Video Game AI	Jun 6, 2018	Atari GamesBenchmarking	CodeCode Available
Discovering and Removing Exogenous State Variables and Rewards for Reinforcement Learning	Jun 5, 2018	reinforcement-learningReinforcement Learning	—Unverified
Relational Deep Reinforcement Learning	Jun 5, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Mix&Match - Agent Curricula for Reinforcement Learning	Jun 5, 2018	reinforcement-learningReinforcement Learning	—Unverified
Sequential Test for the Lowest Mean: From Thompson to Murphy Sampling	Jun 4, 2018	Reinforcement LearningReinforcement Learning (RL)	—Unverified
TD or not TD: Analyzing the Role of Temporal Differencing in Deep Reinforcement Learning	Jun 4, 2018	Deep Reinforcement LearningReinforcement Learning	CodeCode Available
Mitigation of Policy Manipulation Attacks on Deep Q-Networks with Parameter-Space Noise	Jun 4, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
Playing Atari with Six Neurons	Jun 4, 2018	Atari GamesDecision Making	CodeCode Available
BindsNET: A machine learning-oriented spiking neural networks library in Python	Jun 4, 2018	BIG-bench Machine LearningCPU	CodeCode Available
Challenges in High-dimensional Reinforcement Learning with Evolution Strategies	Jun 4, 2018	reinforcement-learningReinforcement Learning	CodeCode Available
Adversarial Reinforcement Learning Framework for Benchmarking Collision Avoidance Mechanisms in Autonomous Vehicles	Jun 4, 2018	Autonomous NavigationAutonomous Vehicles	—Unverified
Exploration in Structured Reinforcement Learning	Jun 3, 2018	reinforcement-learningReinforcement Learning	—Unverified
Multi-Agent Reinforcement Learning via Double Averaging Primal-Dual Optimization	Jun 3, 2018	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Internal Model from Observations for Reward Shaping	Jun 2, 2018	modelreinforcement-learning	—Unverified
DAQN: Deep Auto-encoder and Q-Network	Jun 2, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 275 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified