Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 12951–13000 of 15113 papers

Title	Date	Tasks	Status
Predicting Research Trends From Arxiv	Mar 7, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Concurrent Meta Reinforcement Learning	Mar 7, 2019	Efficient ExplorationMeta-Learning	CodeCode Available
A Hitchhiker's Guide to Statistical Comparisons of Reinforcement Learning Algorithms	Mar 6, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Continual Learning Using World Models for Pseudo-Rehearsal	Mar 6, 2019	Atari GamesContinual Learning	—Unverified
Safety-Guided Deep Reinforcement Learning via Online Gaussian Process Estimation	Mar 6, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Synthesizing Chemical Plant Operation Procedures using Knowledge, Dynamic Simulation and Deep Reinforcement Learning	Mar 6, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Minigo: A Case Study in Reproducing Reinforcement Learning Research	Mar 6, 2019	reinforcement-learningReinforcement Learning	—Unverified
Training in Task Space to Speed Up and Guide Reinforcement Learning	Mar 6, 2019	reinforcement-learningReinforcement Learning	—Unverified
simple_rl: Reproducible Reinforcement Learning in Python	Mar 6, 2019	Philosophyreinforcement-learning	CodeCode Available
Towards Understanding Chinese Checkers with Heuristics, Monte Carlo Tree Search, and Deep Reinforcement Learning	Mar 5, 2019	Deep Reinforcement LearningReinforcement Learning	—Unverified
Online Data Poisoning Attack	Mar 5, 2019	Data PoisoningDeep Reinforcement Learning	—Unverified
Using Natural Language for Reward Shaping in Reinforcement Learning	Mar 5, 2019	Atari GamesMontezuma's Revenge	CodeCode Available
Viewpoint Optimization for Autonomous Strawberry Harvesting with Deep Reinforcement Learning	Mar 5, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Learning Dynamics Model in Reinforcement Learning by Incorporating the Long Term Future	Mar 5, 2019	Imitation LearningModel-based Reinforcement Learning	—Unverified
Hybrid Actor-Critic Reinforcement Learning in Parameterized Action Space	Mar 4, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Microscopic Traffic Simulation by Cooperative Multi-agent Deep Reinforcement Learning	Mar 4, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
NoRML: No-Reward Meta Learning	Mar 4, 2019	Meta-LearningReinforcement Learning	—Unverified
Budgeted Reinforcement Learning in Continuous State Space	Mar 3, 2019	Autonomous DrivingDeep Reinforcement Learning	CodeCode Available
Asynchronous Episodic Deep Deterministic Policy Gradient: Towards Continuous Control in Computationally Complex Environments	Mar 3, 2019	continuous-controlContinuous Control	CodeCode Available
Hacking Google reCAPTCHA v3 using Reinforcement Learning	Mar 3, 2019	reinforcement-learningReinforcement Learning	—Unverified
A Regularized Approach to Sparse Optimal Policy in Reinforcement Learning	Mar 2, 2019	reinforcement-learningReinforcement Learning	—Unverified
Discovering Options for Exploration by Minimizing Cover Time	Mar 2, 2019	reinforcement-learningReinforcement Learning	—Unverified
Efficient Reinforcement Learning for StarCraft by Abstract Forward Models and Transfer Learning	Mar 2, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Automating Predictive Modeling Process using Reinforcement Learning	Mar 2, 2019	Decision MakingDecision Making Under Uncertainty	—Unverified
OmniDRL: Robust Pedestrian Detection using Deep Reinforcement Learning on Omnidirectional Cameras	Mar 2, 2019	Deep Reinforcement LearningPedestrian Detection	—Unverified
Straight to the point: reinforcement learning for user guidance in ultrasound	Mar 2, 2019	AnatomyDiagnostic	—Unverified
Model-Based Reinforcement Learning for Atari	Mar 1, 2019	Atari GamesAtari Games 100k	CodeCode Available
TrojDRL: Trojan Attacks on Deep Reinforcement Learning Agents	Mar 1, 2019	Data PoisoningDeep Reinforcement Learning	CodeCode Available
Learning To Follow Directions in Street View	Mar 1, 2019	Deep Reinforcement LearningInstruction Following	CodeCode Available
Reinforcement Learning based Curriculum Optimization for Neural Machine Translation	Feb 28, 2019	Machine TranslationNMT	—Unverified
Unsupervised Attention Mechanism across Neural Network Layers	Feb 27, 2019	Few-Shot LearningImage Classification	CodeCode Available
Neural Packet Classification	Feb 27, 2019	ClassificationDeep Reinforcement Learning	—Unverified
Unifying Ensemble Methods for Q-learning via Social Choice Theory	Feb 27, 2019	DiversityQ-Learning	—Unverified
Deep Reinforcement Learning for Adaptive Caching in Hierarchical Content Delivery Networks	Feb 27, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Distributed Edge Caching via Reinforcement Learning in Fog Radio Access Networks	Feb 27, 2019	Q-Learningreinforcement-learning	—Unverified
Introspection Learning	Feb 27, 2019	reinforcement-learningReinforcement Learning	—Unverified
Diagnosing Bottlenecks in Deep Q-learning Algorithms	Feb 26, 2019	continuous-controlContinuous Control	CodeCode Available
Can Meta-Interpretive Learning outperform Deep Reinforcement Learning of Evaluable Game strategies?	Feb 26, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Learning When Not to Answer: A Ternary Reward Structure for Reinforcement Learning based Question Answering	Feb 26, 2019	Knowledge GraphsQuestion Answering	—Unverified
Planning in Hierarchical Reinforcement Learning: Guarantees for Using Local Policies	Feb 26, 2019	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified
Understanding Agent Incentives using Causal Influence Diagrams. Part I: Single Action Settings	Feb 26, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified
S-TRIGGER: Continual State Representation Learning via Self-Triggered Generative Replay	Feb 25, 2019	Change DetectionContinual Learning	—Unverified
Long-Range Indoor Navigation with PRM-RL	Feb 25, 2019	Navigatereinforcement-learning	—Unverified
Learning Extreme Hummingbird Maneuvers on Flapping Wing Robots	Feb 25, 2019	reinforcement-learningReinforcement Learning	—Unverified
Adversarial Reinforcement Learning under Partial Observability in Autonomous Computer Network Defence	Feb 25, 2019	reinforcement-learningReinforcement Learning	—Unverified
Flappy Hummingbird: An Open Source Dynamic Simulation of Flapping Wing Robots and Animals	Feb 25, 2019	Deep Reinforcement LearningOpenAI Gym	CodeCode Available
Aggregating E-commerce Search Results from Heterogeneous Sources via Hierarchical Reinforcement Learning	Feb 24, 2019	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified
Distributionally Robust Reinforcement Learning	Feb 23, 2019	continuous-controlContinuous Control	—Unverified
A General Framework for Structured Learning of Mechanical Systems	Feb 22, 2019	Model-based Reinforcement LearningReinforcement Learning	CodeCode Available
Generative Memory for Lifelong Reinforcement Learning	Feb 22, 2019	Lifelong learningreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 260 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified