Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 12801–12850 of 15113 papers

Title	Date	Tasks	Status	Hype
Adaptive Power System Emergency Control using Deep Reinforcement Learning	Mar 9, 2019	BenchmarkingDeep Reinforcement Learning	CodeCode Available	0
Orthogonal Estimation of Wasserstein Distances	Mar 9, 2019	BIG-bench Machine Learningreinforcement-learning	—Unverified	0
Successive Over Relaxation Q-Learning	Mar 9, 2019	Q-LearningReinforcement Learning	—Unverified	0
Scene Memory Transformer for Embodied Agents in Long-Horizon Tasks	Mar 9, 2019	Decision Makingreinforcement-learning	—Unverified	0
Skew-Fit: State-Covering Self-Supervised Reinforcement Learning	Mar 8, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	1
Learning Self-Game-Play Agents for Combinatorial Optimization Problems	Mar 8, 2019	Atari GamesBoard Games	—Unverified	0
Improved Robustness and Safety for Autonomous Vehicle Control with Adversarial Reinforcement Learning	Mar 8, 2019	Autonomous DrivingAutonomous Vehicles	—Unverified	0
A cooperative game for automated learning of elasto-plasticity knowledge graphs and models with AI-guided experimentation	Mar 8, 2019	Deep Reinforcement LearningKnowledge Graphs	—Unverified	0
Learning Heuristics over Large Graphs via Deep Reinforcement Learning	Mar 8, 2019	Combinatorial OptimizationDeep Reinforcement Learning	CodeCode Available	0
Improving Skin Condition Classification with a Visual Symptom Checker Trained using Reinforcement Learning	Mar 8, 2019	General ClassificationQuestion Answering	—Unverified	0
Pixel-Attentive Policy Gradient for Multi-Fingered Grasping in Cluttered Scenes	Mar 8, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
MinAtar: An Atari-Inspired Testbed for Thorough and Reproducible Reinforcement Learning Experiments	Mar 7, 2019	Atari Gamesreinforcement-learning	CodeCode Available	0
Provably Robust Blackbox Optimization for Reinforcement Learning	Mar 7, 2019	MuJoCoreinforcement-learning	—Unverified	0
Predicting Research Trends From Arxiv	Mar 7, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	0
RLOC: Neurobiologically Inspired Hierarchical Reinforcement Learning Algorithm for Continuous Control of Nonlinear Dynamical Systems	Mar 7, 2019	continuous-controlContinuous Control	—Unverified	0
Concurrent Meta Reinforcement Learning	Mar 7, 2019	Efficient ExplorationMeta-Learning	CodeCode Available	0
A Hitchhiker's Guide to Statistical Comparisons of Reinforcement Learning Algorithms	Mar 6, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	0
simple_rl: Reproducible Reinforcement Learning in Python	Mar 6, 2019	Philosophyreinforcement-learning	CodeCode Available	0
Minigo: A Case Study in Reproducing Reinforcement Learning Research	Mar 6, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Continual Learning Using World Models for Pseudo-Rehearsal	Mar 6, 2019	Atari GamesContinual Learning	—Unverified	0
Synthesizing Chemical Plant Operation Procedures using Knowledge, Dynamic Simulation and Deep Reinforcement Learning	Mar 6, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Safety-Guided Deep Reinforcement Learning via Online Gaussian Process Estimation	Mar 6, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Training in Task Space to Speed Up and Guide Reinforcement Learning	Mar 6, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Using Natural Language for Reward Shaping in Reinforcement Learning	Mar 5, 2019	Atari GamesMontezuma's Revenge	CodeCode Available	0
Viewpoint Optimization for Autonomous Strawberry Harvesting with Deep Reinforcement Learning	Mar 5, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Online Data Poisoning Attack	Mar 5, 2019	Data PoisoningDeep Reinforcement Learning	—Unverified	0
Towards Understanding Chinese Checkers with Heuristics, Monte Carlo Tree Search, and Deep Reinforcement Learning	Mar 5, 2019	Deep Reinforcement LearningReinforcement Learning	—Unverified	0
Learning Dynamics Model in Reinforcement Learning by Incorporating the Long Term Future	Mar 5, 2019	Imitation LearningModel-based Reinforcement Learning	—Unverified	0
Model Primitive Hierarchical Lifelong Reinforcement Learning	Mar 4, 2019	Hierarchical Reinforcement LearningLifelong learning	CodeCode Available	1
NoRML: No-Reward Meta Learning	Mar 4, 2019	Meta-LearningReinforcement Learning	—Unverified	0
Microscopic Traffic Simulation by Cooperative Multi-agent Deep Reinforcement Learning	Mar 4, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Hybrid Actor-Critic Reinforcement Learning in Parameterized Action Space	Mar 4, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	0
Asynchronous Episodic Deep Deterministic Policy Gradient: Towards Continuous Control in Computationally Complex Environments	Mar 3, 2019	continuous-controlContinuous Control	CodeCode Available	0
Hacking Google reCAPTCHA v3 using Reinforcement Learning	Mar 3, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Budgeted Reinforcement Learning in Continuous State Space	Mar 3, 2019	Autonomous DrivingDeep Reinforcement Learning	CodeCode Available	0
Straight to the point: reinforcement learning for user guidance in ultrasound	Mar 2, 2019	AnatomyDiagnostic	—Unverified	0
Discovering Options for Exploration by Minimizing Cover Time	Mar 2, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Automating Predictive Modeling Process using Reinforcement Learning	Mar 2, 2019	Decision MakingDecision Making Under Uncertainty	—Unverified	0
A Regularized Approach to Sparse Optimal Policy in Reinforcement Learning	Mar 2, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
A Cooperative Multi-Agent Reinforcement Learning Framework for Resource Balancing in Complex Logistics Network	Mar 2, 2019	Combinatorial OptimizationManagement	CodeCode Available	1
Efficient Reinforcement Learning for StarCraft by Abstract Forward Models and Transfer Learning	Mar 2, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	0
OmniDRL: Robust Pedestrian Detection using Deep Reinforcement Learning on Omnidirectional Cameras	Mar 2, 2019	Deep Reinforcement LearningPedestrian Detection	—Unverified	0
TrojDRL: Trojan Attacks on Deep Reinforcement Learning Agents	Mar 1, 2019	Data PoisoningDeep Reinforcement Learning	CodeCode Available	0
Model-Based Reinforcement Learning for Atari	Mar 1, 2019	Atari GamesAtari Games 100k	CodeCode Available	0
Learning To Follow Directions in Street View	Mar 1, 2019	Deep Reinforcement LearningInstruction Following	CodeCode Available	0
Reinforcement Learning based Curriculum Optimization for Neural Machine Translation	Feb 28, 2019	Machine TranslationNMT	—Unverified	0
Unifying Ensemble Methods for Q-learning via Social Choice Theory	Feb 27, 2019	DiversityQ-Learning	—Unverified	0
Neural Packet Classification	Feb 27, 2019	ClassificationDeep Reinforcement Learning	—Unverified	0
Unsupervised Attention Mechanism across Neural Network Layers	Feb 27, 2019	Few-Shot LearningImage Classification	CodeCode Available	0
Deep Reinforcement Learning for Adaptive Caching in Hierarchical Content Delivery Networks	Feb 27, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0

Show:10 25 50

← PrevPage 257 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified