Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10701–10750 of 15113 papers

Title	Date	Tasks	Status	Hype
Synthesizing Programmatic Policies that Inductively Generalize	May 1, 2020	Deep Reinforcement LearningImitation Learning	—Unverified	0
AMRL: Aggregated Memory For Reinforcement Learning	May 1, 2020	Minecraftreinforcement-learning	—Unverified	0
Episodic Reinforcement Learning with Associative Memory	May 1, 2020	Atari GamesDeep Reinforcement Learning	—Unverified	0
Keep Doing What Worked: Behavior Modelling Priors for Offline Reinforcement Learning	May 1, 2020	continuous-controlContinuous Control	—Unverified	0
Learning Collaborative Agents with Rule Guidance for Knowledge Graph Reasoning	May 1, 2020	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	1
Improving Robustness via Risk Averse Distributional Reinforcement Learning	May 1, 2020	Distributional Reinforcement Learningreinforcement-learning	—Unverified	0
Is Long Horizon Reinforcement Learning More Difficult Than Short Horizon Reinforcement Learning?	May 1, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Delay-aware Resource Allocation in Fog-assisted IoT Networks Through Reinforcement Learning	Apr 30, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Bootstrap Latent-Predictive Representations for Multitask Reinforcement Learning	Apr 30, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
GCN-RL Circuit Designer: Transferable Transistor Sizing with Graph Neural Networks and Reinforcement Learning	Apr 30, 2020	Bayesian OptimizationEvolutionary Algorithms	—Unverified	0
Improving Factual Consistency Between a Response and Persona Facts	Apr 30, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Breaking (Global) Barriers in Parallel Stochastic Optimization with Wait-Avoiding Group Averaging	Apr 30, 2020	Deep Reinforcement LearningMachine Translation	—Unverified	0
DSAC: Distributional Soft Actor Critic for Risk-Sensitive Reinforcement Learning	Apr 30, 2020	continuous-controlContinuous Control	—Unverified	0
Out-of-the-box channel pruned networks	Apr 30, 2020	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Towards Embodied Scene Description	Apr 30, 2020	Imitation Learningreinforcement-learning	—Unverified	0
Reinforcement learning of minimalist grammars	Apr 30, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Plan-Space State Embeddings for Improved Reinforcement Learning	Apr 30, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Unsupervised Learning of KB Queries in Task-Oriented Dialogs	Apr 30, 2020	PositionReinforcement Learning (RL)	—Unverified	0
Reinforcement Learning with Augmented Data	Apr 30, 2020	Data AugmentationOpenAI Gym	CodeCode Available	1
Reduced-Dimensional Reinforcement Learning Control using Singular Perturbation Approximations	Apr 29, 2020	Clusteringreinforcement-learning	—Unverified	0
Whittle index based Q-learning for restless bandits with average reward	Apr 29, 2020	Q-Learningreinforcement-learning	—Unverified	0
Meta-Reinforcement Learning for Robotic Industrial Insertion Tasks	Apr 29, 2020	FrictionMeta Reinforcement Learning	—Unverified	0
Molecular Design in Synthetically Accessible Chemical Space via Deep Reinforcement Learning	Apr 29, 2020	Deep Reinforcement LearningDrug Design	—Unverified	0
Hierarchical Reinforcement Learning for Automatic Disease Diagnosis	Apr 29, 2020	Hierarchical Reinforcement Learningreinforcement-learning	CodeCode Available	1
Actor-Critic Reinforcement Learning for Control with Stability Guarantee	Apr 29, 2020	Motion Planningreinforcement-learning	CodeCode Available	1
Graph-based State Representation for Deep Reinforcement Learning	Apr 29, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Improving Sample Efficiency and Multi-Agent Communication in RL-based Train Rescheduling	Apr 28, 2020	Policy Gradient Methodsreinforcement-learning	—Unverified	0
Image Augmentation Is All You Need: Regularizing Deep Reinforcement Learning from Pixels	Apr 28, 2020	AllAtari Games 100k	CodeCode Available	1
The Immersion of Directed Multi-graphs in Embedding Fields. Generalisations	Apr 28, 2020	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Transferable Active Grasping and Real Embodied Dataset	Apr 28, 2020	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	1
Can We Learn Heuristics For Graphical Model Inference Using Reinforcement Learning?	Apr 27, 2020	Action RecognitionCombinatorial Optimization	—Unverified	0
First return, then explore	Apr 27, 2020	Atari GamesMontezuma's Revenge	CodeCode Available	1
Emergent Real-World Robotic Skills via Unsupervised Off-Policy Reinforcement Learning	Apr 27, 2020	Model Predictive Controlreinforcement-learning	CodeCode Available	1
Evolving Inborn Knowledge For Fast Adaptation in Dynamic POMDP Problems	Apr 27, 2020	Meta Reinforcement LearningMinecraft	CodeCode Available	0
Adaptive model selection in photonic reservoir computing by reinforcement learning	Apr 27, 2020	Load ForecastingModel Selection	—Unverified	0
Age-Aware Status Update Control for Energy Harvesting IoT Sensors via Reinforcement Learning	Apr 27, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
The Ingredients of Real-World Robotic Reinforcement Learning	Apr 27, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Reinforcement Learning Generalization with Surprise Minimization	Apr 26, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Learning To Navigate The Synthetically Accessible Chemical Space Using Reinforcement Learning	Apr 26, 2020	Drug DesignDrug Discovery	CodeCode Available	1
A State Aggregation Approach for Solving Knapsack Problem with Deep Reinforcement Learning	Apr 25, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Curiosity-Driven Energy-Efficient Worker Scheduling in Vehicular Crowdsourcing: A Deep Reinforcement Learning Approach	Apr 24, 2020	Deep Reinforcement LearningFairness	CodeCode Available	1
CFR-RL: Traffic Engineering with Reinforcement Learning in SDN	Apr 24, 2020	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	1
The Variational Bandwidth Bottleneck: Stochastic Evaluation on an Information Budget	Apr 24, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	2
PBCS : Efficient Exploration and Exploitation Using a Synergy between Reinforcement Learning and Motion Planning	Apr 24, 2020	continuous-controlContinuous Control	—Unverified	0
Self-Paced Deep Reinforcement Learning	Apr 24, 2020	Deep Reinforcement LearningOpen-Ended Question Answering	CodeCode Available	1
Automatic low-bit hybrid quantization of neural networks through meta learning	Apr 24, 2020	Meta-LearningQuantization	—Unverified	0
Learning Dialog Policies from Weak Demonstrations	Apr 23, 2020	Atari GamesDeep Reinforcement Learning	—Unverified	0
Divide-and-Conquer Monte Carlo Tree Search For Goal-Directed Planning	Apr 23, 2020	continuous-controlContinuous Control	—Unverified	0
Correct Me If You Can: Learning from Error Corrections and Markings	Apr 23, 2020	Machine Translationreinforcement-learning	CodeCode Available	0
Guiding Robot Exploration in Reinforcement Learning via Automated Planning	Apr 23, 2020	reinforcement-learningReinforcement Learning	—Unverified	0

Show:10 25 50

← PrevPage 215 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified