Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11001–11050 of 15113 papers

Title	Date	Tasks	Status
Adaptive Dialog Policy Learning with Hindsight and User Modeling	May 7, 2020	Reinforcement Learning (RL)	—Unverified
Reinforcement Learning with Feedback Graphs	May 7, 2020	reinforcement-learningReinforcement Learning	—Unverified
Safe Reinforcement Learning through Meta-learned Instincts	May 6, 2020	Deep Reinforcement LearningMeta-Learning	—Unverified
Robotic Arm Control and Task Training through Deep Reinforcement Learning	May 6, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Reinforcement Learning for UAV Autonomous Navigation, Mapping and Target Detection	May 5, 2020	Autonomous Navigationreinforcement-learning	—Unverified
Gifting in multi-agent reinforcement learning	May 5, 2020	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available
A Survey on Dialog Management: Recent Advances and Challenges	May 5, 2020	ManagementReinforcement Learning (RL)	—Unverified
Generalized Planning With Deep Reinforcement Learning	May 5, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Discrete-to-Deep Supervised Policy Learning	May 5, 2020	Reinforcement Learning (RL)	CodeCode Available
Formal Policy Synthesis for Continuous-Space Systems via Reinforcement Learning	May 4, 2020	reinforcement-learningReinforcement Learning	—Unverified
Generalized Reinforcement Meta Learning for Few-Shot Optimization	May 4, 2020	DecoderFew-Shot Learning	—Unverified
Hierarchical Decomposition of Nonlinear Dynamics and Control for System Identification and Policy Distillation	May 4, 2020	Imitation LearningReinforcement Learning (RL)	—Unverified
Reward Constrained Interactive Recommendation with Natural Language Feedback	May 4, 2020	Interactive RecommendationRecommendation Systems	—Unverified
Multiagent Value Iteration Algorithms in Dynamic Programming and Reinforcement Learning	May 4, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Setting up experimental Bell test with reinforcement learning	May 4, 2020	reinforcement-learningReinforcement Learning	—Unverified
Noise Pollution in Hospital Readmission Prediction: Long Document Classification with Reinforcement Learning	May 4, 2020	Document ClassificationGeneral Classification	—Unverified
Multi-agent Reinforcement Learning for Decentralized Stable Matching	May 3, 2020	FairnessMulti-agent Reinforcement Learning	—Unverified
Optimal Beam Association for High Mobility mmWave Vehicular Networks: Lightweight Parallel Reinforcement Learning Approach	May 2, 2020	Deep Reinforcement LearningQ-Learning	—Unverified
Deep Reinforcement Learning for Intelligent Transportation Systems: A Survey	May 2, 2020	Autonomous DrivingDeep Reinforcement Learning	—Unverified
Enhancing Text-based Reinforcement Learning Agents with Commonsense Knowledge	May 2, 2020	reinforcement-learningReinforcement Learning	—Unverified
Learning the Arrow of Time for Problems in Reinforcement Learning	May 1, 2020	reinforcement-learningReinforcement Learning	—Unverified
AMRL: Aggregated Memory For Reinforcement Learning	May 1, 2020	Minecraftreinforcement-learning	—Unverified
Learning Heuristics for Quantified Boolean Formulas through Reinforcement Learning	May 1, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Keep Doing What Worked: Behavior Modelling Priors for Offline Reinforcement Learning	May 1, 2020	continuous-controlContinuous Control	—Unverified
Explain Your Move: Understanding Agent Actions Using Focused Feature Saliency	May 1, 2020	Atari GamesBoard Games	CodeCode Available
Is Long Horizon Reinforcement Learning More Difficult Than Short Horizon Reinforcement Learning?	May 1, 2020	reinforcement-learningReinforcement Learning	—Unverified
Improving Robustness via Risk Averse Distributional Reinforcement Learning	May 1, 2020	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Exploration in Reinforcement Learning with Deep Covering Options	May 1, 2020	reinforcement-learningReinforcement Learning	—Unverified
Episodic Reinforcement Learning with Associative Memory	May 1, 2020	Atari GamesDeep Reinforcement Learning	—Unverified
Learning Efficient Parameter Server Synchronization Policies for Distributed SGD	May 1, 2020	Q-LearningReinforcement Learning (RL)	—Unverified
Synthesizing Programmatic Policies that Inductively Generalize	May 1, 2020	Deep Reinforcement LearningImitation Learning	—Unverified
Model Based Reinforcement Learning for Atari	May 1, 2020	Atari Gamesmodel	—Unverified
Model-based reinforcement learning for biological sequence design	May 1, 2020	modelModel-based Reinforcement Learning	—Unverified
Toward Evaluating Robustness of Deep Reinforcement Learning with Continuous Control	May 1, 2020	continuous-controlContinuous Control	—Unverified
Posterior sampling for multi-agent reinforcement learning: solving extensive games with imperfect information	May 1, 2020	counterfactualMulti-agent Reinforcement Learning	—Unverified
The Ingredients of Real World Robotic Reinforcement Learning	May 1, 2020	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement learning of minimalist grammars	Apr 30, 2020	reinforcement-learningReinforcement Learning	—Unverified
Unsupervised Learning of KB Queries in Task-Oriented Dialogs	Apr 30, 2020	PositionReinforcement Learning (RL)	—Unverified
Towards Embodied Scene Description	Apr 30, 2020	Imitation Learningreinforcement-learning	—Unverified
Out-of-the-box channel pruned networks	Apr 30, 2020	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Plan-Space State Embeddings for Improved Reinforcement Learning	Apr 30, 2020	reinforcement-learningReinforcement Learning	—Unverified
DSAC: Distributional Soft Actor Critic for Risk-Sensitive Reinforcement Learning	Apr 30, 2020	continuous-controlContinuous Control	—Unverified
GCN-RL Circuit Designer: Transferable Transistor Sizing with Graph Neural Networks and Reinforcement Learning	Apr 30, 2020	Bayesian OptimizationEvolutionary Algorithms	—Unverified
Delay-aware Resource Allocation in Fog-assisted IoT Networks Through Reinforcement Learning	Apr 30, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Improving Factual Consistency Between a Response and Persona Facts	Apr 30, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Breaking (Global) Barriers in Parallel Stochastic Optimization with Wait-Avoiding Group Averaging	Apr 30, 2020	Deep Reinforcement LearningMachine Translation	—Unverified
Bootstrap Latent-Predictive Representations for Multitask Reinforcement Learning	Apr 30, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Graph-based State Representation for Deep Reinforcement Learning	Apr 29, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Reduced-Dimensional Reinforcement Learning Control using Singular Perturbation Approximations	Apr 29, 2020	Clusteringreinforcement-learning	—Unverified
Whittle index based Q-learning for restless bandits with average reward	Apr 29, 2020	Q-Learningreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 221 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified