Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 12301–12350 of 15113 papers

Title	Date	Tasks	Status
Dueling Posterior Sampling for Preference-Based Reinforcement Learning	Aug 4, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
A View on Deep Reinforcement Learning in System Optimization	Aug 4, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Improving Deep Reinforcement Learning in Minecraft with Action Advice	Aug 2, 2019	BIG-bench Machine LearningDeep Reinforcement Learning	—Unverified
Health-Informed Policy Gradients for Multi-Agent Reinforcement Learning	Aug 2, 2019	Multi-agent Reinforcement LearningPolicy Gradient Methods	CodeCode Available
Curiosity-driven Reinforcement Learning for Diverse Visual Paragraph Generation	Aug 1, 2019	Decision MakingImitation Learning	—Unverified
Learning When to Drive in Intersections by Combining Reinforcement Learning and Model Predictive Control	Aug 1, 2019	Decision MakingModel Predictive Control	—Unverified
Reinforcement Learning for Personalized Dialogue Management	Aug 1, 2019	Dialogue ManagementManagement	—Unverified
Multi-Agent Reinforcement Learning Based Frame Sampling for Effective Untrimmed Video Recognition	Jul 31, 2019	Action RecognitionGeneral Classification	—Unverified
Optimal Attacks on Reinforcement Learning Policies	Jul 31, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
PrecoderNet: Hybrid Beamforming for Millimeter Wave Systems with Deep Reinforcement Learning	Jul 31, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Inverse Reinforcement Learning with Multiple Ranked Experts	Jul 31, 2019	reinforcement-learningReinforcement Learning	—Unverified
Control of nonlinear, complex and black-boxed greenhouse system with reinforcement learning	Jul 30, 2019	Q-Learningreinforcement-learning	CodeCode Available
DeepPlace: Learning to Place Applications in Multi-Tenant Clusters	Jul 30, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Wasserstein Robust Reinforcement Learning	Jul 30, 2019	reinforcement-learningReinforcement Learning	—Unverified
Model-Free Unsupervised Learning for Optimization Problems with Constraints	Jul 30, 2019	reinforcement-learningReinforcement Learning	—Unverified
Reward Learning for Efficient Reinforcement Learning in Extractive Document Summarisation	Jul 30, 2019	Decision MakingLearning-To-Rank	CodeCode Available
Multi-Agent Adversarial Inverse Reinforcement Learning	Jul 30, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
MineRL: A Large-Scale Dataset of Minecraft Demonstrations	Jul 29, 2019	BenchmarkingDeep Reinforcement Learning	CodeCode Available
Goal-Driven Sequential Data Abstraction	Jul 29, 2019	BenchmarkingGeneral Reinforcement Learning	—Unverified
Hindsight Trust Region Policy Optimization	Jul 29, 2019	Atari GamesPolicy Gradient Methods	CodeCode Available
Semantic RL with Action Grammars: Data-Efficient Learning of Hierarchical Task Abstractions	Jul 29, 2019	Hierarchical Reinforcement LearningLogical Reasoning	CodeCode Available
Taxable Stock Trading with Deep Reinforcement Learning	Jul 28, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Towards Model-based Reinforcement Learning for Industry-near Environments	Jul 27, 2019	Deep Reinforcement LearningModel-based Reinforcement Learning	CodeCode Available
On Hard Exploration for Reinforcement Learning: a Case Study in Pommerman	Jul 26, 2019	reinforcement-learningReinforcement Learning	—Unverified
Large scale continuous-time mean-variance portfolio allocation via reinforcement learning	Jul 26, 2019	reinforcement-learningReinforcement Learning	—Unverified
Deep Reinforcement Learning for Personalized Search Story Recommendation	Jul 26, 2019	Deep Reinforcement LearningImage Retrieval	—Unverified
A Unified Bellman Optimality Principle Combining Reward Maximization and Empowerment	Jul 26, 2019	MuJoCoReinforcement Learning	—Unverified
Environment Probing Interaction Policies	Jul 26, 2019	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Google Research Football: A Novel Reinforcement Learning Environment	Jul 25, 2019	Game of Footballreinforcement-learning	CodeCode Available
Interactive Lungs Auscultation with Reinforcement Learning Agent	Jul 25, 2019	reinforcement-learningReinforcement Learning	—Unverified
Action Guidance with MCTS for Deep Reinforcement Learning	Jul 25, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Dynamic Input for Deep Reinforcement Learning in Autonomous Driving	Jul 25, 2019	Autonomous DrivingDecision Making	—Unverified
Learning Goal-Oriented Visual Dialog Agents: Imitating and Surpassing Analytic Experts	Jul 24, 2019	Imitation Learningreinforcement-learning	—Unverified
AlphaStock: A Buying-Winners-and-Selling-Losers Investment Strategy using Interpretable Deep Reinforcement Attention Networks	Jul 24, 2019	Deep AttentionDeep Reinforcement Learning	—Unverified
Fairness in Reinforcement Learning	Jul 24, 2019	BIG-bench Machine LearningDeep Reinforcement Learning	—Unverified
Terminal Prediction as an Auxiliary Task for Deep Reinforcement Learning	Jul 24, 2019	Atari GamesDeep Reinforcement Learning	—Unverified
Modeling question asking using neural program generation	Jul 23, 2019	DecoderQuestion Generation	CodeCode Available
Metalearned Neural Memory	Jul 23, 2019	Question Answeringreinforcement-learning	CodeCode Available
Structured Fusion Networks for Dialog	Jul 23, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Discourse Marker Augmented Network with Reinforcement Learning for Natural Language Inference	Jul 23, 2019	Natural Language Inferencereinforcement-learning	CodeCode Available
Deep Reinforcement Learning for Clinical Decision Support: A Brief Survey	Jul 22, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Deep Reinforcement Learning for Autonomous Internet of Things: Model, Applications and Challenges	Jul 22, 2019	Decision MakingDeep Reinforcement Learning	—Unverified
Agent Modeling as Auxiliary Task for Deep Reinforcement Learning	Jul 22, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Efficient Policy Learning for Non-Stationary MDPs under Adversarial Manipulation	Jul 22, 2019	reinforcement-learningReinforcement Learning	—Unverified
VRLS: A Unified Reinforcement Learning Scheduler for Vehicle-to-Vehicle Communications	Jul 22, 2019	reinforcement-learningReinforcement Learning	—Unverified
Surrogate Models for Enhancing the Efficiency of Neuroevolution in Reinforcement Learning	Jul 22, 2019	Evolutionary Algorithmsreinforcement-learning	—Unverified
Techniques for Automated Machine Learning	Jul 21, 2019	Automated Feature EngineeringAutoML	—Unverified
Characterizing Attacks on Deep Reinforcement Learning	Jul 21, 2019	Atari GamesAutonomous Driving	CodeCode Available
Arena: a toolkit for Multi-Agent Reinforcement Learning	Jul 20, 2019	Multi-agent Reinforcement LearningOpenAI Gym	CodeCode Available
Accelerating Reinforcement Learning through GPU Atari Emulation	Jul 19, 2019	Atari GamesCPU	CodeCode Available

Show:10 25 50

← PrevPage 247 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified