Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 12201–12250 of 15113 papers

Title	Date	Tasks	Status
Learning Action-Transferable Policy with Action Embedding	Sep 5, 2019	Continuous ControlReinforcement Learning	CodeCode Available
Spatiotemporally Constrained Action Space Attacks on Deep Reinforcement Learning Agents	Sep 5, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Rewarding Coreference Resolvers for Being Consistent with World Knowledge	Sep 5, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Q-DATA: Enhanced Traffic Flow Monitoring in Software-Defined Networks applying Q-learning	Sep 4, 2019	ManagementQ-Learning	—Unverified
Quasi-Newton Optimization Methods For Deep Learning Applications	Sep 4, 2019	Deep LearningDeep Reinforcement Learning	—Unverified
No Press Diplomacy: Modeling Multi-Agent Gameplay	Sep 4, 2019	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Learning sparse representations in reinforcement learning	Sep 4, 2019	Acrobotreinforcement-learning	—Unverified
Learning Dynamic Context Augmentation for Global Entity Linking	Sep 4, 2019	Entity DisambiguationEntity Linking	CodeCode Available
Inductive-bias-driven Reinforcement Learning For Efficient Schedules in Heterogeneous Clusters	Sep 4, 2019	Heuristic SearchInductive Bias	—Unverified
Answers Unite! Unsupervised Metrics for Reinforced Summarization Models	Sep 4, 2019	Abstractive Text SummarizationQuestion Answering	CodeCode Available
ACES -- Automatic Configuration of Energy Harvesting Sensors with Reinforcement Learning	Sep 4, 2019	reinforcement-learningReinforcement Learning	—Unverified
LeDeepChef: Deep Reinforcement Learning Agent for Families of Text-Based Games	Sep 4, 2019	Atari GamesDeep Reinforcement Learning	—Unverified
Augmented Memory Networks for Streaming-Based Active One-Shot Learning	Sep 4, 2019	Active LearningOne-Shot Learning	—Unverified
A Reinforcement Learning-Based Framework for Solving Physical Design Routing Problem in the Absence of Large Test Sets	Sep 3, 2019	reinforcement-learningReinforcement Learning	—Unverified
Generalization in Transfer Learning	Sep 3, 2019	continuous-controlContinuous Control	—Unverified
How to Build User Simulators to Train RL-based Dialog Systems	Sep 3, 2019	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Better Rewards Yield Better Summaries: Learning to Summarise Without References	Sep 3, 2019	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Evolutionary reinforcement learning of dynamical large deviations	Sep 2, 2019	reinforcement-learningReinforcement Learning	—Unverified
Classification Betters Regression in Query-based Multi-document Summarisation Techniques for Question Answering: Macquarie University at BioASQ7b	Sep 2, 2019	General ClassificationQuestion Answering	—Unverified
Logic and the 2-Simplicial Transformer	Sep 2, 2019	Deep Reinforcement LearningInductive Bias	—Unverified
Reinforcement Learning-based Automatic Diagnosis of Acute Appendicitis in Abdominal CT	Sep 2, 2019	Anatomyreinforcement-learning	—Unverified
To Combine or Not To Combine? A Rainbow Deep Reinforcement Learning Agent for Dialog Policies	Sep 1, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Scalable Reinforcement-Learning-Based Neural Architecture Search for Cancer Deep Learning Research	Sep 1, 2019	Deep LearningNeural Architecture Search	—Unverified
Deep Reinforcement Learning with Distributional Semantic Rewards for Abstractive Summarization	Aug 31, 2019	Abstractive Text SummarizationDeep Reinforcement Learning	—Unverified
Generating Classical Chinese Poems from Vernacular Chinese	Aug 31, 2019	Cultural Vocal Bursts Intensity PredictionMachine Translation	CodeCode Available
Reinforcement learning with world model	Aug 30, 2019	Decision Makingmodel	—Unverified
Learning to Transfer Learn: Reinforcement Learning-Based Selection for Adaptive Transfer Learning	Aug 29, 2019	reinforcement-learningReinforcement Learning	—Unverified
PaccMann^RL: Designing anticancer drugs from transcriptomic data via reinforcement learning	Aug 29, 2019	Computational chemistryDrug Design	—Unverified
Reinforcement Learning: Prediction, Control and Value Function Approximation	Aug 28, 2019	BIG-bench Machine LearningPrediction	—Unverified
Solving Math Word Problems with Double-Decoder Transformer	Aug 28, 2019	DecoderMath	—Unverified
An Empirical Comparison on Imitation Learning and Reinforcement Learning for Paraphrase Generation	Aug 28, 2019	DecoderImitation Learning	CodeCode Available
Guided Dialog Policy Learning: Reward Estimation for Multi-Domain Task-Oriented Dialog	Aug 28, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Deep Actor-Critic Reinforcement Learning for Anomaly Detection	Aug 28, 2019	Anomaly DetectionDeep Reinforcement Learning	—Unverified
Ensemble-Based Deep Reinforcement Learning for Chatbots	Aug 27, 2019	ChatbotClustering	—Unverified
Continuous Value Iteration (CVI) Reinforcement Learning and Imaginary Experience Replay (IER) for learning multi-goal, continuous action and state space controllers	Aug 27, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Deep Reinforcement Learning for Chatbots Using Clustered Actions and Human-Likeness Rewards	Aug 27, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
A Deep Reinforcement Learning Approach to Multi-component Job Scheduling in Edge Computing	Aug 26, 2019	Deep Reinforcement LearningEdge-computing	—Unverified
Dynamics-aware Embeddings	Aug 25, 2019	continuous-controlContinuous Control	CodeCode Available
Tutorial and Survey on Probabilistic Graphical Model and Variational Inference in Deep Reinforcement Learning	Aug 25, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Universal Policies to Learn Them All	Aug 24, 2019	AllMulti-agent Reinforcement Learning	CodeCode Available
A Comparison of Action Spaces for Learning Manipulation Tasks	Aug 23, 2019	reinforcement-learningReinforcement Learning	—Unverified
Double Reinforcement Learning for Efficient Off-Policy Evaluation in Markov Decision Processes	Aug 22, 2019	Off-policy evaluationreinforcement-learning	CodeCode Available
Improving the dynamics of quantum sensors with reinforcement learning	Aug 22, 2019	Positionreinforcement-learning	—Unverified
Reinforcement Learning in Healthcare: A Survey	Aug 22, 2019	Decision MakingMedical Diagnosis	—Unverified
Opponent Aware Reinforcement Learning	Aug 22, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Practical Risk Measures in Reinforcement Learning	Aug 22, 2019	reinforcement-learningReinforcement Learning	—Unverified
On Convergence Rate of Adaptive Multiscale Value Function Approximation For Reinforcement Learning	Aug 22, 2019	reinforcement-learningReinforcement Learning	—Unverified
Dialog State Tracking with Reinforced Data Augmentation	Aug 21, 2019	Data Augmentationdialog state tracking	—Unverified
Deep Reinforcement Learning for Foreign Exchange Trading	Aug 21, 2019	Deep Reinforcement LearningQ-Learning	—Unverified
A Generalized Algorithm for Multi-Objective Reinforcement Learning and Policy Adaptation	Aug 21, 2019	Multi-Objective Reinforcement Learningreinforcement-learning	CodeCode Available

Show:10 25 50

← PrevPage 245 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified