Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 12051–12100 of 15113 papers

Title	Date	Tasks	Status	Hype
A Reinforcement Learning-Based Framework for Solving Physical Design Routing Problem in the Absence of Large Test Sets	Sep 3, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
How to Build User Simulators to Train RL-based Dialog Systems	Sep 3, 2019	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	0
Better Rewards Yield Better Summaries: Learning to Summarise Without References	Sep 3, 2019	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	0
rlpyt: A Research Code Base for Deep Reinforcement Learning in PyTorch	Sep 3, 2019	Deep Reinforcement LearningQ-Learning	CodeCode Available	2
Generalization in Transfer Learning	Sep 3, 2019	continuous-controlContinuous Control	—Unverified	0
Evolutionary reinforcement learning of dynamical large deviations	Sep 2, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Classification Betters Regression in Query-based Multi-document Summarisation Techniques for Question Answering: Macquarie University at BioASQ7b	Sep 2, 2019	General ClassificationQuestion Answering	—Unverified	0
Logic and the 2-Simplicial Transformer	Sep 2, 2019	Deep Reinforcement LearningInductive Bias	—Unverified	0
Reinforcement Learning-based Automatic Diagnosis of Acute Appendicitis in Abdominal CT	Sep 2, 2019	Anatomyreinforcement-learning	—Unverified	0
To Combine or Not To Combine? A Rainbow Deep Reinforcement Learning Agent for Dialog Policies	Sep 1, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Scalable Reinforcement-Learning-Based Neural Architecture Search for Cancer Deep Learning Research	Sep 1, 2019	Deep LearningNeural Architecture Search	—Unverified	0
Generating Classical Chinese Poems from Vernacular Chinese	Aug 31, 2019	Cultural Vocal Bursts Intensity PredictionMachine Translation	CodeCode Available	0
Deep Reinforcement Learning with Distributional Semantic Rewards for Abstractive Summarization	Aug 31, 2019	Abstractive Text SummarizationDeep Reinforcement Learning	—Unverified	0
Reinforcement learning with world model	Aug 30, 2019	Decision Makingmodel	—Unverified	0
PaccMann^RL: Designing anticancer drugs from transcriptomic data via reinforcement learning	Aug 29, 2019	Computational chemistryDrug Design	—Unverified	0
Learning to Transfer Learn: Reinforcement Learning-Based Selection for Adaptive Transfer Learning	Aug 29, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
An Empirical Comparison on Imitation Learning and Reinforcement Learning for Paraphrase Generation	Aug 28, 2019	DecoderImitation Learning	CodeCode Available	0
Guided Dialog Policy Learning: Reward Estimation for Multi-Domain Task-Oriented Dialog	Aug 28, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	0
Deep Actor-Critic Reinforcement Learning for Anomaly Detection	Aug 28, 2019	Anomaly DetectionDeep Reinforcement Learning	—Unverified	0
Reinforcement Learning: Prediction, Control and Value Function Approximation	Aug 28, 2019	BIG-bench Machine LearningPrediction	—Unverified	0
Solving Math Word Problems with Double-Decoder Transformer	Aug 28, 2019	DecoderMath	—Unverified	0
Ensemble-Based Deep Reinforcement Learning for Chatbots	Aug 27, 2019	ChatbotClustering	—Unverified	0
Deep Reinforcement Learning for Chatbots Using Clustered Actions and Human-Likeness Rewards	Aug 27, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Continuous Value Iteration (CVI) Reinforcement Learning and Imaginary Experience Replay (IER) for learning multi-goal, continuous action and state space controllers	Aug 27, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	0
A Deep Reinforcement Learning Approach to Multi-component Job Scheduling in Edge Computing	Aug 26, 2019	Deep Reinforcement LearningEdge-computing	—Unverified	0
OpenSpiel: A Framework for Reinforcement Learning in Games	Aug 26, 2019	General Reinforcement Learningreinforcement-learning	CodeCode Available	3
Tutorial and Survey on Probabilistic Graphical Model and Variational Inference in Deep Reinforcement Learning	Aug 25, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Dynamics-aware Embeddings	Aug 25, 2019	continuous-controlContinuous Control	CodeCode Available	0
Universal Policies to Learn Them All	Aug 24, 2019	AllMulti-agent Reinforcement Learning	CodeCode Available	0
A Comparison of Action Spaces for Learning Manipulation Tasks	Aug 23, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Double Reinforcement Learning for Efficient Off-Policy Evaluation in Markov Decision Processes	Aug 22, 2019	Off-policy evaluationreinforcement-learning	CodeCode Available	0
Improving the dynamics of quantum sensors with reinforcement learning	Aug 22, 2019	Positionreinforcement-learning	—Unverified	0
Reinforcement Learning in Healthcare: A Survey	Aug 22, 2019	Decision MakingMedical Diagnosis	—Unverified	0
Practical Risk Measures in Reinforcement Learning	Aug 22, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Opponent Aware Reinforcement Learning	Aug 22, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	0
On Convergence Rate of Adaptive Multiscale Value Function Approximation For Reinforcement Learning	Aug 22, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Analyzing Cyber-Physical Systems from the Perspective of Artificial Intelligence	Aug 21, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
A Generalized Algorithm for Multi-Objective Reinforcement Learning and Policy Adaptation	Aug 21, 2019	Multi-Objective Reinforcement Learningreinforcement-learning	CodeCode Available	0
Automated quantum programming via reinforcement learning for combinatorial optimization	Aug 21, 2019	Combinatorial Optimizationreinforcement-learning	CodeCode Available	0
Deep Reinforcement Learning for Foreign Exchange Trading	Aug 21, 2019	Deep Reinforcement LearningQ-Learning	—Unverified	0
Dialog State Tracking with Reinforced Data Augmentation	Aug 21, 2019	Data Augmentationdialog state tracking	—Unverified	0
A Deep Actor-Critic Reinforcement Learning Framework for Dynamic Multichannel Access	Aug 20, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Learning to Sit: Synthesizing Human-Chair Interactions via Hierarchical Control	Aug 20, 2019	Deep Reinforcement LearningHierarchical Reinforcement Learning	—Unverified	0
Reinforcement Learning is not a Causal problem	Aug 20, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
ARAML: A Stable Adversarial Training Framework for Text Generation	Aug 20, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	0
A Domain-Knowledge-Aided Deep Reinforcement Learning Approach for Flight Control Design	Aug 19, 2019	Deep Reinforcement LearningLearning Theory	—Unverified	0
An Autonomous Performance Testing Framework using Self-Adaptive Fuzzy Reinforcement Learning	Aug 19, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	0
A survey on intrinsic motivation in reinforcement learning	Aug 19, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Transfer in Deep Reinforcement Learning using Knowledge Graphs	Aug 19, 2019	Deep Reinforcement LearningKnowledge Graphs	—Unverified	0
Mitigating Multi-Stage Cascading Failure by Reinforcement Learning	Aug 19, 2019	reinforcement-learningReinforcement Learning	—Unverified	0

Show:10 25 50

← PrevPage 242 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified