Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 13301–13350 of 15113 papers

Title	Date	Tasks	Status	Hype
Actor-Attention-Critic for Multi-Agent Reinforcement Learning	Oct 5, 2018	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
MyCaffe: A Complete C# Re-Write of Caffe with Reinforcement Learning	Oct 4, 2018	Deep Learningreinforcement-learning	CodeCode Available	0
Deep Reinforcement Learning for Time Scheduling in RF-Powered Backscatter Cognitive Radio Networks	Oct 3, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Learning Scheduling Algorithms for Data Processing Clusters	Oct 3, 2018	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	0
Comparison of Reinforcement Learning algorithms applied to the Cart Pole problem	Oct 3, 2018	reinforcement-learningReinforcement Learning	CodeCode Available	0
Efficient Dialog Policy Learning via Positive Memory Retention	Oct 2, 2018	Goal-Oriented DialogObject Discovery	CodeCode Available	0
Energy-Based Hindsight Experience Prioritization	Oct 2, 2018	reinforcement-learningReinforcement Learning	CodeCode Available	0
EMI: Exploration with Mutual Information	Oct 2, 2018	continuous-controlContinuous Control	CodeCode Available	0
Near-Optimal Representation Learning for Hierarchical Reinforcement Learning	Oct 2, 2018	2D Human Pose Estimationcontinuous-control	CodeCode Available	0
The Dreaming Variational Autoencoder for Reinforcement Learning Environments	Oct 2, 2018	Managementreinforcement-learning	CodeCode Available	0
Reinforcement Learning with Perturbed Rewards	Oct 2, 2018	Atari GamesDeep Reinforcement Learning	CodeCode Available	0
Autonomous Sub-domain Modeling for Dialogue Policy with Hierarchical Deep Reinforcement Learning	Oct 1, 2018	Deep Reinforcement LearningHierarchical Reinforcement Learning	—Unverified	0
Curriculum Learning Based on Reward Sparseness for Deep Reinforcement Learning of Task Completion Dialogue Management	Oct 1, 2018	Deep Reinforcement LearningDialogue Management	—Unverified	0
Automatic Poetry Generation with Mutual Reinforcement Learning	Oct 1, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Automatic Essay Scoring Incorporating Rating Schema via Reinforcement Learning	Oct 1, 2018	Machine Translationreinforcement-learning	—Unverified	0
A Teacher-Student Framework for Maintainable Dialog Manager	Oct 1, 2018	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Adaptive Multi-pass Decoder for Neural Machine Translation	Oct 1, 2018	DecoderMachine Translation	—Unverified	0
Logician and Orator: Learning from the Duality between Language and Knowledge in Open Domain	Oct 1, 2018	Open Information Extractionreinforcement-learning	—Unverified	0
Prediction Improves Simultaneous Neural Machine Translation	Oct 1, 2018	Machine TranslationPrediction	—Unverified	0
SmartChoices: Hybridizing Programming and Machine Learning	Oct 1, 2018	BIG-bench Machine LearningReinforcement Learning	—Unverified	0
Using State Predictions for Value Regularization in Curiosity Driven Deep Reinforcement Learning	Sep 30, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Learning to Perform Local Rewriting for Combinatorial Optimization	Sep 30, 2018	Combinatorial OptimizationReinforcement Learning	CodeCode Available	0
Deep Quality-Value (DQV) Learning	Sep 30, 2018	Atari GamesDeep Reinforcement Learning	CodeCode Available	0
Bayesian Transfer Reinforcement Learning with Prior Knowledge Rules	Sep 30, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Few-Shot Goal Inference for Visuomotor Learning and Planning	Sep 30, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Generalization and Regularization in DQN	Sep 29, 2018	Atari GamesBenchmarking	CodeCode Available	0
Reinforcement Learning in R	Sep 29, 2018	Q-Learningreinforcement-learning	—Unverified	0
M^3RL: Mind-aware Multi-agent Management Reinforcement Learning	Sep 29, 2018	ManagementMulti-agent Reinforcement Learning	CodeCode Available	0
Direct optimization of F-measure for retrieval-based personal question answering	Sep 28, 2018	Question Answeringreinforcement-learning	—Unverified	0
Robot Representation and Reasoning with Knowledge from Reinforcement Learning	Sep 28, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Policy Generalization In Capacity-Limited Reinforcement Learning	Sep 27, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Where Off-Policy Deep Reinforcement Learning Fails	Sep 27, 2018	continuous-controlContinuous Control	—Unverified	0
Successor Options : An Option Discovery Algorithm for Reinforcement Learning	Sep 27, 2018	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified	0
What Would pi* Do?: Imitation Learning via Off-Policy Reinforcement Learning	Sep 27, 2018	Imitation LearningQ-Learning	—Unverified	0
Shrinkage-based Bias-Variance Trade-off for Deep Reinforcement Learning	Sep 27, 2018	continuous-controlContinuous Control	—Unverified	0
Transfer Value or Policy? A Value-centric Framework Towards Transferrable Continuous Reinforcement Learning	Sep 27, 2018	continuous-controlContinuous Control	—Unverified	0
Mimicking actions is a good strategy for beginners: Fast Reinforcement Learning with Expert Action Sequences	Sep 27, 2018	Atari GamesImitation Learning	—Unverified	0
Learning Physics Priors for Deep Reinforcement Learing	Sep 27, 2018	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Exploration by Uncertainty in Reward Space	Sep 27, 2018	Atari GamesEfficient Exploration	—Unverified	0
COLLABORATIVE MULTIAGENT REINFORCEMENT LEARNING IN HOMOGENEOUS SWARMS	Sep 27, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
A Better Baseline for Second Order Gradient Estimation in Stochastic Computation Graphs	Sep 27, 2018	Meta-LearningMulti-agent Reinforcement Learning	—Unverified	0
Countering Language Drift via Grounding	Sep 27, 2018	Language ModelingLanguage Modelling	—Unverified	0
Deep Reinforcement Learning of Universal Policies with Diverse Environment Summaries	Sep 27, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Guided Exploration in Deep Reinforcement Learning	Sep 27, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
DEEP ADVERSARIAL FORWARD MODEL	Sep 27, 2018	Image Generationmodel	—Unverified	0
Distilled Agent DQN for Provable Adversarial Robustness	Sep 27, 2018	Adversarial Robustnessreinforcement-learning	—Unverified	0
Constraining Action Sequences with Formal Languages for Deep Reinforcement Learning	Sep 27, 2018	Atari GamesDeep Reinforcement Learning	—Unverified	0
Hybrid Policies Using Inverse Rewards for Reinforcement Learning	Sep 27, 2018	OpenAI GymQ-Learning	—Unverified	0
Accelerated Value Iteration via Anderson Mixing	Sep 27, 2018	Atari GamesQ-Learning	—Unverified	0
Convergent Reinforcement Learning with Function Approximation: A Bilevel Optimization Perspective	Sep 27, 2018	Bilevel OptimizationQ-Learning	—Unverified	0

Show:10 25 50

← PrevPage 267 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified