Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 13401–13450 of 15113 papers

Title	Date	Tasks	Status
Investigating Enactive Learning for Autonomous Intelligent Agents	Oct 9, 2018	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Continual State Representation Learning for Reinforcement Learning using Generative Replay	Oct 9, 2018	Change Detectionreinforcement-learning	—Unverified
Distributed Wildfire Surveillance with Autonomous Aircraft using Deep Reinforcement Learning	Oct 9, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
Actor-Critic Deep Reinforcement Learning for Dynamic Multichannel Access	Oct 8, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
Multi-agent Deep Reinforcement Learning for Zero Energy Communities	Oct 8, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
SFV: Reinforcement Learning of Physical Skills from Videos	Oct 8, 2018	Deep Reinforcement LearningPose Estimation	CodeCode Available
Reinforcement Evolutionary Learning Method for self-learning	Oct 7, 2018	Incremental LearningMarketing	—Unverified
Scaling All-Goals Updates in Reinforcement Learning Using Convolutional Neural Networks	Oct 6, 2018	AllMontezuma's Revenge	CodeCode Available
PPO-CMA: Proximal Policy Optimization with Covariance Matrix Adaptation	Oct 5, 2018	continuous-controlContinuous Control	CodeCode Available
MyCaffe: A Complete C# Re-Write of Caffe with Reinforcement Learning	Oct 4, 2018	Deep Learningreinforcement-learning	CodeCode Available
Learning Scheduling Algorithms for Data Processing Clusters	Oct 3, 2018	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Deep Reinforcement Learning for Time Scheduling in RF-Powered Backscatter Cognitive Radio Networks	Oct 3, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
Comparison of Reinforcement Learning algorithms applied to the Cart Pole problem	Oct 3, 2018	reinforcement-learningReinforcement Learning	CodeCode Available
Efficient Dialog Policy Learning via Positive Memory Retention	Oct 2, 2018	Goal-Oriented DialogObject Discovery	CodeCode Available
Energy-Based Hindsight Experience Prioritization	Oct 2, 2018	reinforcement-learningReinforcement Learning	CodeCode Available
EMI: Exploration with Mutual Information	Oct 2, 2018	continuous-controlContinuous Control	CodeCode Available
Near-Optimal Representation Learning for Hierarchical Reinforcement Learning	Oct 2, 2018	2D Human Pose Estimationcontinuous-control	CodeCode Available
The Dreaming Variational Autoencoder for Reinforcement Learning Environments	Oct 2, 2018	Managementreinforcement-learning	CodeCode Available
Reinforcement Learning with Perturbed Rewards	Oct 2, 2018	Atari GamesDeep Reinforcement Learning	CodeCode Available
Prediction Improves Simultaneous Neural Machine Translation	Oct 1, 2018	Machine TranslationPrediction	—Unverified
SmartChoices: Hybridizing Programming and Machine Learning	Oct 1, 2018	BIG-bench Machine LearningReinforcement Learning	—Unverified
Automatic Essay Scoring Incorporating Rating Schema via Reinforcement Learning	Oct 1, 2018	Machine Translationreinforcement-learning	—Unverified
Autonomous Sub-domain Modeling for Dialogue Policy with Hierarchical Deep Reinforcement Learning	Oct 1, 2018	Deep Reinforcement LearningHierarchical Reinforcement Learning	—Unverified
A Teacher-Student Framework for Maintainable Dialog Manager	Oct 1, 2018	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Curriculum Learning Based on Reward Sparseness for Deep Reinforcement Learning of Task Completion Dialogue Management	Oct 1, 2018	Deep Reinforcement LearningDialogue Management	—Unverified
Logician and Orator: Learning from the Duality between Language and Knowledge in Open Domain	Oct 1, 2018	Open Information Extractionreinforcement-learning	—Unverified
Adaptive Multi-pass Decoder for Neural Machine Translation	Oct 1, 2018	DecoderMachine Translation	—Unverified
Automatic Poetry Generation with Mutual Reinforcement Learning	Oct 1, 2018	reinforcement-learningReinforcement Learning	—Unverified
Bayesian Transfer Reinforcement Learning with Prior Knowledge Rules	Sep 30, 2018	reinforcement-learningReinforcement Learning	—Unverified
Deep Quality-Value (DQV) Learning	Sep 30, 2018	Atari GamesDeep Reinforcement Learning	CodeCode Available
Few-Shot Goal Inference for Visuomotor Learning and Planning	Sep 30, 2018	reinforcement-learningReinforcement Learning	—Unverified
Learning to Perform Local Rewriting for Combinatorial Optimization	Sep 30, 2018	Combinatorial OptimizationReinforcement Learning	CodeCode Available
Using State Predictions for Value Regularization in Curiosity Driven Deep Reinforcement Learning	Sep 30, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Reinforcement Learning in R	Sep 29, 2018	Q-Learningreinforcement-learning	—Unverified
M^3RL: Mind-aware Multi-agent Management Reinforcement Learning	Sep 29, 2018	ManagementMulti-agent Reinforcement Learning	CodeCode Available
Generalization and Regularization in DQN	Sep 29, 2018	Atari GamesBenchmarking	CodeCode Available
Direct optimization of F-measure for retrieval-based personal question answering	Sep 28, 2018	Question Answeringreinforcement-learning	—Unverified
Robot Representation and Reasoning with Knowledge from Reinforcement Learning	Sep 28, 2018	reinforcement-learningReinforcement Learning	—Unverified
Transfer Value or Policy? A Value-centric Framework Towards Transferrable Continuous Reinforcement Learning	Sep 27, 2018	continuous-controlContinuous Control	—Unverified
Towards More Theoretically-Grounded Particle Optimization Sampling for Deep Learning	Sep 27, 2018	Deep LearningDeep Reinforcement Learning	—Unverified
Mimicking actions is a good strategy for beginners: Fast Reinforcement Learning with Expert Action Sequences	Sep 27, 2018	Atari GamesImitation Learning	—Unverified
What Would pi* Do?: Imitation Learning via Off-Policy Reinforcement Learning	Sep 27, 2018	Imitation LearningQ-Learning	—Unverified
Where Off-Policy Deep Reinforcement Learning Fails	Sep 27, 2018	continuous-controlContinuous Control	—Unverified
Successor Options : An Option Discovery Algorithm for Reinforcement Learning	Sep 27, 2018	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified
The wisdom of the crowd: reliable deep reinforcement learning through ensembles of Q-functions	Sep 27, 2018	Deep Reinforcement LearningPolicy Gradient Methods	—Unverified
Policy Generalization In Capacity-Limited Reinforcement Learning	Sep 27, 2018	reinforcement-learningReinforcement Learning	—Unverified
Shrinkage-based Bias-Variance Trade-off for Deep Reinforcement Learning	Sep 27, 2018	continuous-controlContinuous Control	—Unverified
Unsupervised Exploration with Deep Model-Based Reinforcement Learning	Sep 27, 2018	modelModel-based Reinforcement Learning	—Unverified
Interactive Parallel Exploration for Reinforcement Learning in Continuous Action Spaces	Sep 27, 2018	reinforcement-learningReinforcement Learning	—Unverified
COLLABORATIVE MULTIAGENT REINFORCEMENT LEARNING IN HOMOGENEOUS SWARMS	Sep 27, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 269 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified