Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 13751–13800 of 15113 papers

Title	Date	Tasks	Status	Hype
The Hierarchical Adaptive Forgetting Variational Filter	May 15, 2018	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Do deep reinforcement learning agents model intentions?	May 15, 2018	Deep Reinforcement Learningmodel	CodeCode Available	0
Unpaired Sentiment-to-Sentiment Translation: A Cycled Reinforcement Learning Approach	May 14, 2018	reinforcement-learningReinforcement Learning	CodeCode Available	0
Low-pass Recurrent Neural Networks - A memory architecture for longer-term correlation discovery	May 13, 2018	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
GAN Q-learning	May 13, 2018	Distributional Reinforcement LearningOpenAI Gym	CodeCode Available	0
Generating Rescheduling Knowledge using Reinforcement Learning in a Cognitive Architecture	May 12, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Towards Autonomous Reinforcement Learning: Automatic Setting of Hyper-parameters using Bayesian Optimization	May 12, 2018	Bayesian Optimizationreinforcement-learning	—Unverified	0
Interactive Reinforcement Learning with Dynamic Reuse of Prior Knowledge from Human/Agent's Demonstration	May 11, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Deep Hierarchical Reinforcement Learning Algorithm in Partially Observable Markov Decision Processes	May 11, 2018	Deep Reinforcement LearningHierarchical Reinforcement Learning	—Unverified	0
Leveraging Grammar and Reinforcement Learning for Neural Program Synthesis	May 11, 2018	Machine TranslationProgram Synthesis	—Unverified	0
Discourse-Aware Neural Rewards for Coherent Text Generation	May 10, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Deep Reinforcement Learning for Optimal Control of Space Heating	May 10, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
End-to-End Reinforcement Learning for Automatic Taxonomy Induction	May 10, 2018	reinforcement-learningReinforcement Learning	CodeCode Available	0
Metatrace Actor-Critic: Online Step-size Tuning by Meta-gradient Descent for Reinforcement Learning Control	May 10, 2018	Atari GamesMeta-Learning	—Unverified	0
Reward Estimation for Variance Reduction in Deep Reinforcement Learning	May 9, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Multimodal Hierarchical Reinforcement Learning Policy for Task-Oriented Visual Dialog	May 8, 2018	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified	0
FFNet: Video Fast-Forwarding via Reinforcement Learning	May 8, 2018	reinforcement-learningReinforcement Learning	CodeCode Available	0
Deep Reinforcement Learning for Page-wise Recommendations	May 7, 2018	Deep Reinforcement LearningRecommendation Systems	—Unverified	0
Multimodal Machine Translation with Reinforcement Learning	May 7, 2018	Image DescriptionMachine Translation	—Unverified	0
Planning and Learning with Stochastic Action Sets	May 7, 2018	Q-LearningReinforcement Learning	—Unverified	0
Deep Reinforcement Learning for Playing 2.5D Fighting Games	May 5, 2018	Deep Reinforcement LearningOpenAI Gym	CodeCode Available	0
Developing parsimonious ensembles using ensemble diversity within a reinforcement learning framework	May 5, 2018	Diversityreinforcement-learning	—Unverified	0
Exploration by Distributional Reinforcement Learning	May 4, 2018	Deep Reinforcement LearningDistributional Reinforcement Learning	—Unverified	0
Motion Planning Among Dynamic, Decision-Making Agents with Deep Reinforcement Learning	May 4, 2018	Collision AvoidanceDecision Making	CodeCode Available	0
VINE: An Open Source Interactive Data Visualization Tool for Neuroevolution	May 3, 2018	Data VisualizationEvolutionary Algorithms	CodeCode Available	0
A Reinforcement Learning Approach to Interactive-Predictive Neural Machine Translation	May 3, 2018	Machine Translationreinforcement-learning	CodeCode Available	0
Robust Deep Reinforcement Learning for Security and Safety in Autonomous Vehicle Systems	May 2, 2018	Autonomous VehiclesDeep Reinforcement Learning	—Unverified	0
Reinforcement Learning and Control as Probabilistic Inference: Tutorial and Review	May 2, 2018	Decision Makingreinforcement-learning	CodeCode Available	1
Robust Log-Optimal Strategy with Reinforcement Learning	May 1, 2018	Managementreinforcement-learning	—Unverified	0
Falsification of Cyber-Physical Systems Using Deep Reinforcement Learning	May 1, 2018	Deep Reinforcement LearningDistributed Computing	—Unverified	0
Dialog-based Interactive Image Retrieval	May 1, 2018	Image Retrievalreinforcement-learning	CodeCode Available	0
Toward Diverse Text Generation with Inverse Reinforcement Learning	Apr 30, 2018	reinforcement-learningReinforcement Learning	CodeCode Available	1
Towards Experienced Anomaly Detector through Reinforcement Learning	Apr 29, 2018	Anomaly Detectionreinforcement-learning	—Unverified	0
Generating Interpretable Fuzzy Controllers using Particle Swarm Optimization and Genetic Programming	Apr 29, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
From Credit Assignment to Entropy Regularization: Two New Algorithms for Neural Sequence Prediction	Apr 29, 2018	Predictionreinforcement-learning	CodeCode Available	0
A Tree Search Algorithm for Sequence Labeling	Apr 29, 2018	ChunkingDecision Making	CodeCode Available	0
Sentiment Adaptive End-to-End Dialog Systems	Apr 28, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Deep Reinforcement Learning to Acquire Navigation Skills for Wheel-Legged Robots in Complex Environments	Apr 27, 2018	Deep Reinforcement LearningNavigate	—Unverified	0
Decoupling Dynamics and Reward for Transfer Learning	Apr 27, 2018	reinforcement-learningReinforcement Learning	CodeCode Available	0
Action Categorization for Computationally Improved Task Learning and Planning	Apr 26, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Multiagent Soft Q-Learning	Apr 25, 2018	Policy Gradient MethodsQ-Learning	—Unverified	0
Towards Symbolic Reinforcement Learning with Common Sense	Apr 23, 2018	Common Sense ReasoningDeep Reinforcement Learning	CodeCode Available	0
Distributed Distributional Deterministic Policy Gradients	Apr 23, 2018	continuous-controlContinuous Control	CodeCode Available	0
Benchmarking projective simulation in navigation problems	Apr 23, 2018	BenchmarkingQ-Learning	—Unverified	0
Crawling in Rogue's dungeons with (partitioned) A3C	Apr 23, 2018	reinforcement-learningReinforcement Learning	CodeCode Available	0
MQGrad: Reinforcement Learning of Gradient Quantization in Parameter Server	Apr 22, 2018	BIG-bench Machine LearningQuantization	—Unverified	0
Event Extraction with Generative Adversarial Imitation Learning	Apr 21, 2018	Event ExtractionFeature Engineering	—Unverified	0
PEORL: Integrating Symbolic Planning and Hierarchical Reinforcement Learning for Robust Decision-Making	Apr 20, 2018	Decision MakingHierarchical Reinforcement Learning	—Unverified	0
Learning to Extract Coherent Summary via Deep Reinforcement Learning	Apr 19, 2018	Deep Reinforcement LearningExtractive Summarization	—Unverified	0
Disentangling Controllable and Uncontrollable Factors of Variation by Interacting with the World	Apr 19, 2018	Disentanglementreinforcement-learning	—Unverified	0

Show:10 25 50

← PrevPage 276 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified