Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 13801–13850 of 15113 papers

Title	Date	Tasks	Status
Dyna Planning using a Feature Based Generative Model	May 23, 2018	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Deep Reinforcement Learning of Marked Temporal Point Processes	May 23, 2018	Deep Reinforcement LearningMarketing	CodeCode Available
Discovering Blind Spots in Reinforcement Learning	May 23, 2018	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning for Heterogeneous Teams with PALO Bounds	May 23, 2018	reinforcement-learningReinforcement Learning	—Unverified
Scalable Coordinated Exploration in Concurrent Reinforcement Learning	May 23, 2018	reinforcement-learningReinforcement Learning	CodeCode Available
When Simple Exploration is Sample Efficient: Identifying Sufficient Conditions for Random Exploration to Yield PAC RL Algorithms	May 23, 2018	Efficient ExplorationQ-Learning	—Unverified
Multi-task Maximum Entropy Inverse Reinforcement Learning	May 22, 2018	Imitation LearningMeta-Learning	CodeCode Available
Scalable Centralized Deep Multi-Agent Reinforcement Learning via Policy Gradients	May 22, 2018	Deep Reinforcement LearningDistributed Optimization	—Unverified
Guided Feature Transformation (GFT): A Neural Language Grounding Module for Embodied Agents	May 22, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Data-Efficient Hierarchical Reinforcement Learning	May 21, 2018	Hierarchical Reinforcement Learningreinforcement-learning	CodeCode Available
A General Family of Robust Stochastic Operators for Reinforcement Learning	May 21, 2018	reinforcement-learningReinforcement Learning	—Unverified
Evolution-Guided Policy Gradient in Reinforcement Learning	May 21, 2018	continuous-controlContinuous Control	CodeCode Available
Learning Safe Policies with Expert Guidance	May 21, 2018	reinforcement-learningReinforcement Learning	—Unverified
A Framework and Method for Online Inverse Reinforcement Learning	May 21, 2018	reinforcement-learningReinforcement Learning	—Unverified
Hierarchically Structured Reinforcement Learning for Topically Coherent Visual Story Generation	May 21, 2018	DecoderDeep Reinforcement Learning	—Unverified
Hierarchical Reinforcement Learning with Hindsight	May 21, 2018	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified
Multiple-Step Greedy Policies in Online and Approximate Reinforcement Learning	May 21, 2018	Model Predictive Controlreinforcement-learning	—Unverified
Where Do You Think You're Going?: Inferring Beliefs about Dynamics from Behavior	May 21, 2018	reinforcement-learningReinforcement Learning	CodeCode Available
Unsupervised Video Object Segmentation for Deep Reinforcement Learning	May 20, 2018	Atari GamesDecision Making	CodeCode Available
Machine Teaching for Inverse Reinforcement Learning: Algorithms and Applications	May 20, 2018	Decision Makingreinforcement-learning	CodeCode Available
Constrained Policy Improvement for Safe and Efficient Reinforcement Learning	May 20, 2018	reinforcement-learningReinforcement Learning	CodeCode Available
Learning to Teach in Cooperative Multiagent Reinforcement Learning	May 20, 2018	reinforcement-learningReinforcement Learning	—Unverified
A Lyapunov-based Approach to Safe Reinforcement Learning	May 20, 2018	Decision Makingreinforcement-learning	CodeCode Available
Learning Real-World Robot Policies by Dreaming	May 20, 2018	reinforcement-learningReinforcement Learning	—Unverified
Episodic Memory Deep Q-Networks	May 19, 2018	Atari GamesReinforcement Learning	—Unverified
Reinforcement Learning of Theorem Proving	May 19, 2018	Automated Theorem Provingreinforcement-learning	—Unverified
Solving the Rubik's Cube Without Human Knowledge	May 18, 2018	Combinatorial OptimizationDeep Reinforcement Learning	CodeCode Available
Two geometric input transformation methods for fast online reinforcement learning with neural nets	May 18, 2018	reinforcement-learningReinforcement Learning	—Unverified
Improving Image Captioning with Conditional Generative Adversarial Nets	May 18, 2018	DecoderImage Captioning	CodeCode Available
Hierarchical Reinforcement Learning with Deep Nested Agents	May 18, 2018	Hierarchical Reinforcement LearningMinecraft	—Unverified
Evolutionary RL for Container Loading	May 17, 2018	Combinatorial OptimizationReinforcement Learning	—Unverified
Learning Time-Sensitive Strategies in Space Fortress	May 17, 2018	Atari GamesReinforcement Learning	CodeCode Available
Language Expansion In Text-Based Games	May 17, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
Deep Reinforcement Learning for Resource Management in Network Slicing	May 17, 2018	Deep Reinforcement LearningManagement	—Unverified
Fast Retinomorphic Event Stream for Video Recognition and Reinforcement Learning	May 16, 2018	Action RecognitionAtari Games	—Unverified
FollowNet: Robot Navigation by Following Natural Language Directions with Deep Reinforcement Learning	May 16, 2018	Deep Reinforcement LearningNavigate	—Unverified
Optimized Computation Offloading Performance in Virtual Edge Computing Systems via Deep Reinforcement Learning	May 16, 2018	Deep Reinforcement LearningEdge-computing	—Unverified
The Hierarchical Adaptive Forgetting Variational Filter	May 15, 2018	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Leveraging human knowledge in tabular reinforcement learning: A study of human subjects	May 15, 2018	reinforcement-learningReinforcement Learning	—Unverified
Do deep reinforcement learning agents model intentions?	May 15, 2018	Deep Reinforcement Learningmodel	CodeCode Available
Graph Signal Sampling via Reinforcement Learning	May 15, 2018	reinforcement-learningReinforcement Learning	—Unverified
Feedback-Based Tree Search for Reinforcement Learning	May 15, 2018	AI AgentModel-based Reinforcement Learning	—Unverified
Unpaired Sentiment-to-Sentiment Translation: A Cycled Reinforcement Learning Approach	May 14, 2018	reinforcement-learningReinforcement Learning	CodeCode Available
GAN Q-learning	May 13, 2018	Distributional Reinforcement LearningOpenAI Gym	CodeCode Available
Low-pass Recurrent Neural Networks - A memory architecture for longer-term correlation discovery	May 13, 2018	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Generating Rescheduling Knowledge using Reinforcement Learning in a Cognitive Architecture	May 12, 2018	reinforcement-learningReinforcement Learning	—Unverified
Towards Autonomous Reinforcement Learning: Automatic Setting of Hyper-parameters using Bayesian Optimization	May 12, 2018	Bayesian Optimizationreinforcement-learning	—Unverified
Deep Hierarchical Reinforcement Learning Algorithm in Partially Observable Markov Decision Processes	May 11, 2018	Deep Reinforcement LearningHierarchical Reinforcement Learning	—Unverified
Interactive Reinforcement Learning with Dynamic Reuse of Prior Knowledge from Human/Agent's Demonstration	May 11, 2018	reinforcement-learningReinforcement Learning	—Unverified
Leveraging Grammar and Reinforcement Learning for Neural Program Synthesis	May 11, 2018	Machine TranslationProgram Synthesis	—Unverified

Show:10 25 50

← PrevPage 277 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified