Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 13701–13750 of 15113 papers

Title	Date	Tasks	Status	Hype
Virtual-Taobao: Virtualizing Real-world Online Retail Environment for Reinforcement Learning	May 25, 2018	Imitation Learningreinforcement-learning	CodeCode Available	0
Myopic Bayesian Design of Experiments via Posterior Sampling and Probabilistic Programming	May 25, 2018	Bayesian InferenceMulti-Armed Bandits	CodeCode Available	0
Reinforced Extractive Summarization with Question-Focused Rewards	May 25, 2018	Extractive Summarizationreinforcement-learning	—Unverified	0
Resource Allocation for a Wireless Coexistence Management System Based on Reinforcement Learning	May 24, 2018	Managementreinforcement-learning	—Unverified	0
Robust Distant Supervision Relation Extraction via Deep Reinforcement Learning	May 24, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Meta-Gradient Reinforcement Learning	May 24, 2018	Meta-Learningreinforcement-learning	CodeCode Available	0
Deep Reinforcement Learning For Sequence to Sequence Models	May 24, 2018	Abstractive Text SummarizationCaption Generation	CodeCode Available	1
A0C: Alpha Zero in Continuous Action Space	May 24, 2018	Board Gamesreinforcement-learning	CodeCode Available	0
Intelligent Trainer for Model-Based Reinforcement Learning	May 24, 2018	modelModel-based Reinforcement Learning	CodeCode Available	0
Discovering Blind Spots in Reinforcement Learning	May 23, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Dyna Planning using a Feature Based Generative Model	May 23, 2018	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Deep Reinforcement Learning of Marked Temporal Point Processes	May 23, 2018	Deep Reinforcement LearningMarketing	CodeCode Available	0
Scalable Coordinated Exploration in Concurrent Reinforcement Learning	May 23, 2018	reinforcement-learningReinforcement Learning	CodeCode Available	0
Reinforcement Learning for Heterogeneous Teams with PALO Bounds	May 23, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
When Simple Exploration is Sample Efficient: Identifying Sufficient Conditions for Random Exploration to Yield PAC RL Algorithms	May 23, 2018	Efficient ExplorationQ-Learning	—Unverified	0
Verifiable Reinforcement Learning via Policy Extraction	May 22, 2018	Deep Reinforcement LearningImitation Learning	CodeCode Available	1
Scalable Centralized Deep Multi-Agent Reinforcement Learning via Policy Gradients	May 22, 2018	Deep Reinforcement LearningDistributed Optimization	—Unverified	0
Guided Feature Transformation (GFT): A Neural Language Grounding Module for Embodied Agents	May 22, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Multi-task Maximum Entropy Inverse Reinforcement Learning	May 22, 2018	Imitation LearningMeta-Learning	CodeCode Available	0
Where Do You Think You're Going?: Inferring Beliefs about Dynamics from Behavior	May 21, 2018	reinforcement-learningReinforcement Learning	CodeCode Available	0
Multiple-Step Greedy Policies in Online and Approximate Reinforcement Learning	May 21, 2018	Model Predictive Controlreinforcement-learning	—Unverified	0
Learning Safe Policies with Expert Guidance	May 21, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Evolution-Guided Policy Gradient in Reinforcement Learning	May 21, 2018	continuous-controlContinuous Control	CodeCode Available	0
Hierarchical Reinforcement Learning with Hindsight	May 21, 2018	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified	0
A General Family of Robust Stochastic Operators for Reinforcement Learning	May 21, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
A Framework and Method for Online Inverse Reinforcement Learning	May 21, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Hierarchically Structured Reinforcement Learning for Topically Coherent Visual Story Generation	May 21, 2018	DecoderDeep Reinforcement Learning	—Unverified	0
Data-Efficient Hierarchical Reinforcement Learning	May 21, 2018	Hierarchical Reinforcement Learningreinforcement-learning	CodeCode Available	0
Learning Real-World Robot Policies by Dreaming	May 20, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
A Lyapunov-based Approach to Safe Reinforcement Learning	May 20, 2018	Decision Makingreinforcement-learning	CodeCode Available	0
Constrained Policy Improvement for Safe and Efficient Reinforcement Learning	May 20, 2018	reinforcement-learningReinforcement Learning	CodeCode Available	0
Unsupervised Video Object Segmentation for Deep Reinforcement Learning	May 20, 2018	Atari GamesDecision Making	CodeCode Available	0
Machine Teaching for Inverse Reinforcement Learning: Algorithms and Applications	May 20, 2018	Decision Makingreinforcement-learning	CodeCode Available	0
Learning to Teach in Cooperative Multiagent Reinforcement Learning	May 20, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Episodic Memory Deep Q-Networks	May 19, 2018	Atari GamesReinforcement Learning	—Unverified	0
Reinforcement Learning of Theorem Proving	May 19, 2018	Automated Theorem Provingreinforcement-learning	—Unverified	0
Hierarchical Reinforcement Learning with Deep Nested Agents	May 18, 2018	Hierarchical Reinforcement LearningMinecraft	—Unverified	0
Improving Image Captioning with Conditional Generative Adversarial Nets	May 18, 2018	DecoderImage Captioning	CodeCode Available	0
Solving the Rubik's Cube Without Human Knowledge	May 18, 2018	Combinatorial OptimizationDeep Reinforcement Learning	CodeCode Available	0
Two geometric input transformation methods for fast online reinforcement learning with neural nets	May 18, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Evolutionary RL for Container Loading	May 17, 2018	Combinatorial OptimizationReinforcement Learning	—Unverified	0
Language Expansion In Text-Based Games	May 17, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Deep Reinforcement Learning for Resource Management in Network Slicing	May 17, 2018	Deep Reinforcement LearningManagement	—Unverified	0
Learning Time-Sensitive Strategies in Space Fortress	May 17, 2018	Atari GamesReinforcement Learning	CodeCode Available	0
FollowNet: Robot Navigation by Following Natural Language Directions with Deep Reinforcement Learning	May 16, 2018	Deep Reinforcement LearningNavigate	—Unverified	0
Optimized Computation Offloading Performance in Virtual Edge Computing Systems via Deep Reinforcement Learning	May 16, 2018	Deep Reinforcement LearningEdge-computing	—Unverified	0
Fast Retinomorphic Event Stream for Video Recognition and Reinforcement Learning	May 16, 2018	Action RecognitionAtari Games	—Unverified	0
Feedback-Based Tree Search for Reinforcement Learning	May 15, 2018	AI AgentModel-based Reinforcement Learning	—Unverified	0
Graph Signal Sampling via Reinforcement Learning	May 15, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Leveraging human knowledge in tabular reinforcement learning: A study of human subjects	May 15, 2018	reinforcement-learningReinforcement Learning	—Unverified	0

Show:10 25 50

← PrevPage 275 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified