Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 13051–13100 of 15113 papers

Title	Date	Tasks	Status
Total stochastic gradient algorithms and applications in reinforcement learning	Feb 5, 2019	Density Estimationreinforcement-learning	—Unverified
Learning to Schedule Communication in Multi-agent Reinforcement Learning	Feb 5, 2019	Deep Reinforcement LearningMulti-agent Reinforcement Learning	CodeCode Available
AlphaStar: An Evolutionary Computation Perspective	Feb 5, 2019	DiversityReinforcement Learning	—Unverified
Interactively shaping robot behaviour with unlabeled human instructions	Feb 5, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Adaptive Stress Testing for Autonomous Vehicles	Feb 5, 2019	Autonomous VehiclesDecision Making	—Unverified
The Natural Language of Actions	Feb 4, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
PIPPS: Flexible Model-Based Policy Search Robust to the Curse of Chaos	Feb 4, 2019	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available
Value-aware Recommendation based on Reinforced Profit Maximization in E-commerce Systems	Feb 3, 2019	Recommendation Systemsreinforcement-learning	—Unverified
A Meta-MDP Approach to Exploration for Lifelong Reinforcement Learning	Feb 3, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Learning User Preferences via Reinforcement Learning with Spatial Interface Valuing	Feb 2, 2019	BIG-bench Machine Learningreinforcement-learning	—Unverified
When Collaborative Filtering Meets Reinforcement Learning	Feb 2, 2019	Collaborative FilteringInteractive Recommendation	—Unverified
Non-asymptotic Analysis of Biased Stochastic Approximation Scheme	Feb 2, 2019	reinforcement-learningReinforcement Learning	—Unverified
Policy Consolidation for Continual Reinforcement Learning	Feb 1, 2019	Continual Learningcontinuous-control	CodeCode Available
Visual Rationalizations in Deep Reinforcement Learning for Atari Games	Feb 1, 2019	Atari GamesDecision Making	—Unverified
Privacy Preserving Off-Policy Evaluation	Feb 1, 2019	Off-policy evaluationPrivacy Preserving	—Unverified
Learning Action Representations for Reinforcement Learning	Feb 1, 2019	reinforcement-learningReinforcement Learning	—Unverified
Competitive Experience Replay	Feb 1, 2019	reinforcement-learningReinforcement Learning	—Unverified
Joint Entity Linking with Deep Reinforcement Learning	Feb 1, 2019	Deep Reinforcement LearningEntity Disambiguation	—Unverified
An Optimization Framework for Task Sequencing in Curriculum Learning	Jan 31, 2019	reinforcement-learningReinforcement Learning	—Unverified
A Geometric Perspective on Optimal Representations for Reinforcement Learning	Jan 31, 2019	reinforcement-learningReinforcement Learning	—Unverified
Contrasting Exploration in Parameter and Action Space: A Zeroth-Order Optimization Perspective	Jan 31, 2019	continuous-controlContinuous Control	CodeCode Available
Tsallis Reinforcement Learning: A Unified Framework for Maximum Entropy Reinforcement Learning	Jan 31, 2019	MuJoCoreinforcement-learning	—Unverified
Successor Features Combine Elements of Model-Free and Model-based Reinforcement Learning	Jan 31, 2019	Decision Makingmodel	—Unverified
The Value Function Polytope in Reinforcement Learning	Jan 31, 2019	reinforcement-learningReinforcement Learning	—Unverified
Addressing Sample Complexity in Visual Tasks Using HER and Hallucinatory GANs	Jan 31, 2019	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Probability Functional Descent: A Unifying Perspective on GANs, Variational Inference, and Reinforcement Learning	Jan 30, 2019	BIG-bench Machine Learningreinforcement-learning	—Unverified
Transfer in Deep Reinforcement Learning Using Successor Features and Generalised Policy Improvement	Jan 30, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Privacy-preserving Q-Learning with Functional Noise in Continuous State Spaces	Jan 30, 2019	Privacy PreservingQ-Learning	CodeCode Available
A Comparative Analysis of Expected and Distributional Reinforcement Learning	Jan 30, 2019	Distributional Reinforcement Learningreinforcement-learning	—Unverified
A Regulation Enforcement Solution for Multi-agent Reinforcement Learning	Jan 29, 2019	AI AgentManagement	—Unverified
Self-organization of action hierarchy and compositionality by reinforcement learning with recurrent neural networks	Jan 29, 2019	continuous-controlContinuous Control	CodeCode Available
Multi-Agent Reinforcement Learning with Multi-Step Generative Models	Jan 29, 2019	continuous-controlContinuous Control	—Unverified
Safe, Efficient, and Comfortable Velocity Control based on Reinforcement Learning for Autonomous Driving	Jan 29, 2019	Autonomous DrivingDeep Reinforcement Learning	CodeCode Available
Trust Region-Guided Proximal Policy Optimization	Jan 29, 2019	Deep Reinforcement LearningReinforcement Learning	CodeCode Available
Designing a Multi-Objective Reward Function for Creating Teams of Robotic Bodyguards Using Deep Reinforcement Learning	Jan 28, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
CLIC: Curriculum Learning and Imitation for object Control in non-rewarding environments	Jan 28, 2019	reinforcement-learningReinforcement Learning	—Unverified
Off-Policy Deep Reinforcement Learning by Bootstrapping the Covariate Shift	Jan 27, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Value Propagation for Decentralized Networked Deep Multi-agent Reinforcement Learning	Jan 27, 2019	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Reward Shaping via Meta-Learning	Jan 27, 2019	Meta-LearningReinforcement Learning	—Unverified
Probabilistic Recursive Reasoning for Multi-Agent Reinforcement Learning	Jan 26, 2019	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Action Robust Reinforcement Learning and Applications in Continuous Control	Jan 26, 2019	continuous-controlContinuous Control	CodeCode Available
Emergent Linguistic Phenomena in Multi-Agent Communication Games	Jan 25, 2019	Deep Reinforcement LearningReinforcement Learning	CodeCode Available
Model-based Deep Reinforcement Learning for Dynamic Portfolio Optimization	Jan 25, 2019	Data AugmentationDeep Reinforcement Learning	—Unverified
Sample Complexity of Estimating the Policy Gradient for Nearly Deterministic Dynamical Systems	Jan 24, 2019	reinforcement-learningReinforcement Learning	—Unverified
Federated Deep Reinforcement Learning	Jan 24, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Feudal Multi-Agent Hierarchies for Cooperative Reinforcement Learning	Jan 24, 2019	reinforcement-learningReinforcement Learning	—Unverified
Dynamic Measurement Scheduling for Event Forecasting using Deep RL	Jan 24, 2019	Deep Reinforcement LearningICU Mortality	CodeCode Available
Decoupling feature extraction from policy learning: assessing benefits of state representation learning in goal based robotics	Jan 24, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Hierarchical Reinforcement Learning for Multi-agent MOBA Game	Jan 23, 2019	Hierarchical Reinforcement LearningImitation Learning	—Unverified
Distillation Strategies for Proximal Policy Optimization	Jan 23, 2019	Deep Reinforcement LearningQ-Learning	—Unverified

Show:10 25 50

← PrevPage 262 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified