Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 12651–12700 of 15113 papers

Title	Date	Tasks	Status
Inverse Reinforcement Learning in Contextual MDPs	May 23, 2019	Autonomous Drivingreinforcement-learning	CodeCode Available
From semantics to execution: Integrating action planning with reinforcement learning for robotic causal problem-solving	May 23, 2019	reinforcement-learningReinforcement Learning	—Unverified
Unknown mixing times in apprenticeship and reinforcement learning	May 23, 2019	reinforcement-learningReinforcement Learning	—Unverified
Scene Induced Multi-Modal Trajectory Forecasting via Planning	May 23, 2019	reinforcement-learningReinforcement Learning	—Unverified
Deep Q-Learning with Q-Matrix Transfer Learning for Novel Fire Evacuation Environment	May 23, 2019	OpenAI GymQ-Learning	—Unverified
Estimating Risk and Uncertainty in Deep Reinforcement Learning	May 23, 2019	Bayesian InferenceDeep Reinforcement Learning	CodeCode Available
Hierarchical Reinforcement Learning for Quadruped Locomotion	May 22, 2019	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified
Deep Reinforcement Learning for Detecting Malicious Websites	May 22, 2019	Deep Reinforcement LearningPhishing Website Detection	—Unverified
COBRA: Data-Efficient Model-Based RL through Unsupervised Object Discovery and Curiosity-Driven Exploration	May 22, 2019	continuous-controlContinuous Control	CodeCode Available
Stochastic Inverse Reinforcement Learning	May 21, 2019	reinforcement-learningReinforcement Learning	—Unverified
Perceptual Values from Observation	May 20, 2019	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning without Ground-Truth State	May 20, 2019	reinforcement-learningReinforcement Learning	—Unverified
Stochastic Variance Reduction for Deep Q-learning	May 20, 2019	Deep Reinforcement LearningQ-Learning	—Unverified
A Bayesian Approach to Robust Reinforcement Learning	May 20, 2019	reinforcement-learningReinforcement Learning	—Unverified
Deep Reinforcement Learning Based Parameter Control in Differential Evolution	May 20, 2019	Deep Reinforcement LearningQ-Learning	CodeCode Available
Issues concerning realizability of Blackwell optimal policies in reinforcement learning	May 20, 2019	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning for Learning of Dynamical Systems in Uncertain Environment: a Tutorial	May 19, 2019	Q-Learningreinforcement-learning	—Unverified
Evolving Rewards to Automate Reinforcement Learning	May 18, 2019	continuous-controlContinuous Control	—Unverified
A Regularized Opponent Model with Maximum Entropy Objective	May 17, 2019	modelMulti-agent Reinforcement Learning	CodeCode Available
Deep Reinforcement Learning-Based Channel Allocation for Wireless LANs with Graph Convolutional Networks	May 17, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Enforcing constraints for time series prediction in supervised, unsupervised and reinforcement learning	May 17, 2019	reinforcement-learningReinforcement Learning	—Unverified
Exact-K Recommendation via Maximal Clique Optimization	May 17, 2019	Combinatorial OptimizationDecoder	CodeCode Available
In Support of Over-Parametrization in Deep Reinforcement Learning: an Empirical Study	May 17, 2019	Deep Reinforcement LearningOpenAI Gym	—Unverified
Mastering the Game of Sungka from Random Play	May 17, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
MaMiC: Macro and Micro Curriculum for Robotic Reinforcement Learning	May 17, 2019	reinforcement-learningReinforcement Learning	—Unverified
Stochastically Dominant Distributional Reinforcement Learning	May 17, 2019	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Stratospheric Aerosol Injection as a Deep Reinforcement Learning Problem	May 17, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
TBQ(σ): Improving Efficiency of Trace Utilization for Off-Policy Reinforcement Learning	May 17, 2019	reinforcement-learningReinforcement Learning	—Unverified
Meta Reinforcement Learning with Task Embedding and Shared Policy	May 16, 2019	Deep Reinforcement LearningMeta-Learning	CodeCode Available
Meta-Reinforcement Learning for Adaptive Autonomous Driving	May 16, 2019	Autonomous DrivingMeta Reinforcement Learning	—Unverified
Random Expert Distillation: Imitation Learning via Expert Policy Support Estimation	May 16, 2019	Imitation Learningreinforcement-learning	CodeCode Available
QBSO-FS: A Reinforcement Learning Based Bee Swarm Optimization Metaheuristic for Feature Selection	May 16, 2019	feature selectionMulti-agent Reinforcement Learning	CodeCode Available
Sub-policy Adaptation for Hierarchical Reinforcement Learning	May 16, 2019	Decision MakingHierarchical Reinforcement Learning	—Unverified
Learning Exploration Policies for Model-Agnostic Meta-Reinforcement Learning	May 16, 2019	Efficient ExplorationMeta Reinforcement Learning	—Unverified
Knowledge-Based Sequential Decision-Making Under Uncertainty	May 16, 2019	Decision MakingDecision Making Under Uncertainty	—Unverified
Goal-conditioned Imitation Learning	May 16, 2019	Imitation LearningReinforcement Learning (RL)	—Unverified
Leveraging exploration in off-policy algorithms via normalizing flows	May 16, 2019	continuous-controlContinuous Control	CodeCode Available
Deep Knowledge Based Agent: Learning to do tasks by self-thinking about imaginary worlds	May 16, 2019	Knowledge Base ConstructionMeta-Learning	—Unverified
Autonomous Penetration Testing using Reinforcement Learning	May 15, 2019	Q-Learningreinforcement-learning	—Unverified
Addressing the Loss-Metric Mismatch with Adaptive Loss Alignment	May 15, 2019	General ClassificationMeta-Learning	—Unverified
Deep reinforcement learning for scheduling in large-scale networked control systems	May 15, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Deep Reinforcement Learning for Scheduling in Cellular Networks	May 15, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Expressive Priors in Bayesian Neural Networks: Kernel Combinations and Periodic Functions	May 15, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
A Learning based Branch and Bound for Maximum Common Subgraph Problems	May 15, 2019	reinforcement-learningReinforcement Learning	—Unverified
Meta reinforcement learning as task inference	May 15, 2019	continuous-controlContinuous Control	CodeCode Available
Reinforcement Learning for Robotics and Control with Active Uncertainty Reduction	May 15, 2019	ManagementOpenAI Gym	—Unverified
Variational Regret Bounds for Reinforcement Learning	May 14, 2019	General Reinforcement Learningreinforcement-learning	—Unverified
Trajectory-Based Off-Policy Deep Reinforcement Learning	May 14, 2019	continuous-controlContinuous Control	CodeCode Available
TauRieL: Targeting Traveling Salesman Problem with a deep reinforcement learning inspired architecture	May 14, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Successor Options: An Option Discovery Framework for Reinforcement Learning	May 14, 2019	Navigatereinforcement-learning	CodeCode Available

Show:10 25 50

← PrevPage 254 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified