Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 12501–12550 of 15113 papers

Title	Date	Tasks	Status	Hype
Continual Reinforcement Learning in 3D Non-stationary Environments	May 24, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	0
Automatic Machine Learning by Pipeline Synthesis using Model-Based Reinforcement Learning and a Grammar	May 24, 2019	AutoMLBayesian Optimization	—Unverified	0
Scene Induced Multi-Modal Trajectory Forecasting via Planning	May 23, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
PAC Guarantees for Cooperative Multi-Agent Reinforcement Learning with Restricted Communication	May 23, 2019	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Recurrent Value Functions	May 23, 2019	continuous-controlContinuous Control	—Unverified	0
Population-based Global Optimisation Methods for Learning Long-term Dependencies with RNNs	May 23, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Multi-hop Reading Comprehension via Deep Reinforcement Learning based Document Traversal	May 23, 2019	Decision MakingDeep Reinforcement Learning	CodeCode Available	0
Estimating Risk and Uncertainty in Deep Reinforcement Learning	May 23, 2019	Bayesian InferenceDeep Reinforcement Learning	CodeCode Available	0
From semantics to execution: Integrating action planning with reinforcement learning for robotic causal problem-solving	May 23, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Hierarchical Reinforcement Learning for Concurrent Discovery of Compound and Composable Policies	May 23, 2019	Hierarchical Reinforcement Learningreinforcement-learning	CodeCode Available	0
Unknown mixing times in apprenticeship and reinforcement learning	May 23, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Deep Q-Learning with Q-Matrix Transfer Learning for Novel Fire Evacuation Environment	May 23, 2019	OpenAI GymQ-Learning	—Unverified	0
Inverse Reinforcement Learning in Contextual MDPs	May 23, 2019	Autonomous Drivingreinforcement-learning	CodeCode Available	0
Hierarchical Reinforcement Learning for Quadruped Locomotion	May 22, 2019	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified	0
Deep Reinforcement Learning for Detecting Malicious Websites	May 22, 2019	Deep Reinforcement LearningPhishing Website Detection	—Unverified	0
COBRA: Data-Efficient Model-Based RL through Unsupervised Object Discovery and Curiosity-Driven Exploration	May 22, 2019	continuous-controlContinuous Control	CodeCode Available	0
Stochastic Inverse Reinforcement Learning	May 21, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Maximum Entropy-Regularized Multi-Goal Reinforcement Learning	May 21, 2019	Multi-Goal Reinforcement LearningOpenAI Gym	CodeCode Available	1
Issues concerning realizability of Blackwell optimal policies in reinforcement learning	May 20, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Deep Reinforcement Learning Based Parameter Control in Differential Evolution	May 20, 2019	Deep Reinforcement LearningQ-Learning	CodeCode Available	0
A Bayesian Approach to Robust Reinforcement Learning	May 20, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Stochastic Variance Reduction for Deep Q-learning	May 20, 2019	Deep Reinforcement LearningQ-Learning	—Unverified	0
Reinforcement Learning without Ground-Truth State	May 20, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Perceptual Values from Observation	May 20, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Reinforcement Learning for Learning of Dynamical Systems in Uncertain Environment: a Tutorial	May 19, 2019	Q-Learningreinforcement-learning	—Unverified	0
Evolving Rewards to Automate Reinforcement Learning	May 18, 2019	continuous-controlContinuous Control	—Unverified	0
In Support of Over-Parametrization in Deep Reinforcement Learning: an Empirical Study	May 17, 2019	Deep Reinforcement LearningOpenAI Gym	—Unverified	0
Enforcing constraints for time series prediction in supervised, unsupervised and reinforcement learning	May 17, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
A Regularized Opponent Model with Maximum Entropy Objective	May 17, 2019	modelMulti-agent Reinforcement Learning	CodeCode Available	0
Exact-K Recommendation via Maximal Clique Optimization	May 17, 2019	Combinatorial OptimizationDecoder	CodeCode Available	0
Deep Reinforcement Learning-Based Channel Allocation for Wireless LANs with Graph Convolutional Networks	May 17, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Stratospheric Aerosol Injection as a Deep Reinforcement Learning Problem	May 17, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
TBQ(σ): Improving Efficiency of Trace Utilization for Off-Policy Reinforcement Learning	May 17, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
MaMiC: Macro and Micro Curriculum for Robotic Reinforcement Learning	May 17, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Stochastically Dominant Distributional Reinforcement Learning	May 17, 2019	Distributional Reinforcement Learningreinforcement-learning	—Unverified	0
Mastering the Game of Sungka from Random Play	May 17, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	0
Meta-Reinforcement Learning for Adaptive Autonomous Driving	May 16, 2019	Autonomous DrivingMeta Reinforcement Learning	—Unverified	0
Sub-policy Adaptation for Hierarchical Reinforcement Learning	May 16, 2019	Decision MakingHierarchical Reinforcement Learning	—Unverified	0
Goal-conditioned Imitation Learning	May 16, 2019	Imitation LearningReinforcement Learning (RL)	—Unverified	0
Learning Exploration Policies for Model-Agnostic Meta-Reinforcement Learning	May 16, 2019	Efficient ExplorationMeta Reinforcement Learning	—Unverified	0
Deep Knowledge Based Agent: Learning to do tasks by self-thinking about imaginary worlds	May 16, 2019	Knowledge Base ConstructionMeta-Learning	—Unverified	0
QBSO-FS: A Reinforcement Learning Based Bee Swarm Optimization Metaheuristic for Feature Selection	May 16, 2019	feature selectionMulti-agent Reinforcement Learning	CodeCode Available	0
Meta Reinforcement Learning with Task Embedding and Shared Policy	May 16, 2019	Deep Reinforcement LearningMeta-Learning	CodeCode Available	0
Random Expert Distillation: Imitation Learning via Expert Policy Support Estimation	May 16, 2019	Imitation Learningreinforcement-learning	CodeCode Available	0
Leveraging exploration in off-policy algorithms via normalizing flows	May 16, 2019	continuous-controlContinuous Control	CodeCode Available	0
Knowledge-Based Sequential Decision-Making Under Uncertainty	May 16, 2019	Decision MakingDecision Making Under Uncertainty	—Unverified	0
A Learning based Branch and Bound for Maximum Common Subgraph Problems	May 15, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Autonomous Penetration Testing using Reinforcement Learning	May 15, 2019	Q-Learningreinforcement-learning	—Unverified	0
Addressing the Loss-Metric Mismatch with Adaptive Loss Alignment	May 15, 2019	General ClassificationMeta-Learning	—Unverified	0
Deep Reinforcement Learning for Scheduling in Cellular Networks	May 15, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0

Show:10 25 50

← PrevPage 251 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified