Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11351–11400 of 15113 papers

Title	Date	Tasks	Status	Hype
Exploiting the potential of deep reinforcement learning for classification tasks in high-dimensional and unstructured data	Dec 20, 2019	Deep Reinforcement Learningfeature selection	—Unverified	0
Teaching robots to perceive time -- A reinforcement learning approach (Extended version)	Dec 20, 2019	Gaussian Processesreinforcement-learning	—Unverified	0
Mastering Complex Control in MOBA Games with Deep Reinforcement Learning	Dec 20, 2019	AI AgentDeep Reinforcement Learning	—Unverified	0
Optimizing Collision Avoidance in Dense Airspace using Deep Reinforcement Learning	Dec 20, 2019	Collision AvoidanceDeep Reinforcement Learning	—Unverified	0
Deep Reinforcement Learning for Smart Home Energy Management	Dec 19, 2019	Deep Reinforcement Learningenergy management	—Unverified	0
Extendable NFV-Integrated Control Method Using Reinforcement Learning	Dec 19, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Distributed Reinforcement Learning for Decentralized Linear Quadratic Control: A Derivative-Free Policy Optimization Approach	Dec 19, 2019	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	0
Interestingness Elements for Explainable Reinforcement Learning: Understanding Agents' Capabilities and Limitations	Dec 19, 2019	Diversityreinforcement-learning	CodeCode Available	0
Deep Reinforcement Learning for Motion Planning of Mobile Robots	Dec 19, 2019	Deep Reinforcement LearningMotion Planning	—Unverified	0
Deep Reinforcement Learning Designed Shinnar-Le Roux RF Pulse using Root-Flipping: DeepRF_SLR	Dec 19, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Benchmarking the Neural Linear Model for Regression	Dec 18, 2019	Bayesian OptimizationBenchmarking	—Unverified	0
Learning to grow: control of material self-assembly using evolutionary reinforcement learning	Dec 18, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Analysing Deep Reinforcement Learning Agents Trained with Domain Randomisation	Dec 18, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Distributional Reinforcement Learning for Energy-Based Sequential Models	Dec 18, 2019	Distributional Reinforcement Learningreinforcement-learning	CodeCode Available	0
Taming an autonomous surface vehicle for path following and collision avoidance using deep reinforcement learning	Dec 18, 2019	Collision Avoidancecontinuous-control	—Unverified	0
Unpaired Image Enhancement Featuring Reinforcement-Learning-Controlled Image Editing Software	Dec 17, 2019	Image Enhancementreinforcement-learning	—Unverified	0
MEDIRL: Predicting the Visual Attention of Drivers via Maximum Entropy Deep Inverse Reinforcement Learning	Dec 17, 2019	Autonomous Vehiclesreinforcement-learning	CodeCode Available	0
KARL: Knowledge-Aware Reasoning Memory Modeling with Reinforcement Learning of Vector Space	Dec 16, 2019	DecoderLanguage Modeling	—Unverified	0
Coordination in Adversarial Sequential Team Games via Multi-Agent Deep Reinforcement Learning	Dec 16, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Planning with Abstract Learned Models While Learning Transferable Subtasks	Dec 16, 2019	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified	0
PixelRL: Fully Convolutional Network with Reinforcement Learning for Image Processing	Dec 16, 2019	Deep Reinforcement LearningDenoising	CodeCode Available	0
UNAS: Differentiable Architecture Search Meets Reinforcement Learning	Dec 16, 2019	Neural Architecture Searchreinforcement-learning	CodeCode Available	0
Pseudo Random Number Generation: a Reinforcement Learning approach	Dec 15, 2019	BIG-bench Machine Learningreinforcement-learning	CodeCode Available	1
Fairness in Multi-agent Reinforcement Learning for Stock Trading	Dec 14, 2019	FairnessMulti-agent Reinforcement Learning	—Unverified	0
Bayesian Linear Regression on Deep Representations	Dec 14, 2019	Model-based Reinforcement Learningregression	—Unverified	0
Spatial Influence-aware Reinforcement Learning for Intelligent Transportation System	Dec 14, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Natural Actor-Critic Converges Globally for Hierarchical Linear Quadratic Regulator	Dec 14, 2019	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Resolving Congestions in the Air Traffic Management Domain via Multiagent Reinforcement Learning Methods	Dec 14, 2019	Managementreinforcement-learning	—Unverified	0
More Efficient Off-Policy Evaluation through Regularized Targeted Learning	Dec 13, 2019	Causal InferenceOff-policy evaluation	—Unverified	0
Recruitment-imitation Mechanism for Evolutionary Reinforcement Learning	Dec 13, 2019	continuous-controlContinuous Control	—Unverified	0
Provably Efficient Reinforcement Learning with Aggregated States	Dec 13, 2019	Q-Learningreinforcement-learning	—Unverified	0
Dota 2 with Large Scale Deep Reinforcement Learning	Dec 13, 2019	Deep Reinforcement LearningDota 2	CodeCode Available	0
Lessons from reinforcement learning for biological representations of space	Dec 13, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Improved Activity Forecasting for Generating Trajectories	Dec 12, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Learning to Reach Goals via Iterated Supervised Learning	Dec 12, 2019	Multi-Goal Reinforcement LearningReinforcement Learning	CodeCode Available	0
Control-Tutored Reinforcement Learning	Dec 12, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
The PlayStation Reinforcement Learning Environment (PSXLE)	Dec 12, 2019	OpenAI Gymreinforcement-learning	CodeCode Available	0
Provably Efficient Exploration in Policy Optimization	Dec 12, 2019	Efficient ExplorationReinforcement Learning	—Unverified	0
Text as Environment: A Deep Reinforcement Learning Text Readability Assessment Model	Dec 12, 2019	Deep Reinforcement LearningHard Attention	—Unverified	0
Quality of syntactic implication of RL-based sentence summarization	Dec 11, 2019	POSReinforcement Learning	—Unverified	0
SMiRL: Surprise Minimizing Reinforcement Learning in Unstable Environments	Dec 11, 2019	Navigatereinforcement-learning	CodeCode Available	0
Online Deep Reinforcement Learning for Autonomous UAV Navigation and Exploration of Outdoor Environments	Dec 11, 2019	Deep Reinforcement LearningNavigate	—Unverified	0
Doubly Robust Off-Policy Actor-Critic Algorithms for Reinforcement Learning	Dec 11, 2019	continuous-controlContinuous Control	—Unverified	0
Biases for Emergent Communication in Multi-agent Reinforcement Learning	Dec 11, 2019	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Energy-aware Scheduling of Jobs in Heterogeneous Cluster Systems Using Deep Reinforcement Learning	Dec 11, 2019	Deep Reinforcement LearningManagement	—Unverified	0
Efficient Robotic Task Generalization Using Deep Model Fusion Reinforcement Learning	Dec 11, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Imitation Learning via Off-Policy Distribution Matching	Dec 10, 2019	Imitation LearningReinforcement Learning	CodeCode Available	1
AVID: Learning Multi-Stage Tasks via Pixel-Level Translation of Human Videos	Dec 10, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Efficient and Robust Reinforcement Learning with Uncertainty-based Value Expansion	Dec 10, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
A Finite-Time Analysis of Q-Learning with Neural Network Function Approximation	Dec 10, 2019	Deep Reinforcement LearningQ-Learning	—Unverified	0

Show:10 25 50

← PrevPage 228 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified