Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11251–11300 of 15113 papers

Title	Date	Tasks	Status	Hype
A storage expansion planning framework using reinforcement learning and simulation-based optimization	Jan 10, 2020	Decision MakingQ-Learning	—Unverified	0
Deep Interactive Reinforcement Learning for Path Following of Autonomous Underwater Vehicle	Jan 10, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Reinforcement Learning Tracking Control for Robotic Manipulator With Kernel-Based Dynamic Model	Jan 9, 2020	continuous-controlContinuous Control	—Unverified	0
On Computation and Generalization of Generative Adversarial Imitation Learning	Jan 9, 2020	Decision MakingImitation Learning	—Unverified	0
Population-Guided Parallel Policy Search for Reinforcement Learning	Jan 9, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1
Distributional Soft Actor-Critic: Off-Policy Reinforcement Learning for Addressing Value Estimation Errors	Jan 9, 2020	continuous-controlContinuous Control	CodeCode Available	1
EEG-based Drowsiness Estimation for Driving Safety using Deep Q-Learning	Jan 8, 2020	Brain Computer InterfaceDeep Reinforcement Learning	—Unverified	0
A Nonparametric Off-Policy Policy Gradient	Jan 8, 2020	Density EstimationPolicy Gradient Methods	CodeCode Available	0
On Thompson Sampling for Smoother-than-Lipschitz Bandits	Jan 8, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Perception and Navigation in Autonomous Systems in the Era of Learning: A Survey	Jan 8, 2020	Autonomous NavigationDecision Making	—Unverified	0
Sample-based Distributional Policy Gradient	Jan 8, 2020	Distributional Reinforcement LearningOpenAI Gym	—Unverified	0
Multi-Agent Deep Reinforcement Learning for Cooperative Connected Vehicles	Jan 8, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Decentralized Automotive Radar Spectrum Allocation to Avoid Mutual Interference Using Reinforcement Learning	Jan 7, 2020	Decision Makingreinforcement-learning	—Unverified	0
Deep Reinforcement Learning for Active Human Pose Estimation	Jan 7, 2020	3D Human Pose EstimationDeep Reinforcement Learning	CodeCode Available	1
Blue River Controls: A toolkit for Reinforcement Learning Control Systems on Hardware	Jan 7, 2020	OpenAI Gymreinforcement-learning	CodeCode Available	1
Reinforcement Learning via Fenchel-Rockafellar Duality	Jan 7, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1
Optimal Options for Multi-Task Reinforcement Learning Under Time Constraints	Jan 6, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Experimental Analysis of Reinforcement Learning Techniques for Spectrum Sharing Radar	Jan 6, 2020	Q-Learningreinforcement-learning	—Unverified	0
Learning Reusable Options for Multi-Task Reinforcement Learning	Jan 6, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
High-speed Autonomous Drifting with Deep Reinforcement Learning	Jan 6, 2020	Deep Reinforcement LearningFriction	—Unverified	0
Generalizing Emergent Communication	Jan 6, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
A Boolean Task Algebra for Reinforcement Learning	Jan 6, 2020	Lifelong learningNegation	CodeCode Available	1
Universal Successor Features for Transfer Reinforcement Learning	Jan 5, 2020	MuJoCoreinforcement-learning	—Unverified	0
MushroomRL: Simplifying Reinforcement Learning Research	Jan 4, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1
Represented Value Function Approach for Large Scale Multi Agent Reinforcement Learning	Jan 4, 2020	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
Hierarchical Reinforcement Learning as a Model of Human Task Interleaving	Jan 4, 2020	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified	0
Intelligent Roundabout Insertion using Deep Reinforcement Learning	Jan 3, 2020	Autonomous DrivingDeep Reinforcement Learning	—Unverified	0
Making Sense of Reinforcement Learning and Probabilistic Inference	Jan 3, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Zero-Shot Reinforcement Learning with Deep Attention Convolutional Neural Networks	Jan 2, 2020	Autonomous DrivingDeep Attention	—Unverified	0
Continuous-Discrete Reinforcement Learning for Hybrid Control in Robotics	Jan 2, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Joint Goal and Strategy Inference across Heterogeneous Demonstrators via Reward Network Distillation	Jan 2, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
An Optimistic Perspective on Offline Deep Reinforcement Learning	Jan 1, 2020	Atari GamesDeep Reinforcement Learning	CodeCode Available	1
Generative Adversarial Imitation Learning with Neural Network Parameterization: Global Optimality and Convergence Rate	Jan 1, 2020	Imitation Learningreinforcement-learning	—Unverified	0
Breaking the Curse of Many Agents: Provable Mean Embedding Q-Iteration for Mean-Field Reinforcement Learning	Jan 1, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
CoMic: Co-Training and Mimicry for Reusable Skills	Jan 1, 2020	continuous-controlContinuous Control	—Unverified	0
Inductive Bias-driven Reinforcement Learning For Efficient Schedules in Heterogeneous Clusters	Jan 1, 2020	Heuristic SearchInductive Bias	—Unverified	0
A Game Theoretic Perspective on Model-Based Reinforcement Learning	Jan 1, 2020	continuous-controlContinuous Control	—Unverified	0
Adaptive Droplet Routing in Digital Microfluidic Biochips Using Deep Reinforcement Learning	Jan 1, 2020	Deep Reinforcement LearningOpenAI Gym	—Unverified	0
Batch Reinforcement Learning with Hyperparameter Gradients	Jan 1, 2020	continuous-controlContinuous Control	—Unverified	0
Designing Optimal Dynamic Treatment Regimes: A Causal Reinforcement Learning Approach	Jan 1, 2020	Decision Makingreinforcement-learning	—Unverified	0
Learning General-Purpose Controllers via Locally Communicating Sensorimotor Modules	Jan 1, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Learning Fair Policies in Multi-Objective (Deep) Reinforcement Learning with Average and Discounted Rewards	Jan 1, 2020	Deep Reinforcement LearningFairness	—Unverified	0
Deep Reinforcement Learning with Smooth Policy	Jan 1, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Bridging the Gap Between f-GANs and Wasserstein GANs	Jan 1, 2020	Density Ratio EstimationImage Generation	CodeCode Available	1
Double Reinforcement Learning for Efficient and Robust Off-Policy Evaluation	Jan 1, 2020	Off-policy evaluationreinforcement-learning	—Unverified	0
CURL: Contrastive Unsupervised Representation Learning for Reinforcement Learning	Jan 1, 2020	Contrastive Learningreinforcement-learning	CodeCode Available	1
A distributional view on multi objective policy optimization	Jan 1, 2020	Multi-Objective Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Learning to Navigate in Synthetically Accessible Chemical Space Using Reinforcement Learning	Jan 1, 2020	Drug DiscoveryNavigate	CodeCode Available	1
“Other-Play” for Zero-Shot Coordination	Jan 1, 2020	Multi-agent Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Prediction-Guided Multi-Objective Reinforcement Learning for Continuous Robot Control	Jan 1, 2020	Multi-Objective Reinforcement Learningreinforcement-learning	CodeCode Available	1

Show:10 25 50

← PrevPage 226 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified