Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11051–11100 of 15113 papers

Title	Date	Tasks	Status	Hype
Near-optimal Regret Bounds for Stochastic Shortest Path	Feb 23, 2020	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Rapidly Personalizing Mobile Health Treatment Policies with Limited Data	Feb 23, 2020	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Optimizing Traffic Lights with Multi-agent Deep Reinforcement Learning and V2X communication	Feb 23, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Discriminative Particle Filter Reinforcement Learning for Complex Partial Observations	Feb 23, 2020	Atari GamesDecision Making	CodeCode Available	1
Deep Reinforcement Learning with Linear Quadratic Regulator Regions	Feb 23, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Adversarial Radar Inference. From Inverse Tracking to Inverse Reinforcement Learning of Cognitive Radar	Feb 22, 2020	Reinforcement Learning (RL)Stochastic Optimization	—Unverified	0
Automatic Data Augmentation via Deep Reinforcement Learning for Effective Kidney Tumor Segmentation	Feb 22, 2020	Data AugmentationDeep Reinforcement Learning	—Unverified	0
Guided Constrained Policy Optimization for Dynamic Quadrupedal Robot Locomotion	Feb 22, 2020	Deep Reinforcement LearningReinforcement Learning	—Unverified	0
Vehicle Tracking in Wireless Sensor Networks via Deep Reinforcement Learning	Feb 22, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Reinforcement Learning Framework for Deep Brain Stimulation Study	Feb 22, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1
Data Freshness and Energy-Efficient UAV Navigation Optimization: A Deep Reinforcement Learning Approach	Feb 21, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
On the Search for Feedback in Reinforcement Learning	Feb 21, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Disentangling Controllable Object through Video Prediction Improves Visual Reinforcement Learning	Feb 21, 2020	Atari GamesObject	—Unverified	0
Accelerating Reinforcement Learning with a Directional-Gaussian-Smoothing Evolution Strategy	Feb 21, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Automatic Gesture Recognition in Robot-assisted Surgery with Reinforcement Learning and Tree Search	Feb 20, 2020	Action SegmentationGesture Recognition	—Unverified	0
Enhanced Adversarial Strategically-Timed Attacks against Deep Reinforcement Learning	Feb 20, 2020	Autonomous NavigationDeep Reinforcement Learning	—Unverified	0
Adaptive Temporal Difference Learning with Linear Function Approximation	Feb 20, 2020	OpenAI Gymreinforcement-learning	—Unverified	0
oIRL: Robust Adversarial Inverse Reinforcement Learning with Temporally Extended Actions	Feb 20, 2020	continuous-controlContinuous Control	—Unverified	0
Multi-Agent Reinforcement Learning as a Computational Tool for Language Evolution Research: Historical Context and Future Challenges	Feb 20, 2020	BIG-bench Machine LearningMulti-agent Reinforcement Learning	—Unverified	0
Multi-Agent Meta-Reinforcement Learning for Self-Powered and Sustainable Edge Computing Systems	Feb 20, 2020	Edge-computingMeta Reinforcement Learning	—Unverified	0
Debiased Off-Policy Evaluation for Recommendation Systems	Feb 20, 2020	counterfactualOff-policy evaluation	—Unverified	0
UAV Aided Search and Rescue Operation Using Reinforcement Learning	Feb 19, 2020	Q-Learningreinforcement-learning	—Unverified	0
Sim2Real Transfer for Reinforcement Learning without Dynamics Randomization	Feb 19, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1
Value-driven Hindsight Modelling	Feb 19, 2020	Atari GamesReinforcement Learning	—Unverified	0
Optimistic Policy Optimization with Bandit Feedback	Feb 19, 2020	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Efficient Deep Reinforcement Learning via Adaptive Policy Transfer	Feb 19, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Curriculum in Gradient-Based Meta-Reinforcement Learning	Feb 19, 2020	BenchmarkingMeta-Learning	—Unverified	0
How To Avoid Being Eaten By a Grue: Exploration Strategies for Text-Adventure Agents	Feb 19, 2020	Knowledge Graphsreinforcement-learning	CodeCode Available	1
Keep Doing What Worked: Behavioral Modelling Priors for Offline Reinforcement Learning	Feb 19, 2020	continuous-controlContinuous Control	—Unverified	0
Generating Automatic Curricula via Self-Supervised Active Domain Randomization	Feb 18, 2020	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	1
Empirical Policy Evaluation with Supergraphs	Feb 18, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Adaptive Estimator Selection for Off-Policy Evaluation	Feb 18, 2020	Multi-Armed BanditsOff-policy evaluation	CodeCode Available	0
KoGuN: Accelerating Deep Reinforcement Learning via Integrating Human Suboptimal Knowledge	Feb 18, 2020	Common Sense Reasoningcontinuous-control	—Unverified	0
MoTiAC: Multi-Objective Actor-Critics for Real-Time Bidding	Feb 18, 2020	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Reinforcement Learning for Molecular Design Guided by Quantum Mechanics	Feb 18, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Multi-Issue Bargaining With Deep Reinforcement Learning	Feb 18, 2020	continuous-controlContinuous Control	—Unverified	0
Langevin DQN	Feb 17, 2020	Computational EfficiencyOpen-Ended Question Answering	CodeCode Available	0
Kalman meets Bellman: Improving Policy Evaluation through Value Tracking	Feb 17, 2020	Gaussian ProcessesReinforcement Learning	CodeCode Available	1
Control Frequency Adaptation via Action Persistence in Batch Reinforcement Learning	Feb 17, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	0
Adaptive Experience Selection for Policy Gradient	Feb 17, 2020	continuous-controlContinuous Control	—Unverified	0
Reinforcement learning for the privacy preservation and manipulation of eye tracking data	Feb 17, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Reward Design for Driver Repositioning Using Multi-Agent Reinforcement Learning	Feb 17, 2020	Bayesian OptimizationBilevel Optimization	—Unverified	0
Reinforced active learning for image segmentation	Feb 16, 2020	Active LearningDeep Reinforcement Learning	CodeCode Available	1
R-MADDPG for Partially Observable Environments and Limited Communication	Feb 16, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1
Investigating Simple Object Representations in Model-Free Deep Reinforcement Learning	Feb 16, 2020	Deep Reinforcement LearningObject	—Unverified	0
The Archimedean trap: Why traditional reinforcement learning will probably not yield AGI	Feb 15, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Non-asymptotic Convergence of Adam-type Reinforcement Learning Algorithms under Markovian Sampling	Feb 15, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
PDDLGym: Gym Environments from PDDL Problems	Feb 15, 2020	Decision MakingOpenAI Gym	CodeCode Available	1
Universal Value Density Estimation for Imitation Learning and Goal-Conditioned Reinforcement Learning	Feb 15, 2020	Density EstimationImitation Learning	CodeCode Available	0
Deep RL Agent for a Real-Time Action Strategy Game	Feb 15, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1

Show:10 25 50

← PrevPage 222 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified