Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8851–8875 of 15113 papers

Title	Date	Tasks	Status	Hype
Experience-Based Heuristic Search: Robust Motion Planning with Deep Q-Learning	Feb 5, 2021	Autonomous DrivingAutonomous Vehicles	—Unverified	0
Deceptive Reinforcement Learning for Privacy-Preserving Planning	Feb 5, 2021	Privacy Preservingreinforcement-learning	—Unverified	0
Finite Sample Analysis of Minimax Offline Reinforcement Learning: Completeness, Fast Rates and First-Order Efficiency	Feb 5, 2021	Off-policy evaluationreinforcement-learning	—Unverified	0
Deep reinforcement learning for smart calibration of radio telescopes	Feb 5, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Revisiting Prioritized Experience Replay: A Value Perspective	Feb 5, 2021	Atari GamesQ-Learning	CodeCode Available	0
Provably Efficient Algorithms for Multi-Objective Competitive RL	Feb 5, 2021	Multi-Objective Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Persistent Rule-based Interactive Reinforcement Learning	Feb 4, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
A review of motion planning algorithms for intelligent robotics	Feb 4, 2021	Motion PlanningQ-Learning	—Unverified	0
Deep reinforcement learning-based image classification achieves perfect testing set accuracy for MRI brain tumors with a training set of only 30 images	Feb 4, 2021	ClassificationDeep Reinforcement Learning	—Unverified	0
Hybrid Adversarial Imitation Learning	Feb 4, 2021	Imitation LearningReinforcement Learning (RL)	—Unverified	0
Alchemy: A benchmark and analysis toolkit for meta-reinforcement learning agents	Feb 4, 2021	Meta-LearningMeta Reinforcement Learning	CodeCode Available	1
How to Train Your Robot with Deep Reinforcement Learning; Lessons We've Learned	Feb 4, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
A deep learning model for gas storage optimization	Feb 3, 2021	Deep LearningManagement	—Unverified	0
The Pitfall of More Powerful Autoencoders in Lidar-Based Navigation	Feb 3, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Neural Recursive Belief States in Multi-Agent Reinforcement Learning	Feb 3, 2021	Decision MakingMulti-agent Reinforcement Learning	—Unverified	0
Multi-UAV Mobile Edge Computing and Path Planning Platform based on Reinforcement Learning	Feb 3, 2021	Edge-computingreinforcement-learning	—Unverified	0
Near-Optimal Offline Reinforcement Learning via Double Variance Reduction	Feb 2, 2021	Offline RLreinforcement-learning	—Unverified	0
A step toward a reinforcement learning de novo genome assembler	Feb 2, 2021	Deep Reinforcement LearningQ-Learning	—Unverified	0
Improving Reinforcement Learning with Human Assistance: An Argument for Human Subject Studies with HIPPO Gym	Feb 2, 2021	OpenAI GymReinforcement Learning (RL)	—Unverified	0
A Lyapunov Theory for Finite-Sample Guarantees of Asynchronous Q-Learning and TD-Learning Variants	Feb 2, 2021	Q-LearningReinforcement Learning (RL)	—Unverified	0
An Abstraction-based Method to Check Multi-Agent Deep Reinforcement-Learning Behaviors	Feb 2, 2021	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified	0
Approximately Solving Mean Field Games via Entropy-Regularized Deep Reinforcement Learning	Feb 2, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Metrics and continuity in reinforcement learning	Feb 2, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	0
Towards Multi-agent Reinforcement Learning for Wireless Network Protocol Synthesis	Feb 2, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Reinforcement Learning with Probabilistic Boolean Network Models of Smart Grid Devices	Feb 2, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified	0

Show:10 25 50

← PrevPage 355 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified