Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8851–8900 of 15113 papers

Title	Date	Tasks	Status	Hype
Experience-Based Heuristic Search: Robust Motion Planning with Deep Q-Learning	Feb 5, 2021	Autonomous DrivingAutonomous Vehicles	—Unverified	0
Deceptive Reinforcement Learning for Privacy-Preserving Planning	Feb 5, 2021	Privacy Preservingreinforcement-learning	—Unverified	0
Finite Sample Analysis of Minimax Offline Reinforcement Learning: Completeness, Fast Rates and First-Order Efficiency	Feb 5, 2021	Off-policy evaluationreinforcement-learning	—Unverified	0
Deep reinforcement learning for smart calibration of radio telescopes	Feb 5, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Revisiting Prioritized Experience Replay: A Value Perspective	Feb 5, 2021	Atari GamesQ-Learning	CodeCode Available	0
Provably Efficient Algorithms for Multi-Objective Competitive RL	Feb 5, 2021	Multi-Objective Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Persistent Rule-based Interactive Reinforcement Learning	Feb 4, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
A review of motion planning algorithms for intelligent robotics	Feb 4, 2021	Motion PlanningQ-Learning	—Unverified	0
Deep reinforcement learning-based image classification achieves perfect testing set accuracy for MRI brain tumors with a training set of only 30 images	Feb 4, 2021	ClassificationDeep Reinforcement Learning	—Unverified	0
Hybrid Adversarial Imitation Learning	Feb 4, 2021	Imitation LearningReinforcement Learning (RL)	—Unverified	0
Alchemy: A benchmark and analysis toolkit for meta-reinforcement learning agents	Feb 4, 2021	Meta-LearningMeta Reinforcement Learning	CodeCode Available	1
How to Train Your Robot with Deep Reinforcement Learning; Lessons We've Learned	Feb 4, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
A deep learning model for gas storage optimization	Feb 3, 2021	Deep LearningManagement	—Unverified	0
The Pitfall of More Powerful Autoencoders in Lidar-Based Navigation	Feb 3, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Neural Recursive Belief States in Multi-Agent Reinforcement Learning	Feb 3, 2021	Decision MakingMulti-agent Reinforcement Learning	—Unverified	0
Multi-UAV Mobile Edge Computing and Path Planning Platform based on Reinforcement Learning	Feb 3, 2021	Edge-computingreinforcement-learning	—Unverified	0
Near-Optimal Offline Reinforcement Learning via Double Variance Reduction	Feb 2, 2021	Offline RLreinforcement-learning	—Unverified	0
A step toward a reinforcement learning de novo genome assembler	Feb 2, 2021	Deep Reinforcement LearningQ-Learning	—Unverified	0
Improving Reinforcement Learning with Human Assistance: An Argument for Human Subject Studies with HIPPO Gym	Feb 2, 2021	OpenAI GymReinforcement Learning (RL)	—Unverified	0
A Lyapunov Theory for Finite-Sample Guarantees of Asynchronous Q-Learning and TD-Learning Variants	Feb 2, 2021	Q-LearningReinforcement Learning (RL)	—Unverified	0
An Abstraction-based Method to Check Multi-Agent Deep Reinforcement-Learning Behaviors	Feb 2, 2021	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified	0
Approximately Solving Mean Field Games via Entropy-Regularized Deep Reinforcement Learning	Feb 2, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Metrics and continuity in reinforcement learning	Feb 2, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	0
Towards Multi-agent Reinforcement Learning for Wireless Network Protocol Synthesis	Feb 2, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Reinforcement Learning with Probabilistic Boolean Network Models of Smart Grid Devices	Feb 2, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Throughput Optimization for Grant-Free Multiple Access With Multiagent Deep Reinforcement Learning	Feb 1, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Variation-resistant Q-learning: Controlling and Utilizing Estimation Bias in Reinforcement Learning for Better Performance	Feb 1, 2021	Q-Learningreinforcement-learning	CodeCode Available	0
NeoRL: A Near Real-World Benchmark for Offline Reinforcement Learning	Feb 1, 2021	Offline RLreinforcement-learning	CodeCode Available	1
Risk Aware and Multi-Objective Decision Making with Distributional Monte Carlo Tree Search	Feb 1, 2021	Decision MakingMulti-Objective Reinforcement Learning	—Unverified	0
Multi-Agent Reinforcement Learning with Temporal Logic Specifications	Feb 1, 2021	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
Interpretable Reinforcement Learning Inspired by Piaget's Theory of Cognitive Development	Feb 1, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Hybrid Beamforming for mmWave MU-MISO Systems Exploiting Multi-agent Deep Reinforcement Learning	Feb 1, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Hybrid Information-driven Multi-agent Reinforcement Learning	Feb 1, 2021	ManagementMulti-agent Reinforcement Learning	—Unverified	0
Bellman Eluder Dimension: New Rich Classes of RL Problems, and Sample-Efficient Algorithms	Feb 1, 2021	Reinforcement Learning (RL)	—Unverified	0
A Secure Learning Control Strategy via Dynamic Camouflaging for Unknown Dynamical Systems under Attacks	Feb 1, 2021	Misinformationreinforcement-learning	—Unverified	0
Improving Human Decision-Making by Discovering Efficient Strategies for Hierarchical Planning	Jan 31, 2021	Computational EfficiencyDecision Making	—Unverified	0
Fast Rates for the Regret of Offline Reinforcement Learning	Jan 31, 2021	Decision Makingreinforcement-learning	—Unverified	0
Contextualized Rewriting for Text Summarization	Jan 31, 2021	Extractive Summarizationreinforcement-learning	CodeCode Available	1
Deep Reinforcement Learning Aided Monte Carlo Tree Search for MIMO Detection	Jan 30, 2021	Decision MakingDeep Reinforcement Learning	—Unverified	0
Deep Reinforcement Learning-Based Product Recommender for Online Advertising	Jan 30, 2021	Deep Reinforcement LearningRecommendation Systems	—Unverified	0
On the Stability of Random Matrix Product with Markovian Noise: Application to Linear Stochastic Approximation and TD Learning	Jan 30, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Learning Skills to Navigate without a Master: A Sequential Multi-Policy Reinforcement Learning Algorithm	Jan 30, 2021	Autonomous NavigationHierarchical Reinforcement Learning	—Unverified	0
Policy Mirror Descent for Reinforcement Learning: Linear Convergence, New Sampling Complexity, and Generalized Problem Classes	Jan 30, 2021	Reinforcement Learning (RL)	—Unverified	0
Meta-Reinforcement Learning for Reliable Communication in THz/VLC Wireless VR Networks	Jan 29, 2021	Meta-LearningMeta Reinforcement Learning	CodeCode Available	0
Thermal Control of Laser Powder Bed Fusion Using Deep Reinforcement Learning	Jan 29, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Scalable Voltage Control using Structure-Driven Hierarchical Deep Reinforcement Learning	Jan 29, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Reinforcement Learning for Freight Booking Control Problems	Jan 29, 2021	BIG-bench Machine LearningDecision Making	—Unverified	0
Challenges for Using Impact Regularizers to Avoid Negative Side Effects	Jan 29, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Counterfactual State Explanations for Reinforcement Learning Agents via Generative Deep Learning	Jan 29, 2021	counterfactualDeep Reinforcement Learning	CodeCode Available	0
Learning-based vs Model-free Adaptive Control of a MAV under Wind Gust	Jan 29, 2021	Deep Reinforcement LearningOpen-Ended Question Answering	—Unverified	0

Show:10 25 50

← PrevPage 178 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified