Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11751–11800 of 15113 papers

Title	Date	Tasks	Status	Hype
Uncertainty Quantification and Exploration for Reinforcement Learning	Oct 12, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Influence-Based Multi-Agent Exploration	Oct 12, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	0
Building HVAC Scheduling Using Reinforcement Learning via Neural Network Based Model Approximation	Oct 11, 2019	Deep Reinforcement LearningModel-based Reinforcement Learning	—Unverified	0
Green Deep Reinforcement Learning for Radio Resource Management: Architecture, Algorithm Compression and Challenge	Oct 11, 2019	Decision MakingDeep Reinforcement Learning	—Unverified	0
Network Randomization: A Simple Technique for Generalization in Deep Reinforcement Learning	Oct 11, 2019	Data AugmentationDeep Reinforcement Learning	CodeCode Available	0
Modeling Cyber-Physical Human Systems via an Interplay Between Reinforcement Learning and Game Theory	Oct 11, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Improving Gradient Estimation in Evolutionary Strategies With Past Descent Directions	Oct 11, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Autonomous Driving using Safe Reinforcement Learning by Incorporating a Regret-based Human Lane-Changing Decision Model	Oct 10, 2019	Autonomous DrivingAutonomous Vehicles	—Unverified	0
Hierarchical Reinforcement Learning with Advantage-Based Auxiliary Rewards	Oct 10, 2019	Hierarchical Reinforcement LearningMuJoCo	CodeCode Available	0
Agent with Warm Start and Active Termination for Plane Localization in 3D Ultrasound	Oct 10, 2019	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	1
RLCard: A Toolkit for Reinforcement Learning in Card Games	Oct 10, 2019	Board GamesCard Games	CodeCode Available	0
Model-Based Reinforcement Learning Exploiting State-Action Equivalence	Oct 9, 2019	modelModel-based Reinforcement Learning	—Unverified	0
Black-box Optimizer with Implicit Natural Gradient	Oct 9, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Model-based Reinforcement Learning for Predictions and Control for Limit Order Books	Oct 9, 2019	Model-based Reinforcement Learningreinforcement-learning	—Unverified	0
Multiple-objective Reinforcement Learning for Inverse Design and Identification	Oct 9, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Improving Generalization in Meta Reinforcement Learning using Learned Objectives	Oct 9, 2019	Meta Reinforcement Learningreinforcement-learning	—Unverified	0
Linear-Quadratic Mean-Field Reinforcement Learning: Convergence of Policy Gradient Methods	Oct 9, 2019	Policy Gradient Methodsreinforcement-learning	—Unverified	0
Ctrl-Z: Recovering from Instability in Reinforcement Learning	Oct 9, 2019	continuous-controlContinuous Control	—Unverified	0
Fast Task-Adaptation for Tasks Labeled Using Natural Language in Reinforcement Learning	Oct 9, 2019	Lifelong learningreinforcement-learning	—Unverified	0
Defensive Escort Teams via Multi-Agent Deep Reinforcement Learning	Oct 9, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Imagined Value Gradients: Model-Based Policy Optimization with Transferable Latent Dynamics Models	Oct 9, 2019	Model-based Reinforcement LearningReinforcement Learning	—Unverified	0
A Dual-Hormone Closed-Loop Delivery System for Type 1 Diabetes Using Deep Reinforcement Learning	Oct 9, 2019	Deep Reinforcement LearningQ-Learning	—Unverified	0
Integrating Behavior Cloning and Reinforcement Learning for Improved Performance in Dense and Sparse Reward Environments	Oct 9, 2019	Q-Learningreinforcement-learning	—Unverified	0
Tactical Reward Shaping: Bypassing Reinforcement Learning with Strategy-Based Goals	Oct 8, 2019	Deep Reinforcement LearningQ-Learning	—Unverified	0
TorchBeast: A PyTorch Platform for Distributed RL	Oct 8, 2019	OpenAI GymReinforcement Learning	CodeCode Available	0
Multi-Agent Reinforcement Learning for Order-dispatching via Order-Vehicle Distribution Matching	Oct 7, 2019	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Is a Good Representation Sufficient for Sample Efficient Reinforcement Learning?	Oct 7, 2019	Imitation Learningreinforcement-learning	—Unverified	0
Multi-step Greedy Reinforcement Learning Algorithms	Oct 7, 2019	Continuous ControlGame of Go	—Unverified	0
Self-Paced Contextual Reinforcement Learning	Oct 7, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	1
Reinforcement Learning with Structured Hierarchical Grammar Representations of Actions	Oct 7, 2019	Atari GamesQ-Learning	—Unverified	0
Probabilistic Successor Representations with Kalman Temporal Differences	Oct 6, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Biased Aggregation, Rollout, and Enhanced Policy Improvement for Reinforcement Learning	Oct 6, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Attention-based Fault-tolerant Approach for Multi-agent Reinforcement Learning Systems	Oct 5, 2019	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
DeepMNavigate: Deep Reinforced Multi-Robot Navigation Unifying Local & Global Collision Avoidance	Oct 4, 2019	Collision AvoidanceDeep Reinforcement Learning	—Unverified	0
I'm sorry Dave, I'm afraid I can't do that, Deep Q-learning from forbidden action	Oct 4, 2019	Industrial RobotsQ-Learning	—Unverified	0
Discounted Reinforcement Learning Is Not an Optimization Problem	Oct 4, 2019	Misconceptionsreinforcement-learning	—Unverified	0
Zero Shot Learning on Simulated Robots	Oct 4, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Manufacturing Dispatching using Reinforcement and Transfer Learning	Oct 4, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Using Logical Specifications of Objectives in Multi-Objective Reinforcement Learning	Oct 3, 2019	Multi-Objective Reinforcement Learningreinforcement-learning	—Unverified	0
SensorDrop: A Reinforcement Learning Framework for Communication Overhead Reduction on the Edge	Oct 3, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Machine learning strategies for path-planning microswimmers in turbulent flows	Oct 3, 2019	BIG-bench Machine LearningPosition	—Unverified	0
Reducing Overestimation Bias in Multi-Agent Domains Using Double Centralized Critics	Oct 3, 2019	Multi-agent Reinforcement LearningReinforcement Learning	CodeCode Available	0
Benchmarking Batch Deep Reinforcement Learning Algorithms	Oct 3, 2019	BenchmarkingDeep Reinforcement Learning	CodeCode Available	1
Generalized Inner Loop Meta-Learning	Oct 3, 2019	Meta-Learningreinforcement-learning	CodeCode Available	2
Hybrid Zero Dynamics Inspired Feedback Control Policy Design for 3D Bipedal Locomotion using Reinforcement Learning	Oct 3, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Review of Learning-based Longitudinal Motion Planning for Autonomous Vehicles: Research Gaps between Self-driving and Traffic Congestion	Oct 2, 2019	Autonomous VehiclesBIG-bench Machine Learning	—Unverified	0
Language is Power: Representing States Using Natural Language in Reinforcement Learning	Oct 2, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
QuaRL: Quantization for Fast and Environmentally Sustainable Reinforcement Learning	Oct 2, 2019	Decision MakingDeep Reinforcement Learning	CodeCode Available	0
Relationship Explainable Multi-objective Optimization Via Vector Value Function Based Reinforcement Learning	Oct 2, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Never Worse, Mostly Better: Stable Policy Improvement in Deep Reinforcement Learning	Oct 2, 2019	continuous-controlContinuous Control	—Unverified	0

Show:10 25 50

← PrevPage 236 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified