Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8401–8425 of 15113 papers

Title	Date	Tasks	Status	Hype
Deep Reinforcement Learning Based Controller for Active Heave Compensation	Apr 12, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Learn Goal-Conditioned Policy with Intrinsic Motivation for Deep Reinforcement Learning	Apr 11, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
The Atari Data Scraper	Apr 11, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Imperfect also Deserves Reward: Multi-Level and Sequential Reward Modeling for Better Dialog Management	Apr 10, 2021	Managementreinforcement-learning	CodeCode Available	0
Symmetry reduction for deep reinforcement learning active control of chaotic spatiotemporal dynamics	Apr 9, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
CropGym: a Reinforcement Learning Environment for Crop Management	Apr 9, 2021	ManagementOpenAI Gym	CodeCode Available	1
Learning Sampling Policy for Faster Derivative Free Optimization	Apr 9, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
A Reinforcement-Learning-Based Energy-Efficient Framework for Multi-Task Video Analytics Pipeline	Apr 9, 2021	Deep Reinforcement LearningInstance Segmentation	—Unverified	0
Inverse Reinforcement Learning: A Control Lyapunov Approach	Apr 9, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Jamming-Resilient Path Planning for Multiple UAVs via Deep Reinforcement Learning	Apr 9, 2021	Collision AvoidanceDecision Making	—Unverified	0
Learning to Reweight Imaginary Transitions for Model-Based Reinforcement Learning	Apr 9, 2021	Model-based Reinforcement Learningreinforcement-learning	—Unverified	0
Connecting Deep-Reinforcement-Learning-based Obstacle Avoidance with Conventional Global Planners using Waypoint Generators	Apr 8, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Graph Partitioning and Sparse Matrix Ordering using Reinforcement Learning and Graph Neural Networks	Apr 8, 2021	graph partitioningreinforcement-learning	CodeCode Available	1
Efficient time stepping for numerical integration using reinforcement learning	Apr 8, 2021	Meta-LearningNumerical Integration	CodeCode Available	0
ACERAC: Efficient reinforcement learning in fine time discretization	Apr 8, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
A Bayesian Approach to Reinforcement Learning of Vision-Based Vehicular Control	Apr 8, 2021	Autonomous Drivingreinforcement-learning	CodeCode Available	0
A Reinforcement Learning Environment For Job-Shop Scheduling	Apr 8, 2021	Combinatorial OptimizationDeep Reinforcement Learning	CodeCode Available	1
Arena-Rosnav: Towards Deployment of Deep-Reinforcement-Learning-Based Obstacle Avoidance into Conventional Autonomous Navigation Systems	Apr 8, 2021	Autonomous NavigationDeep Reinforcement Learning	CodeCode Available	1
Optimal Market Making by Reinforcement Learning	Apr 8, 2021	Q-Learningreinforcement-learning	CodeCode Available	1
The Value of Planning for Infinite-Horizon Model Predictive Control	Apr 7, 2021	Model Predictive ControlReinforcement Learning (RL)	CodeCode Available	0
Unsupervised Visual Attention and Invariance for Reinforcement Learning	Apr 7, 2021	Domain GeneralizationKeypoint Detection	—Unverified	0
Reinforcement Learning with a Disentangled Universal Value Function for Item Recommendation	Apr 7, 2021	Model-based Reinforcement LearningRecommendation Systems	—Unverified	0
Generating Multi-type Temporal Sequences to Mitigate Class-imbalanced Problem	Apr 7, 2021	BIG-bench Machine LearningClick-Through Rate Prediction	CodeCode Available	0
Non-Asymptotic Analysis for Two Time-scale TDC with General Smooth Function Approximation	Apr 7, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Improving Robustness of Deep Reinforcement Learning Agents: Environment Attack based on the Critic Network	Apr 7, 2021	Adversarial AttackDeep Reinforcement Learning	CodeCode Available	0

Show:10 25 50

← PrevPage 337 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified