Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1701–1710 of 15113 papers

Title	Date	Tasks	Status	Hype	Score
Augmenting Reinforcement Learning with Behavior Primitives for Diverse Manipulation Tasks	Oct 7, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1	5
Augmenting Reinforcement Learning with Transformer-based Scene Representation Learning for Decision-making of Autonomous Driving	Aug 24, 2022	Autonomous DrivingDecision Making	CodeCode Available	1	5
End-to-End Urban Driving by Imitating a Reinforcement Learning Coach	Aug 18, 2021	Autonomous DrivingImitation Learning	CodeCode Available	1	5
A Unified Approach to Reinforcement Learning, Quantal Response Equilibria, and Two-Player Zero-Sum Games	Jun 12, 2022	Deep Reinforcement LearningMuJoCo Games	CodeCode Available	1	5
PIC: Permutation Invariant Critic for Multi-Agent Deep Reinforcement Learning	Oct 31, 2019	Deep Reinforcement LearningMulti-agent Reinforcement Learning	CodeCode Available	1	5
PID-Inspired Inductive Biases for Deep Reinforcement Learning in Partially Observable Control Tasks	Jul 12, 2023	Deep Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	1	5
PixL2R: Guiding Reinforcement Learning Using Natural Language by Mapping Pixels to Rewards	Jul 30, 2020	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	1	5
Plan2Vec: Unsupervised Representation Learning by Latent Plans	May 7, 2020	Motion Planningreinforcement-learning	CodeCode Available	1	5
Energy-Based Imitation Learning	Apr 20, 2020	Imitation Learningreinforcement-learning	CodeCode Available	1	5
Bayesian Generational Population-Based Training	Jul 19, 2022	Bayesian OptimizationReinforcement Learning (RL)	CodeCode Available	1	5

Show:10 25 50

← PrevPage 171 of 1512Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified