Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5701–5725 of 15113 papers

Title	Date	Tasks	Status
Sample-efficient policy learning in multi-agent Reinforcement Learning via meta-learning	May 1, 2019	Meta-LearningMulti-agent Reinforcement Learning	—Unverified
Sample efficient Quality Diversity for neural continuous control	Jan 1, 2021	continuous-controlContinuous Control	—Unverified
Sample-Efficient Reinforcement Learning through Transfer and Architectural Priors	Jan 7, 2018	Atari GamesDeep Reinforcement Learning	—Unverified
Sample Efficient Reinforcement Learning by Automatically Learning to Compose Subtasks	Jan 25, 2024	reinforcement-learningReinforcement Learning	—Unverified
Sample-Efficient Reinforcement Learning for Linearly-Parameterized MDPs with a Generative Model	May 28, 2021	Q-Learningreinforcement-learning	—Unverified
Reinforcement Learning from Partial Observation: Linear Function Approximation with Provable Sample Efficiency	Apr 20, 2022	reinforcement-learningReinforcement Learning	—Unverified
Sample-efficient Reinforcement Learning in Robotic Table Tennis	Nov 6, 2020	reinforcement-learningReinforcement Learning	—Unverified
Sample Efficient Reinforcement Learning In Continuous State Spaces: A Perspective Beyond Linearity	Jun 15, 2021	Atari Gamesreinforcement-learning	—Unverified
Sample-Efficient Reinforcement Learning in the Presence of Exogenous Information	Jun 9, 2022	reinforcement-learningReinforcement Learning	—Unverified
Sample-Efficient Reinforcement Learning Is Feasible for Linearly Realizable MDPs with Limited Revisiting	May 17, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Sample-Efficient Reinforcement Learning of Undercomplete POMDPs	Jun 22, 2020	reinforcement-learningReinforcement Learning	—Unverified
Sample-Efficient Reinforcement Learning of Partially Observable Markov Games	Jun 2, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Sample-Efficient Reinforcement Learning of Koopman eNMPC	Mar 24, 2025	reinforcement-learningReinforcement Learning	—Unverified
Sample-efficient reinforcement learning using deep Gaussian processes	Nov 2, 2020	continuous-controlContinuous Control	—Unverified
Sample Efficient Reinforcement Learning via Low-Rank Matrix Estimation	Jun 11, 2020	Learning Theoryreinforcement-learning	—Unverified
Sample-Efficient Reinforcement Learning via Counterfactual-Based Data Augmentation	Dec 16, 2020	counterfactualData Augmentation	—Unverified
Sample-Efficient Reinforcement Learning with Stochastic Ensemble Value Expansion	Jul 4, 2018	continuous-controlContinuous Control	—Unverified
Sample Efficient Reinforcement Learning with REINFORCE	Oct 22, 2020	Policy Gradient Methodsreinforcement-learning	—Unverified
Sample-Efficient Reinforcement Learning with loglog(T) Switching Cost	Feb 13, 2022	reinforcement-learningReinforcement Learning	—Unverified
Sample-Efficient Robust Multi-Agent Reinforcement Learning in the Face of Environmental Uncertainty	Apr 29, 2024	Multi-agent Reinforcement LearningReinforcement Learning (RL)	—Unverified
Sample-efficient Safe Learning for Online Nonlinear Control with Control Barrier Functions	Jul 29, 2022	Decision MakingReinforcement Learning (RL)	—Unverified
Sample Efficient Social Navigation Using Inverse Reinforcement Learning	Jun 18, 2021	reinforcement-learningReinforcement Learning	—Unverified
Sampling from Energy-based Policies using Diffusion	Oct 2, 2024	continuous-controlContinuous Control	—Unverified
Sampling Strategies for GAN Synthetic Data	Sep 10, 2019	AttributeDiversity	—Unverified
Sampling Through the Lens of Sequential Decision Making	Aug 17, 2022	Decision MakingInformation Retrieval	—Unverified

Show:10 25 50

← PrevPage 229 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified