Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3001–3025 of 15113 papers

Title	Date	Tasks	Status	Score
Identifiability and generalizability from multiple experts in Inverse Reinforcement Learning	Sep 22, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	5
Hyperparameters in Contextual RL are Highly Situational	Dec 21, 2022	Hyperparameter Optimizationreinforcement-learning	CodeCode Available	5
Hyperparameter Auto-tuning in Self-Supervised Robotic Learning	Oct 16, 2020	DiversityMulti-Task Learning	CodeCode Available	5
Large Language Models are Biased Reinforcement Learners	May 19, 2024	Decision MakingIn-Context Learning	CodeCode Available	5
Assessing Generalization in Deep Reinforcement Learning	Oct 29, 2018	Deep Reinforcement LearningOut-of-Distribution Generalization	CodeCode Available	5
Contextual Imagined Goals for Self-Supervised Robotic Learning	Oct 23, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	5
Hyp-RL : Hyperparameter Optimization by Reinforcement Learning	Jun 27, 2019	Bayesian OptimizationHyperparameter Optimization	CodeCode Available	5
Identifiability and Generalizability in Constrained Inverse Reinforcement Learning	Jun 1, 2023	reinforcement-learningReinforcement Learning	CodeCode Available	5
Hype or Heuristic? Quantum Reinforcement Learning for Join Order Optimisation	May 13, 2024	Low-latency processingreinforcement-learning	CodeCode Available	5
Q-Star Meets Scalable Posterior Sampling: Bridging Theory and Practice via HyperAgent	Feb 5, 2024	Atari GamesAtari Games 100k	CodeCode Available	5
Hybrid Transfer Reinforcement Learning: Provable Sample Efficiency from Shifted-Dynamics Data	Nov 6, 2024	Reinforcement Learning (RL)Transfer Reinforcement Learning	CodeCode Available	5
Learning Actionable Representations with Goal-Conditioned Policies	Nov 19, 2018	Decision MakingHierarchical Reinforcement Learning	CodeCode Available	5
Hyperbolic Discounting and Learning over Multiple Horizons	Feb 19, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	5
Hybrid Latent Reasoning via Reinforcement Learning	May 24, 2025	reinforcement-learningReinforcement Learning	CodeCode Available	5
Hybrid Reinforcement Learning with Expert State Sequences	Mar 11, 2019	Atari GamesImitation Learning	CodeCode Available	5
Context Meta-Reinforcement Learning via Neuromodulation	Oct 30, 2021	continuous-controlContinuous Control	CodeCode Available	5
Hybridising Reinforcement Learning and Heuristics for Hierarchical Directed Arc Routing Problems	Jan 1, 2025	ARCreinforcement-learning	CodeCode Available	5
Learning-based Model Predictive Control for Safe Exploration and Reinforcement Learning	Jun 27, 2019	Model Predictive Controlreinforcement-learning	CodeCode Available	5
Hybrid Reward Architecture for Reinforcement Learning	Jun 13, 2017	reinforcement-learningReinforcement Learning	CodeCode Available	5
Weak Human Preference Supervision For Deep Reinforcement Learning	Jul 25, 2020	Deep Reinforcement LearningMuJoCo	CodeCode Available	5
Context-Aware Visual Policy Network for Sequence-Level Image Captioning	Aug 16, 2018	Deep Reinforcement LearningImage Captioning	CodeCode Available	5
Hybrid Actor-Critic Reinforcement Learning in Parameterized Action Space	Mar 4, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	5
Human-Level Control without Server-Grade Hardware	Nov 1, 2021	Cloud ComputingCPU	CodeCode Available	5
Hybrid Code Networks: practical and efficient end-to-end dialog control with supervised and reinforcement learning	Feb 10, 2017	reinforcement-learningReinforcement Learning	CodeCode Available	5
Human-Inspired Framework to Accelerate Reinforcement Learning	Feb 28, 2023	Decision Makingreinforcement-learning	CodeCode Available	5

Show:10 25 50

← PrevPage 121 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified