Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2976–3000 of 15113 papers

Title	Date	Tasks	Status	Score
Continual Learning In Environments With Polynomial Mixing Times	Dec 13, 2021	Atari GamesContinual Learning	CodeCode Available	5
Continual Diffuser (CoD): Mastering Continual Offline Reinforcement Learning with Experience Rehearsal	Sep 4, 2024	Reinforcement Learning (RL)	CodeCode Available	5
Illuminating Generalization in Deep Reinforcement Learning through Procedural Level Generation	Jun 28, 2018	ClusteringDeep Reinforcement Learning	CodeCode Available	5
IKEA Furniture Assembly Environment for Long-Horizon Complex Manipulation Tasks	Nov 17, 2019	Industrial Robotsreinforcement-learning	CodeCode Available	5
Impartial Games: A Challenge for Reinforcement Learning	May 25, 2022	Board GamesPosition	CodeCode Available	5
Cooperation-Aware Reinforcement Learning for Merging in Dense Traffic	Jun 26, 2019	Autonomous VehiclesDecision Making	CodeCode Available	5
Deep PQR: Solving Inverse Reinforcement Learning using Anchor Actions	Jul 15, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	5
Identifying optimal cycles in quantum thermal machines with reinforcement-learning	Aug 30, 2021	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	5
Classifying Ambiguous Identities in Hidden-Role Stochastic Games with Multi-Agent Reinforcement Learning	Oct 24, 2022	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	5
Identifiability and Generalizability in Constrained Inverse Reinforcement Learning	Jun 1, 2023	reinforcement-learningReinforcement Learning	CodeCode Available	5
IGLU 2022: Interactive Grounded Language Understanding in a Collaborative Environment at NeurIPS 2022	May 27, 2022	Natural Language UnderstandingReinforcement Learning (RL)	CodeCode Available	5
DRED: Zero-Shot Transfer in Reinforcement Learning via Data-Regularised Environment Design	Feb 5, 2024	Deep Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	5
A review on Deep Reinforcement Learning for Fluid Mechanics	Aug 12, 2019	Decision MakingDeep Reinforcement Learning	CodeCode Available	5
Hyp-RL : Hyperparameter Optimization by Reinforcement Learning	Jun 27, 2019	Bayesian OptimizationHyperparameter Optimization	CodeCode Available	5
Hysteresis-Based RL: Robustifying Reinforcement Learning-based Control Policies via Hybrid Control	Apr 1, 2022	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	5
Identifiability and generalizability from multiple experts in Inverse Reinforcement Learning	Sep 22, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	5
Hyperparameter Auto-tuning in Self-Supervised Robotic Learning	Oct 16, 2020	DiversityMulti-Task Learning	CodeCode Available	5
Contextualized Hybrid Ensemble Q-learning: Learning Fast with Control Priors	Jun 28, 2024	Car RacingQ-Learning	CodeCode Available	5
Hyperparameters in Contextual RL are Highly Situational	Dec 21, 2022	Hyperparameter Optimizationreinforcement-learning	CodeCode Available	5
Q-Star Meets Scalable Posterior Sampling: Bridging Theory and Practice via HyperAgent	Feb 5, 2024	Atari GamesAtari Games 100k	CodeCode Available	5
Hype or Heuristic? Quantum Reinforcement Learning for Join Order Optimisation	May 13, 2024	Low-latency processingreinforcement-learning	CodeCode Available	5
Langevin DQN	Feb 17, 2020	Computational EfficiencyOpen-Ended Question Answering	CodeCode Available	5
Hyperbolic Discounting and Learning over Multiple Horizons	Feb 19, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	5
Contextual Imagined Goals for Self-Supervised Robotic Learning	Oct 23, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	5
IGN : Implicit Generative Networks	Jun 13, 2022	Atari GamesDistributional Reinforcement Learning	CodeCode Available	5

Show:10 25 50

← PrevPage 120 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified