Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2951–2975 of 15113 papers

Title	Date	Tasks	Status	Score
Toward Evaluating Robustness of Reinforcement Learning with Adversarial Policy	May 4, 2023	reinforcement-learningReinforcement Learning	CodeCode Available	5
Continual Reinforcement Learning in 3D Non-stationary Environments	May 24, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	5
Continual Reinforcement Learning for HVAC Systems Control: Integrating Hypernetworks and Transfer Learning	Mar 24, 2025	Continual LearningDeep Reinforcement Learning	CodeCode Available	5
Interval timing in deep reinforcement learning agents	May 31, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5
A Framework for Automated Cellular Network Tuning with Reinforcement Learning	Aug 13, 2018	ManagementQ-Learning	CodeCode Available	5
Control with adaptive Q-learning	Nov 3, 2020	OpenAI GymQ-Learning	CodeCode Available	5
Illuminating Generalization in Deep Reinforcement Learning through Procedural Level Generation	Jun 28, 2018	ClusteringDeep Reinforcement Learning	CodeCode Available	5
Imagination-Augmented Agents for Deep Reinforcement Learning	Jul 19, 2017	Deep Reinforcement LearningModel-based Reinforcement Learning	CodeCode Available	5
Continual Policy Distillation of Reinforcement Learning-based Controllers for Soft Robotic In-Hand Manipulation	Apr 5, 2024	Reinforcement Learning (RL)	CodeCode Available	5
IKEA Furniture Assembly Environment for Long-Horizon Complex Manipulation Tasks	Nov 17, 2019	Industrial Robotsreinforcement-learning	CodeCode Available	5
Continual Learning In Environments With Polynomial Mixing Times	Dec 13, 2021	Atari GamesContinual Learning	CodeCode Available	5
Continual Diffuser (CoD): Mastering Continual Offline Reinforcement Learning with Experience Rehearsal	Sep 4, 2024	Reinforcement Learning (RL)	CodeCode Available	5
Classifying Ambiguous Identities in Hidden-Role Stochastic Games with Multi-Agent Reinforcement Learning	Oct 24, 2022	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	5
Iroko: A Framework to Prototype Reinforcement Learning for Data Center Traffic Control	Dec 24, 2018	Deep Reinforcement LearningOpenAI Gym	CodeCode Available	5
IGLU 2022: Interactive Grounded Language Understanding in a Collaborative Environment at NeurIPS 2022	May 27, 2022	Natural Language UnderstandingReinforcement Learning (RL)	CodeCode Available	5
Is Feedback All You Need? Leveraging Natural Language Feedback in Goal-Conditioned Reinforcement Learning	Dec 7, 2023	AllReinforcement Learning (RL)	CodeCode Available	5
IGN : Implicit Generative Networks	Jun 13, 2022	Atari GamesDistributional Reinforcement Learning	CodeCode Available	5
Imitation Learning by Reinforcement Learning	Aug 10, 2021	continuous-controlContinuous Control	CodeCode Available	5
Improved Sample Complexity Bounds for Distributionally Robust Reinforcement Learning	Mar 5, 2023	reinforcement-learningReinforcement Learning	CodeCode Available	5
Ask the Right Questions: Active Question Reformulation with Reinforcement Learning	May 22, 2017	Information RetrievalQuestion Answering	CodeCode Available	5
DRED: Zero-Shot Transfer in Reinforcement Learning via Data-Regularised Environment Design	Feb 5, 2024	Deep Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	5
Identifiability and generalizability from multiple experts in Inverse Reinforcement Learning	Sep 22, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	5
A General, Evolution-Inspired Reward Function for Social Robotics	Feb 1, 2022	Cultural Vocal Bursts Intensity PredictionImitation Learning	CodeCode Available	5
Hyp-RL : Hyperparameter Optimization by Reinforcement Learning	Jun 27, 2019	Bayesian OptimizationHyperparameter Optimization	CodeCode Available	5
Hysteresis-Based RL: Robustifying Reinforcement Learning-based Control Policies via Hybrid Control	Apr 1, 2022	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	5

Show:10 25 50

← PrevPage 119 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified