Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2601–2625 of 15113 papers

Title	Date	Tasks	Status	Score
A User Simulator for Task-Completion Dialogues	Dec 17, 2016	reinforcement-learningReinforcement Learning	CodeCode Available	5
ALBA : Reinforcement Learning for Video Object Segmentation	May 26, 2020	ObjectOne-shot visual object segmentation	CodeCode Available	5
IxDRL: A Novel Explainable Deep Reinforcement Learning Toolkit based on Analyses of Interestingness	Jul 18, 2023	Deep Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	5
Iterative Reward Shaping using Human Feedback for Correcting Reward Misspecification	Aug 30, 2023	Reinforcement Learning (RL)	CodeCode Available	5
Is Value Functions Estimation with Classification Plug-and-play for Offline Reinforcement Learning?	Jun 10, 2024	Deep Reinforcement LearningOffline RL	CodeCode Available	5
Is Vanilla Policy Gradient Overlooked? Analyzing Deep Reinforcement Learning for Hanabi	Mar 22, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5
IRLAS: Inverse Reinforcement Learning for Architecture Search	Dec 13, 2018	Neural Architecture Searchreinforcement-learning	CodeCode Available	5
Adaptive Data Exploitation in Deep Reinforcement Learning	Jan 22, 2025	Computational EfficiencyDeep Reinforcement Learning	CodeCode Available	5
Iroko: A Framework to Prototype Reinforcement Learning for Data Center Traffic Control	Dec 24, 2018	Deep Reinforcement LearningOpenAI Gym	CodeCode Available	5
A Laplacian Framework for Option Discovery in Reinforcement Learning	Mar 2, 2017	Atari Gamesreinforcement-learning	CodeCode Available	5
Is Deep Reinforcement Learning Really Superhuman on Atari? Leveling the playing field	Aug 13, 2019	Atari GamesDeep Reinforcement Learning	CodeCode Available	5
A Unified Framework for Alternating Offline Model Training and Policy Learning	Oct 12, 2022	continuous-controlContinuous Control	CodeCode Available	5
Adaptive Curriculum Generation from Demonstrations for Sim-to-Real Visuomotor Control	Oct 17, 2019	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	5
Augmenting Replay in World Models for Continual Reinforcement Learning	Jan 30, 2024	Continual LearningModel-based Reinforcement Learning	CodeCode Available	5
A Kernel Loss for Solving the Bellman Equation	May 25, 2019	Q-LearningReinforcement Learning	CodeCode Available	5
Is Feedback All You Need? Leveraging Natural Language Feedback in Goal-Conditioned Reinforcement Learning	Dec 7, 2023	AllReinforcement Learning (RL)	CodeCode Available	5
Adaptive coordination of working-memory and reinforcement learning in non-human primates performing a trial-and-error problem solving task	Nov 2, 2017	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	5
Invariant Transform Experience Replay: Data Augmentation for Deep Reinforcement Learning	Sep 24, 2019	Data AugmentationDeep Reinforcement Learning	CodeCode Available	5
Inverse reinforcement learning for video games	Oct 24, 2018	continuous-controlContinuous Control	CodeCode Available	5
Intrinsic Rewards from Self-Organizing Feature Maps for Exploration in Reinforcement Learning	Feb 6, 2023	ClusteringDeep Reinforcement Learning	CodeCode Available	5
A Joint Imitation-Reinforcement Learning Framework for Reduced Baseline Regret	Sep 20, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	5
AIXIjs: A Software Demo for General Reinforcement Learning	May 22, 2017	General Reinforcement LearningOpenAI Gym	CodeCode Available	5
Inverse Reinforcement Learning in Contextual MDPs	May 23, 2019	Autonomous Drivingreinforcement-learning	CodeCode Available	5
Augmented Q Imitation Learning (AQIL)	Mar 31, 2020	Deep Reinforcement LearningImitation Learning	CodeCode Available	5
Interactive Semantic Parsing for If-Then Recipes via Hierarchical Reinforcement Learning	Aug 21, 2018	Hierarchical Reinforcement Learningreinforcement-learning	CodeCode Available	5

Show:10 25 50

← PrevPage 105 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified