Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2626–2650 of 15113 papers

Title	Date	Tasks	Status	Score
AI Safety Gridworlds	Nov 27, 2017	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5
Is Deep Reinforcement Learning Really Superhuman on Atari? Leveling the playing field	Aug 13, 2019	Atari GamesDeep Reinforcement Learning	CodeCode Available	5
IRLAS: Inverse Reinforcement Learning for Architecture Search	Dec 13, 2018	Neural Architecture Searchreinforcement-learning	CodeCode Available	5
Is Feedback All You Need? Leveraging Natural Language Feedback in Goal-Conditioned Reinforcement Learning	Dec 7, 2023	AllReinforcement Learning (RL)	CodeCode Available	5
Inverse reinforcement learning for video games	Oct 24, 2018	continuous-controlContinuous Control	CodeCode Available	5
Inverse Reinforcement Learning in Contextual MDPs	May 23, 2019	Autonomous Drivingreinforcement-learning	CodeCode Available	5
Invariant Transform Experience Replay: Data Augmentation for Deep Reinforcement Learning	Sep 24, 2019	Data AugmentationDeep Reinforcement Learning	CodeCode Available	5
Intrinsic Rewards from Self-Organizing Feature Maps for Exploration in Reinforcement Learning	Feb 6, 2023	ClusteringDeep Reinforcement Learning	CodeCode Available	5
Intrinsically Efficient, Stable, and Bounded Off-Policy Evaluation for Reinforcement Learning	Jun 9, 2019	Multi-Armed BanditsOff-policy evaluation	CodeCode Available	5
Intrinsic fluctuations of reinforcement learning promote cooperation	Sep 1, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	5
Iterative Reward Shaping using Human Feedback for Correcting Reward Misspecification	Aug 30, 2023	Reinforcement Learning (RL)	CodeCode Available	5
Hierarchical Reinforcement Learning with AI Planning Models	Mar 1, 2022	Decision MakingHierarchical Reinforcement Learning	CodeCode Available	5
LEACH-RLC: Enhancing IoT Data Transmission with Optimized Clustering and Reinforcement Learning	Jan 28, 2024	Clusteringreinforcement-learning	CodeCode Available	5
Attentive Multi-Task Deep Reinforcement Learning	Jul 5, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5
Interestingness Elements for Explainable Reinforcement Learning: Understanding Agents' Capabilities and Limitations	Dec 19, 2019	Diversityreinforcement-learning	CodeCode Available	5
Interactive Query-Assisted Summarization via Deep Reinforcement Learning	Jul 1, 2022	Deep Reinforcement LearningInformativeness	CodeCode Available	5
Adaptive Combination of a Genetic Algorithm and Novelty Search for Deep Neuroevolution	Sep 8, 2022	DiversityReinforcement Learning (RL)	CodeCode Available	5
Interactive Semantic Parsing for If-Then Recipes via Hierarchical Reinforcement Learning	Aug 21, 2018	Hierarchical Reinforcement Learningreinforcement-learning	CodeCode Available	5
Interactive Learning from Activity Description	Feb 13, 2021	General Reinforcement LearningGrounded language learning	CodeCode Available	5
On the Correctness and Sample Complexity of Inverse Reinforcement Learning	Jun 2, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	5
Towards Abstractive Timeline Summarisation using Preference-based Reinforcement Learning	Nov 14, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	5
Attention-Based Model and Deep Reinforcement Learning for Distribution of Event Processing Tasks	Dec 7, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5
Intelligent Traffic Light via Policy-based Deep Reinforcement Learning	Dec 27, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5
A Centralised Soft Actor Critic Deep Reinforcement Learning Approach to District Demand Side Management through CityLearn	Sep 22, 2020	Deep Reinforcement LearningManagement	CodeCode Available	5
Attention-based Curiosity-driven Exploration in Deep Reinforcement Learning	Oct 23, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5

Show:10 25 50

← PrevPage 106 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified