Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2576–2600 of 15113 papers

Title	Date	Tasks	Status	Score
Jet grooming through reinforcement learning	Mar 22, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	5
Join Query Optimization with Deep Reinforcement Learning Algorithms	Nov 26, 2019	AttributeDeep Reinforcement Learning	CodeCode Available	5
A learning gap between neuroscience and reinforcement learning	Apr 22, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	5
Auto.gov: Learning-based Governance for Decentralized Finance (DeFi)	Feb 19, 2023	Reinforcement Learning (RL)	CodeCode Available	5
AutoGMap: Learning to Map Large-scale Sparse Graphs on Memristive Crossbars	Nov 15, 2021	CPUDecision Making	CodeCode Available	5
AutoFS: Automated Feature Selection via Diversity-aware Interactive Reinforcement Learning	Aug 27, 2020	Diversityfeature selection	CodeCode Available	5
Iterative Reward Shaping using Human Feedback for Correcting Reward Misspecification	Aug 30, 2023	Reinforcement Learning (RL)	CodeCode Available	5
IxDRL: A Novel Explainable Deep Reinforcement Learning Toolkit based on Analyses of Interestingness	Jul 18, 2023	Deep Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	5
Is Value Functions Estimation with Classification Plug-and-play for Offline Reinforcement Learning?	Jun 10, 2024	Deep Reinforcement LearningOffline RL	CodeCode Available	5
Is Vanilla Policy Gradient Overlooked? Analyzing Deep Reinforcement Learning for Hanabi	Mar 22, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5
Deep Reinforcement Learning using Genetic Algorithm for Parameter Optimization	Feb 19, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5
Just Round: Quantized Observation Spaces Enable Memory Efficient Learning of Dynamic Locomotion	Oct 14, 2022	Deep Reinforcement LearningQuantization	CodeCode Available	5
L2SR: Learning to Sample and Reconstruct for Accelerated MRI via Reinforcement Learning	Dec 5, 2022	Deep Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	5
Inverse Reinforcement Learning in Contextual MDPs	May 23, 2019	Autonomous Drivingreinforcement-learning	CodeCode Available	5
Inverse reinforcement learning for video games	Oct 24, 2018	continuous-controlContinuous Control	CodeCode Available	5
IRLAS: Inverse Reinforcement Learning for Architecture Search	Dec 13, 2018	Neural Architecture Searchreinforcement-learning	CodeCode Available	5
AutoBS: Autonomous Base Station Deployment with Reinforcement Learning and Digital Network Twins	Feb 27, 2025	Reinforcement Learning (RL)	CodeCode Available	5
Invariant Transform Experience Replay: Data Augmentation for Deep Reinforcement Learning	Sep 24, 2019	Data AugmentationDeep Reinforcement Learning	CodeCode Available	5
Adaptive Diffusion Policy Optimization for Robotic Manipulation	May 13, 2025	continuous-controlContinuous Control	CodeCode Available	5
Iroko: A Framework to Prototype Reinforcement Learning for Data Center Traffic Control	Dec 24, 2018	Deep Reinforcement LearningOpenAI Gym	CodeCode Available	5
A User Simulator for Task-Completion Dialogues	Dec 17, 2016	reinforcement-learningReinforcement Learning	CodeCode Available	5
ALBA : Reinforcement Learning for Video Object Segmentation	May 26, 2020	ObjectOne-shot visual object segmentation	CodeCode Available	5
Intrinsically Efficient, Stable, and Bounded Off-Policy Evaluation for Reinforcement Learning	Jun 9, 2019	Multi-Armed BanditsOff-policy evaluation	CodeCode Available	5
Interval timing in deep reinforcement learning agents	May 31, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5
Intrinsic fluctuations of reinforcement learning promote cooperation	Sep 1, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	5

Show:10 25 50

← PrevPage 104 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified