Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5376–5400 of 15113 papers

Title	Date	Tasks	Status
Risk-sensitive Reinforcement Learning	Nov 8, 2013	Decision MakingQ-Learning	—Unverified
Provably Efficient Risk-Sensitive Reinforcement Learning: Iterated CVaR and Worst Path	Jun 6, 2022	Autonomous Drivingreinforcement-learning	—Unverified
Risk-Sensitive Reinforcement Learning via Policy Gradient Search	Oct 22, 2018	Policy Gradient Methodsreinforcement-learning	—Unverified
Risk-Sensitive Reinforcement Learning: a Martingale Approach to Reward Uncertainty	Jun 23, 2020	Decision MakingPortfolio Optimization	—Unverified
Risk-Sensitive Reinforcement Learning Applied to Control under Constraints	Sep 9, 2011	reinforcement-learningReinforcement Learning	—Unverified
Risk-sensitive Reinforcement Learning Based on Convex Scoring Functions	May 7, 2025	reinforcement-learningReinforcement Learning	—Unverified
Risk-Sensitive Reinforcement Learning: Near-Optimal Risk-Sample Tradeoff in Regret	Jun 22, 2020	Q-Learningreinforcement-learning	—Unverified
Risk-Sensitive Reinforcement Learning with Exponential Criteria	Dec 18, 2022	reinforcement-learningReinforcement Learning	—Unverified
RL2Grid: Benchmarking Reinforcement Learning in Power Grid Operations	Mar 29, 2025	Benchmarkingreinforcement-learning	—Unverified
RL2: Reinforce Large Language Model to Assist Safe Reinforcement Learning for Energy Management of Active Distribution Networks	Dec 2, 2024	energy managementIn-Context Learning	—Unverified
RL4Med-DDPO: Reinforcement Learning for Controlled Guidance Towards Diverse Medical Image Generation using Vision-Language Foundation Models	Mar 20, 2025	Image GenerationMedical Image Generation	—Unverified
RL4ReAl: Reinforcement Learning for Register Allocation	Apr 5, 2022	Hierarchical Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
RLAD: Reinforcement Learning from Pixels for Autonomous Driving in Urban Environments	May 29, 2023	Autonomous Drivingreinforcement-learning	—Unverified
RLAD: Time Series Anomaly Detection through Reinforcement Learning and Active Learning	Mar 31, 2021	Active LearningAnomaly Detection	—Unverified
RLang: A Declarative Language for Describing Partial World Knowledge to Reinforcement Learning Agents	Aug 12, 2022	Decision Makingreinforcement-learning	—Unverified
R-LAtte: Attention Module for Visual Control via Reinforcement Learning	Jan 1, 2021	reinforcement-learningReinforcement Learning	—Unverified
RL-Based Cargo-UAV Trajectory Planning and Cell Association for Minimum Handoffs, Disconnectivity, and Energy Consumption	Dec 5, 2023	Reinforcement Learning (RL)Trajectory Planning	—Unverified
RL-based Control of UAS Subject to Significant Disturbance	Apr 10, 2025	PositionReinforcement Learning (RL)	—Unverified
RL-Based Method for Benchmarking the Adversarial Resilience and Robustness of Deep Reinforcement Learning Policies	Jun 3, 2019	BenchmarkingDeep Reinforcement Learning	—Unverified
RL-based Query Rewriting with Distilled LLM for online E-Commerce Systems	Jan 29, 2025	Knowledge DistillationNatural Language Understanding	—Unverified
RLCache: Automated Cache Management Using Reinforcement Learning	Sep 30, 2019	Managementreinforcement-learning	—Unverified
RLCAD: Reinforcement Learning Training Gym for Revolution Involved CAD Command Sequence Generation	Mar 24, 2025	Reinforcement Learning (RL)	—Unverified
RL-CFR: Improving Action Abstraction for Imperfect Information Extensive-Form Games with Reinforcement Learning	Mar 7, 2024	counterfactualForm	—Unverified
RLCFR: Minimize Counterfactual Regret by Deep Reinforcement Learning	Sep 10, 2020	counterfactualDecision Making	—Unverified
RL-Controller: a reinforcement learning framework for active structural control	Mar 13, 2021	Decision Makingreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 216 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified