Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11801–11850 of 15113 papers

Title	Date	Tasks	Status
Risk-Aware Transfer in Reinforcement Learning using Successor Features	May 28, 2021	Decision Makingreinforcement-learning	—Unverified
Risk-based implementation of COLREGs for autonomous surface vehicles using deep reinforcement learning	Nov 30, 2021	Collision AvoidanceDeep Reinforcement Learning	—Unverified
Risk Bounds and Rademacher Complexity in Batch Reinforcement Learning	Mar 25, 2021	Learning Theoryreinforcement-learning	—Unverified
Risk-Conditioned Distributional Soft Actor-Critic for Risk-Sensitive Navigation	Apr 7, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Risk-Constrained Reinforcement Learning with Percentile Risk Criteria	Dec 5, 2015	Decision MakingMarketing	—Unverified
Risk Perspective Exploration in Distributional Reinforcement Learning	Jun 28, 2022	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Risk-Sensitive and Robust Model-Based Reinforcement Learning and Planning	Apr 2, 2023	Decision MakingModel-based Reinforcement Learning	—Unverified
Risk-Sensitive Bayesian Games for Multi-Agent Reinforcement Learning under Policy Uncertainty	Mar 18, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Risk-Sensitive Compact Decision Trees for Autonomous Execution in Presence of Simulated Market Response	Jun 5, 2019	Q-Learningreinforcement-learning	—Unverified
Risk Sensitive Dead-end Identification in Safety-Critical Offline Reinforcement Learning	Jan 13, 2023	Decision Makingreinforcement-learning	—Unverified
Risk-Sensitive Deep RL: Variance-Constrained Actor-Critic Provably Finds Globally Optimal Policy	Dec 28, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Risk-sensitive Markov Decision Process and Learning under General Utility Functions	Nov 22, 2023	Reinforcement Learning (RL)	—Unverified
Risk Sensitive Model-Based Reinforcement Learning using Uncertainty Guided Planning	Nov 9, 2021	Model-based Reinforcement Learningreinforcement-learning	—Unverified
Risk-sensitive Reinforcement Learning	Nov 8, 2013	Decision MakingQ-Learning	—Unverified
Provably Efficient Risk-Sensitive Reinforcement Learning: Iterated CVaR and Worst Path	Jun 6, 2022	Autonomous Drivingreinforcement-learning	—Unverified
Risk-Sensitive Reinforcement Learning via Policy Gradient Search	Oct 22, 2018	Policy Gradient Methodsreinforcement-learning	—Unverified
Risk-Sensitive Reinforcement Learning: a Martingale Approach to Reward Uncertainty	Jun 23, 2020	Decision MakingPortfolio Optimization	—Unverified
Risk-Sensitive Reinforcement Learning Applied to Control under Constraints	Sep 9, 2011	reinforcement-learningReinforcement Learning	—Unverified
Risk-sensitive Reinforcement Learning Based on Convex Scoring Functions	May 7, 2025	reinforcement-learningReinforcement Learning	—Unverified
Risk-Sensitive Reinforcement Learning: Near-Optimal Risk-Sample Tradeoff in Regret	Jun 22, 2020	Q-Learningreinforcement-learning	—Unverified
Risk-Sensitive Reinforcement Learning with Exponential Criteria	Dec 18, 2022	reinforcement-learningReinforcement Learning	—Unverified
RL2Grid: Benchmarking Reinforcement Learning in Power Grid Operations	Mar 29, 2025	Benchmarkingreinforcement-learning	—Unverified
RL2: Reinforce Large Language Model to Assist Safe Reinforcement Learning for Energy Management of Active Distribution Networks	Dec 2, 2024	energy managementIn-Context Learning	—Unverified
RL4Med-DDPO: Reinforcement Learning for Controlled Guidance Towards Diverse Medical Image Generation using Vision-Language Foundation Models	Mar 20, 2025	Image GenerationMedical Image Generation	—Unverified
RL4ReAl: Reinforcement Learning for Register Allocation	Apr 5, 2022	Hierarchical Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
RLAD: Reinforcement Learning from Pixels for Autonomous Driving in Urban Environments	May 29, 2023	Autonomous Drivingreinforcement-learning	—Unverified
RLAD: Time Series Anomaly Detection through Reinforcement Learning and Active Learning	Mar 31, 2021	Active LearningAnomaly Detection	—Unverified
RLang: A Declarative Language for Describing Partial World Knowledge to Reinforcement Learning Agents	Aug 12, 2022	Decision Makingreinforcement-learning	—Unverified
R-LAtte: Attention Module for Visual Control via Reinforcement Learning	Jan 1, 2021	reinforcement-learningReinforcement Learning	—Unverified
RL-Based Cargo-UAV Trajectory Planning and Cell Association for Minimum Handoffs, Disconnectivity, and Energy Consumption	Dec 5, 2023	Reinforcement Learning (RL)Trajectory Planning	—Unverified
RL-based Control of UAS Subject to Significant Disturbance	Apr 10, 2025	PositionReinforcement Learning (RL)	—Unverified
RL-Based Method for Benchmarking the Adversarial Resilience and Robustness of Deep Reinforcement Learning Policies	Jun 3, 2019	BenchmarkingDeep Reinforcement Learning	—Unverified
RL-based Query Rewriting with Distilled LLM for online E-Commerce Systems	Jan 29, 2025	Knowledge DistillationNatural Language Understanding	—Unverified
RLCache: Automated Cache Management Using Reinforcement Learning	Sep 30, 2019	Managementreinforcement-learning	—Unverified
RLCAD: Reinforcement Learning Training Gym for Revolution Involved CAD Command Sequence Generation	Mar 24, 2025	Reinforcement Learning (RL)	—Unverified
RL-CFR: Improving Action Abstraction for Imperfect Information Extensive-Form Games with Reinforcement Learning	Mar 7, 2024	counterfactualForm	—Unverified
RLCFR: Minimize Counterfactual Regret by Deep Reinforcement Learning	Sep 10, 2020	counterfactualDecision Making	—Unverified
RL-Controller: a reinforcement learning framework for active structural control	Mar 13, 2021	Decision Makingreinforcement-learning	—Unverified
RLCorrector: Reinforced Proofreading for Cell-level Microscopy Image Segmentation	Jun 10, 2021	Image Segmentationreinforcement-learning	—Unverified
RL-CoSeg : A Novel Image Co-Segmentation Algorithm with Deep Reinforcement Learning	Apr 12, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
RL-CycleGAN: Reinforcement Learning Aware Simulation-To-Real	Jun 16, 2020	reinforcement-learningReinforcement Learning	—Unverified
RL-DAUNCE: Reinforcement Learning-Driven Data Assimilation with Uncertainty-Aware Constrained Ensembles	May 8, 2025	Computational EfficiencyReinforcement Learning (RL)	—Unverified
RL-DistPrivacy: Privacy-Aware Distributed Deep Inference for low latency IoT systems	Aug 27, 2022	Privacy PreservingReinforcement Learning (RL)	—Unverified
RL-Duet: Online Music Accompaniment Generation Using Deep Reinforcement Learning	Feb 8, 2020	Deep Reinforcement LearningMusic Generation	—Unverified
RL-GA: A Reinforcement Learning-Based Genetic Algorithm for Electromagnetic Detection Satellite Scheduling Problem	Jun 12, 2022	Q-Learningreinforcement-learning	—Unverified
R-learning in actor-critic model offers a biologically relevant mechanism for sequential decision-making	Dec 1, 2020	Decision MakingReinforcement Learning (RL)	—Unverified
RLEEGNet: Integrating Brain-Computer Interfaces with Adaptive AI for Intuitive Responsiveness and High-Accuracy Motor Imagery Classification	Feb 9, 2024	EEGMotor Imagery	—Unverified
RLeXplore: Accelerating Research in Intrinsically-Motivated Reinforcement Learning	May 29, 2024	reinforcement-learningReinforcement Learning	—Unverified
RL for Consistency Models: Faster Reward Guided Text-to-Image Generation	Mar 25, 2024	Image GenerationInstruction Following	—Unverified
RL-GPT: Integrating Reinforcement Learning and Code-as-policy	Feb 29, 2024	Minecraftreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 237 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified