Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10226–10250 of 15113 papers

Title	Date	Tasks	Status
Dynamic Retail Pricing via Q-Learning -- A Reinforcement Learning Framework for Enhanced Revenue Management	Nov 27, 2024	Decision MakingManagement	—Unverified
DynamicRouteGPT: A Real-Time Multi-Vehicle Dynamic Navigation Framework Based on Large Language Models	Aug 26, 2024	Bayesian InferenceCausal Inference	—Unverified
Dynamics-Adaptive Continual Reinforcement Learning via Progressive Contextualization	Sep 1, 2022	Bayesian InferenceKnowledge Distillation	—Unverified
Dynamic Safe Interruptibility for Decentralized Multi-Agent Reinforcement Learning	Apr 10, 2017	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Dynamic Sampling that Adapts: Iterative DPO for Self-Aware Mathematical Reasoning	May 22, 2025	Mathematical ReasoningReinforcement Learning (RL)	—Unverified
Dynamics Generalization via Information Bottleneck in Deep Reinforcement Learning	Aug 3, 2020	Decision MakingDeep Reinforcement Learning	—Unverified
Dynamic Shielding for Reinforcement Learning in Black-Box Environments	Jul 27, 2022	reinforcement-learningReinforcement Learning	—Unverified
Dynamic Spectrum Access for Ambient Backscatter Communication-assisted D2D Systems with Quantum Reinforcement Learning	Oct 23, 2024	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Dynamic Temporal Reconciliation by Reinforcement learning	Jan 28, 2022	reinforcement-learningReinforcement Learning	—Unverified
Dynamic Value Estimation for Single-Task Multi-Scene Reinforcement Learning	May 25, 2020	ClusteringDeep Reinforcement Learning	—Unverified
Dynamic Virtual Network Embedding Algorithm based on Graph Convolution Neural Network and Reinforcement Learning	Feb 3, 2022	Graph Neural NetworkNetwork Embedding	—Unverified
Dyna Planning using a Feature Based Generative Model	May 23, 2018	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Dyna-T: Dyna-Q and Upper Confidence Bounds Applied to Trees	Jan 12, 2022	Reinforcement Learning (RL)	—Unverified
DyPNIPP: Predicting Environment Dynamics for RL-based Robust Informative Path Planning	Oct 22, 2024	Reinforcement Learning (RL)	—Unverified
EARL-BO: Reinforcement Learning for Multi-Step Lookahead, High-Dimensional Bayesian Optimization	Oct 31, 2024	Bayesian OptimizationDecision Making	—Unverified
EasyRL: A Simple and Extensible Reinforcement Learning Framework	Aug 4, 2020	OpenAI Gymreinforcement-learning	—Unverified
EAT-C: Environment-Adversarial sub-Task Curriculum for Efficient Reinforcement Learning	Sep 29, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Eco-driving for Electric Connected Vehicles at Signalized Intersections: A Parameterized Reinforcement Learning approach	Jun 24, 2022	Reinforcement Learning (RL)	—Unverified
EcoLight: Intersection Control in Developing Regions Under Extreme Budget and Network Constraints	Dec 1, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Ecological Reinforcement Learning	Jun 22, 2020	reinforcement-learningReinforcement Learning	—Unverified
ECOL-R: Encouraging Copying in Novel Object Captioning with Reinforcement Learning	Jan 25, 2021	Image CaptioningObject	—Unverified
Economical Precise Manipulation and Auto Eye-Hand Coordination with Binocular Visual Reinforcement Learning	May 12, 2022	Camera Calibrationreinforcement-learning	—Unverified
e-COP : Episodic Constrained Optimization of Policies	Jun 13, 2024	LEMMAreinforcement-learning	—Unverified
Eco-Vehicular Edge Networks for Connected Transportation: A Distributed Multi-Agent Reinforcement Learning Approach	Jun 17, 2020	Autonomous VehiclesMulti-agent Reinforcement Learning	—Unverified
Eden: A Unified Environment Framework for Booming Reinforcement Learning Algorithms	Sep 4, 2021	Allreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 410 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified