Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2551–2575 of 15113 papers

Title	Date	Tasks	Status
A Methodology for the Development of RL-Based Adaptive Traffic Signal Controllers	Jan 24, 2021	Experimental Designreinforcement-learning	—Unverified
Adaptive Policy Learning for Offline-to-Online Reinforcement Learning	Mar 14, 2023	continuous-controlContinuous Control	—Unverified
Autotuning PID control using Actor-Critic Deep Reinforcement Learning	Nov 29, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Auto-tuning Distributed Stream Processing Systems using Reinforcement Learning	Sep 14, 2018	reinforcement-learningReinforcement Learning	—Unverified
A method for the online construction of the set of states of a Markov Decision Process using Answer Set Programming	Jun 5, 2017	Decision MakingReinforcement Learning	—Unverified
Autotelic Reinforcement Learning: Exploring Intrinsic Motivations for Skill Acquisition in Open-Ended Environments	Feb 6, 2025	Reinforcement Learning (RL)	—Unverified
A Method for Fast Autonomy Transfer in Reinforcement Learning	Jul 29, 2024	reinforcement-learningReinforcement Learning	—Unverified
Adaptive perturbation adversarial training: based on reinforcement learning	Aug 30, 2021	reinforcement-learningReinforcement Learning	—Unverified
Conversational Question Answering with Reformulations over Knowledge Graph	Dec 27, 2023	Conversational Question AnsweringKnowledge Graphs	—Unverified
Convergence Rates for Stochastic Approximation: Biased Noise with Unbounded Variance, and Applications	Dec 5, 2023	Reinforcement Learning (RL)	—Unverified
A Meta-Reinforcement Learning Approach to Process Control	Mar 25, 2021	Deep Reinforcement LearningMeta-Learning	—Unverified
Convergence Rates of Average-Reward Multi-agent Reinforcement Learning via Randomized Linear Programming	Oct 22, 2021	Multi-agent Reinforcement LearningReinforcement Learning (RL)	—Unverified
Autoregressive Multi-trait Essay Scoring via Reinforcement Learning with Scoring-aware Multiple Rewards	Sep 26, 2024	Automated Essay Scoringreinforcement-learning	—Unverified
Adaptive patch foraging in deep reinforcement learning agents	Oct 14, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Convergence Proof for Actor-Critic Methods Applied to PPO and RUDDER	Dec 2, 2020	Reinforcement Learning (RL)valid	—Unverified
Convergent and Efficient Deep Q Learning Algorithm	Sep 29, 2021	Q-Learningreinforcement-learning	—Unverified
Autonomous Warehouse Robot using Deep Q-Learning	Feb 21, 2022	Deep Reinforcement LearningNavigate	—Unverified
A Comparative Analysis of Deep Reinforcement Learning-enabled Freeway Decision-making for Automated Vehicles	Aug 4, 2020	Autonomous DrivingAutonomous Vehicles	—Unverified
myGym: Modular Toolkit for Visuomotor Robotic Tasks	Dec 21, 2020	Imitation LearningOpenAI Gym	—Unverified
Convergent NMPC-based Reinforcement Learning Using Deep Expected Sarsa and Nonlinear Temporal Difference Learning	Feb 7, 2025	Reinforcement Learning (RL)	—Unverified
Autonomous Voltage Control for Grid Operation Using Deep Reinforcement Learning	Apr 24, 2019	AI AgentDeep Reinforcement Learning	—Unverified
Autonomous Vehicle Fleet Coordination With Deep Reinforcement Learning	Jan 1, 2018	Autonomous VehiclesDecision Making	—Unverified
Task-Agnostic Learning to Accomplish New Tasks	Sep 9, 2022	Imitation LearningOffline RL	—Unverified
Autonomous Unmanned Aerial Vehicle Navigation using Reinforcement Learning: A Systematic Review	Aug 25, 2022	Navigatereinforcement-learning	—Unverified
Autonomous UAV Navigation: A DDPG-based Deep Reinforcement Learning Approach	Mar 21, 2020	Deep Reinforcement LearningNavigate	—Unverified

Show:10 25 50

← PrevPage 103 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified