Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2626–2650 of 15113 papers

Title	Date	Tasks	Status
Autonomous Driving in Reality with Reinforcement Learning and Image Translation	Jan 13, 2018	Autonomous DrivingCar Racing	—Unverified
Autonomous Control of a Particle Accelerator using Deep Reinforcement Learning	Oct 16, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Alternating Good-for-MDP Automata	May 6, 2022	Reinforcement Learning (RL)Translation	—Unverified
A Bayesian Framework of Deep Reinforcement Learning for Joint O-RAN/MEC Orchestration	Dec 26, 2023	Deep Reinforcement LearningEdge-computing	—Unverified
Cost-Sensitive Exploration in Bayesian Reinforcement Learning	Dec 1, 2012	reinforcement-learningReinforcement Learning	—Unverified
AlphaStock: A Buying-Winners-and-Selling-Losers Investment Strategy using Interpretable Deep Reinforcement Attention Networks	Jul 24, 2019	Deep AttentionDeep Reinforcement Learning	—Unverified
Autonomous Braking and Throttle System: A Deep Reinforcement Learning Approach for Naturalistic Driving	Aug 15, 2020	Autonomous VehiclesDeep Reinforcement Learning	—Unverified
Adaptive model selection in photonic reservoir computing by reinforcement learning	Apr 27, 2020	Load ForecastingModel Selection	—Unverified
Autonomous Attack Mitigation for Industrial Control Systems	Nov 3, 2021	Decision MakingDeep Reinforcement Learning	—Unverified
Autonomous Assessment of Demonstration Sufficiency via Bayesian Inverse Reinforcement Learning	Nov 28, 2022	Active Learningreinforcement-learning	—Unverified
AlphaStar: An Evolutionary Computation Perspective	Feb 5, 2019	DiversityReinforcement Learning	—Unverified
A Bayesian Approach to Robust Reinforcement Learning	May 20, 2019	reinforcement-learningReinforcement Learning	—Unverified
Autonomous Algorithm for Training Autonomous Vehicles with Minimal Human Intervention	May 22, 2024	Autonomous DrivingAutonomous Vehicles	—Unverified
Autonomous Air Traffic Controller: A Deep Multi-Agent Reinforcement Learning Approach	May 2, 2019	Decision MakingMulti-agent Reinforcement Learning	—Unverified
AlphaSnake: Policy Iteration on a Nondeterministic NP-hard Markov Decision Process	Nov 17, 2022	reinforcement-learningReinforcement Learning	—Unverified
Automaton Distillation: Neuro-Symbolic Transfer Learning for Deep Reinforcement Learning	Oct 29, 2023	Deep Reinforcement Learningreinforcement-learning	—Unverified
Automating Vehicles by Deep Reinforcement Learning using Task Separation with Hill Climbing	Nov 29, 2017	Autonomous DrivingDeep Reinforcement Learning	—Unverified
AlphaSeq: Sequence Discovery with Deep Reinforcement Learning	Sep 26, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
A Coarse to Fine Question Answering System based on Reinforcement Learning	Jun 1, 2021	Deep Reinforcement LearningQuestion Answering	—Unverified
Correlation Priors for Reinforcement Learning	Sep 11, 2019	Decision MakingImitation Learning	—Unverified
Automating Turbulence Modeling by Multi-Agent Reinforcement Learning	May 18, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Automating the resolution of flight conflicts: Deep reinforcement learning in service of air traffic controllers	Jun 15, 2022	Decision MakingDeep Reinforcement Learning	—Unverified
AlphaRouter: Quantum Circuit Routing with Reinforcement Learning and Tree Search	Oct 7, 2024	reinforcement-learningReinforcement Learning	—Unverified
Automating Staged Rollout with Reinforcement Learning	Apr 1, 2022	Multi-Objective Reinforcement Learningreinforcement-learning	—Unverified
Adaptive Load Shedding for Grid Emergency Control via Deep Reinforcement Learning	Feb 25, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 106 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified