Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4976–5000 of 15113 papers

Title	Date	Tasks	Status
Reinforcement Learning in Computing and Network Convergence Orchestration	Sep 22, 2022	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning in Conflicting Environments for Autonomous Vehicles	Oct 22, 2016	Autonomous Vehiclesreinforcement-learning	—Unverified
Reinforcement Learning in Economics and Finance	Mar 22, 2020	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning in Education: A Multi-Armed Bandit Approach	Nov 1, 2022	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning in Factored Action Spaces using Tensor Decompositions	Oct 27, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Deep Reinforcement Learning for FlipIt Security Game	Feb 28, 2020	Deep Reinforcement LearningQ-Learning	—Unverified
Reinforcement learning informed evolutionary search for autonomous systems testing	Aug 24, 2023	Computational EfficiencyEfficient Exploration	—Unverified
Reinforcement Learning in Healthcare: A Survey	Aug 22, 2019	Decision MakingMedical Diagnosis	—Unverified
Reinforcement Learning in Hyperbolic Spaces: Models and Experiments	Oct 12, 2024	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement learning in large, structured action spaces: A simulation study of decision support for spinal cord injury rehabilitation	Oct 23, 2023	Decision MakingReinforcement Learning (RL)	—Unverified
Reinforcement Learning in Linear MDPs: Constant Regret and Representation Selection	Oct 27, 2021	reinforcement-learningReinforcement Learning	—Unverified
Low-Rank MDPs with Continuous Action Spaces	Nov 6, 2023	PAC learningReinforcement Learning (RL)	—Unverified
Reinforcement Learning for Economic Policy: A New Frontier?	Jun 16, 2022	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning in Medical Image Analysis: Concepts, Applications, Challenges, and Future Directions	Jun 28, 2022	ArticlesMedical Image Analysis	—Unverified
Reinforcement Learning in Modern Biostatistics: Constructing Optimal Adaptive Interventions	Mar 4, 2022	Causal InferenceDecision Making	—Unverified
Reinforcement Learning in Multi-Party Trading Dialog	Sep 1, 2015	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning in Newcomblike Environments	Dec 1, 2021	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning in Non-Markovian Environments	Nov 3, 2022	Q-Learningreinforcement-learning	—Unverified
Reinforcement Learning in Non-Markov Market-Making	Oct 18, 2024	Deep Reinforcement Learningreinforcement-learning	—Unverified
Reinforcement Learning in Non-Stationary Environments	May 10, 2019	energy managementManagement	—Unverified
Reinforcement Learning in Non-Stationary Discrete-Time Linear-Quadratic Mean-Field Games	Sep 9, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Reinforcement Learning in POMDPs with Memoryless Options and Option-Observation Initiation Sets	Aug 22, 2017	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning in Presence of Discrete Markovian Context Evolution	Feb 14, 2022	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning in R	Sep 29, 2018	Q-Learningreinforcement-learning	—Unverified
Reinforcement Learning in Reward-Mixing MDPs	Oct 7, 2021	Efficient Explorationreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 200 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified