Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3351–3375 of 15113 papers

Title	Date	Tasks	Status
CQM: Curriculum Reinforcement Learning with a Quantized World Model	Oct 26, 2023	reinforcement-learningReinforcement Learning	—Unverified
AIGenC: An AI generalisation model via creativity	May 19, 2022	modelreinforcement-learning	—Unverified
Attitude Control of Highly Maneuverable Aircraft Using an Improved Q-learning	Oct 22, 2022	continuous-controlContinuous Control	—Unverified
Decomposing the Prediction Problem; Autonomous Navigation by neoRL Agents	Jun 30, 2021	Autonomous NavigationPrediction	—Unverified
AgentGraph: Towards Universal Dialogue Management with Structured Deep Reinforcement Learning	May 27, 2019	Deep Reinforcement LearningDialogue Management	—Unverified
Attraction-Repulsion Actor-Critic for Continuous Control Reinforcement Learning	Sep 17, 2019	continuous-controlContinuous Control	—Unverified
CPL: Critical Plan Step Learning Boosts LLM Generalization in Reasoning Tasks	Sep 13, 2024	ARCCode Generation	—Unverified
DECORE: Deep Compression with Reinforcement Learning	Jun 11, 2021	reinforcement-learningReinforcement Learning	—Unverified
C-Planning: An Automatic Curriculum for Learning Goal-Reaching Tasks	Oct 22, 2021	Reinforcement Learning (RL)	—Unverified
Decorrelated Soft Actor-Critic for Efficient Deep Reinforcement Learning	Jan 31, 2025	Deep Reinforcement Learningreinforcement-learning	—Unverified
On the Theory of Risk-Aware Agents: Bridging Actor-Critic and Economics	Oct 30, 2023	Reinforcement Learning (RL)	—Unverified
Decoupled Learning of Environment Characteristics for Safe Exploration	Aug 9, 2017	reinforcement-learningReinforcement Learning	—Unverified
A Study on Dense and Sparse (Visual) Rewards in Robot Policy Learning	Aug 6, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Deep Reinforcement Learning for Time Scheduling in RF-Powered Backscatter Cognitive Radio Networks	Oct 3, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
A Tutorial Introduction to Reinforcement Learning	Apr 3, 2023	Q-Learningreinforcement-learning	—Unverified
AI Planning: A Primer and Survey (Preliminary Report)	Dec 7, 2024	Decision MakingReinforcement Learning (RL)	—Unverified
Covy: An AI-powered Robot with a Compound Vision System for Detecting Breaches in Social Distancing	Jul 14, 2022	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
A Study of State Aliasing in Structured Prediction with RNNs	Jun 21, 2019	reinforcement-learningReinforcement Learning	—Unverified
COVID-19 Pandemic Cyclic Lockdown Optimization Using Reinforcement Learning	Sep 10, 2020	reinforcement-learningReinforcement Learning	—Unverified
Decoupling Strategy and Surface Realization for Task-oriented Dialogues	Sep 29, 2021	Reinforcement Learning (RL)Style Transfer	—Unverified
Cover Tree Bayesian Reinforcement Learning	May 8, 2013	reinforcement-learningReinforcement Learning	—Unverified
A Two-Time-Scale Stochastic Optimization Framework with Applications in Control and Reinforcement Learning	Sep 29, 2021	Reinforcement Learning (RL)Stochastic Optimization	—Unverified
Accelerating the Learning of TAMER with Counterfactual Explanations	Aug 3, 2021	counterfactualreinforcement-learning	—Unverified
Deep Reinforcement Learning for Unmanned Aerial Vehicle-Assisted Vehicular Networks	Jun 12, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Deep Reinforcement Learning for Resource Constrained Multiclass Scheduling in Wireless Networks	Nov 27, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 135 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified