Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5826–5850 of 15113 papers

Title	Date	Tasks	Status
Learning and Fast Adaptation for Grid Emergency Control via Deep Meta Reinforcement Learning	Jan 13, 2021	Deep Reinforcement LearningMeta Reinforcement Learning	—Unverified
Learning and Information in Stochastic Networks and Queues	May 18, 2021	Decision Makingparameter estimation	—Unverified
Learning and Querying Fast Generative Models for Reinforcement Learning	Feb 8, 2018	Atari GamesDecision Making	—Unverified
Learning and Reasoning for Robot Dialog and Navigation Tasks	May 20, 2020	reinforcement-learningReinforcement Learning	—Unverified
Learning and Understanding a Disentangled Feature Representation for Hidden Parameters in Reinforcement Learning	Nov 29, 2022	Metric Learningreinforcement-learning	—Unverified
Learning an Embedding Space for Transferable Robot Skills	Jan 1, 2018	reinforcement-learningReinforcement Learning	—Unverified
Learning a Policy for Opportunistic Active Learning	Aug 29, 2018	Active LearningObject	—Unverified
Learning Approximate and Exact Numeral Systems via Reinforcement Learning	May 28, 2021	reinforcement-learningReinforcement Learning	—Unverified
Learning a Prior over Intent via Meta-Inverse Reinforcement Learning	May 31, 2018	reinforcement-learningReinforcement Learning	—Unverified
Learning as Reinforcement: Applying Principles of Neuroscience for More General Reinforcement Learning Agents	Apr 20, 2020	Decision MakingGeneral Reinforcement Learning	—Unverified
Learning a subspace of policies for online adaptation in Reinforcement Learning	Oct 11, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Learning-at-Criticality in Large Language Models for Quantum Field Theory and Beyond	Jun 4, 2025	Arithmetic ReasoningReinforcement Learning (RL)	—Unverified
Learning a Transferable Scheduling Policy for Various Vehicle Routing Problems based on Graph-centric Representation Learning	Jan 1, 2021	Graph Neural Networkreinforcement-learning	—Unverified
Automated Data Augmentation for Few-Shot Time Series Forecasting: A Reinforcement Learning Approach Guided by a Model Zoo	Sep 10, 2024	Data AugmentationDiversity	—Unverified
Out-of-Distribution-Aware Electric Vehicle Charging	Nov 10, 2023	Model Predictive Controlreinforcement-learning	—Unverified
Learning a Universal Human Prior for Dexterous Manipulation from Human Preference	Apr 10, 2023	Reinforcement Learning (RL)Robot Manipulation	—Unverified
Deception Game: Closing the Safety-Learning Loop in Interactive Robot Autonomy	Sep 3, 2023	Autonomous VehiclesReinforcement Learning (RL)	—Unverified
Learning-Based Adaptive Optimal Control of Linear Time-Delay Systems: A Policy Iteration Approach	Oct 1, 2022	Autonomous DrivingReinforcement Learning (RL)	—Unverified
Learning-based Autonomous Oversteer Control and Collision Avoidance	May 21, 2025	Autonomous DrivingCollision Avoidance	—Unverified
Learning-Based Client Selection for Federated Learning Services Over Wireless Networks with Constrained Monetary Budgets	Aug 8, 2022	Deep Reinforcement LearningFederated Learning	—Unverified
Learning-based MPC from Big Data Using Reinforcement Learning	Jan 4, 2023	Model Predictive Controlreinforcement-learning	—Unverified
Deep Reinforcement Learning-Based Long-Range Autonomous Valet Parking for Smart Cities	Sep 23, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Learning-based sensing and computing decision for data freshness in edge computing-enabled networks	Jan 25, 2024	Edge-computingReinforcement Learning (RL)	—Unverified
Learning-based vs Model-free Adaptive Control of a MAV under Wind Gust	Jan 29, 2021	Deep Reinforcement LearningOpen-Ended Question Answering	—Unverified
Learning by Doing: An Online Causal Reinforcement Learning Framework with Causal-Aware Policy	Feb 7, 2024	Decision MakingReinforcement Learning (RL)	—Unverified

Show:10 25 50

← PrevPage 234 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified