Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2851–2900 of 15113 papers

Title	Date	Tasks	Status
AceReason-Nemotron 1.1: Advancing Math and Code Reasoning through SFT and RL Synergy	Jun 16, 2025	MathReinforcement Learning (RL)	—Unverified
Augmenting Automated Game Testing with Deep Reinforcement Learning	Mar 29, 2021	Deep Reinforcement LearningFPS Games	—Unverified
Augmented Replay Memory in Reinforcement Learning With Continuous Control	Dec 29, 2019	continuous-controlContinuous Control	—Unverified
Decentralized Circle Formation Control for Fish-like Robots in the Real-world via Reinforcement Learning	Mar 9, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Decentralized Cooperative Lane Changing at Freeway Weaving Areas Using Multi-Agent Deep Reinforcement Learning	Oct 5, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Decentralized Deep Reinforcement Learning for Network Level Traffic Signal Control	Jul 2, 2020	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Decentralized Gossip-Based Stochastic Bilevel Optimization over Communication Networks	Jun 22, 2022	Bilevel OptimizationFederated Learning	—Unverified
Augmented Random Search for Quadcopter Control: An alternative to Reinforcement Learning	Nov 28, 2019	continuous-controlContinuous Control	—Unverified
Combining Multi-Objective Bayesian Optimization with Reinforcement Learning for TinyML	May 23, 2023	Bayesian OptimizationHyperparameter Optimization	—Unverified
AITuning: Machine Learning-based Tuning Tool for Run-Time Communication Libraries	Sep 13, 2019	BIG-bench Machine LearningDeep Reinforcement Learning	—Unverified
AISYN: AI-driven Reinforcement Learning-Based Logic Synthesis Framework	Feb 8, 2023	reinforcement-learningReinforcement Learning	—Unverified
AUGMENTED POLICY GRADIENT METHODS FOR EFFICIENT REINFORCEMENT LEARNING	Sep 25, 2019	Policy Gradient Methodsreinforcement-learning	—Unverified
Adaptive Control of Differentially Private Linear Quadratic Systems	Aug 26, 2021	Reinforcement Learning (RL)	—Unverified
AAPO: Enhance the Reasoning Capabilities of LLMs with Advantage Momentum	May 20, 2025	Mathematical ReasoningReinforcement Learning (RL)	—Unverified
Heterogeneous Knowledge for Augmented Modular Reinforcement Learning	Jun 1, 2023	Decision Makingreinforcement-learning	—Unverified
Augmented Memory Networks for Streaming-Based Active One-Shot Learning	Mar 20, 2019	Active LearningOne-Shot Learning	—Unverified
Adaptive Control of an Inverted Pendulum by a Reinforcement Learning-based LQR Method	Sep 30, 2023	BenchmarkingReinforcement Learning (RL)	—Unverified
Augmented Memory Networks for Streaming-Based Active One-Shot Learning	Sep 4, 2019	Active LearningOne-Shot Learning	—Unverified
Augmented Lagrangian-Based Safe Reinforcement Learning Approach for Distribution System Volt/VAR Control	Oct 19, 2024	Reinforcement Learning (RL)Safe Reinforcement Learning	—Unverified
AirRL: A Reinforcement Learning Approach to Urban Air Quality Inference	Mar 27, 2020	Air Quality Inferencereinforcement-learning	—Unverified
ACERAC: Efficient reinforcement learning in fine time discretization	Apr 8, 2021	reinforcement-learningReinforcement Learning	—Unverified
De-Biased Modelling of Search Click Behavior with Reinforcement Learning	May 21, 2021	Learning-To-Rankreinforcement-learning	—Unverified
Augmented Intelligence in Smart Intersections: Local Digital Twins-Assisted Hybrid Autonomous Driving	Oct 16, 2024	Autonomous DrivingReinforcement Learning (RL)	—Unverified
A Two-Time-Scale Stochastic Optimization Framework with Applications in Control and Reinforcement Learning	Sep 29, 2021	Reinforcement Learning (RL)Stochastic Optimization	—Unverified
AI Recommendation Systems for Lane-Changing Using Adherence-Aware Reinforcement Learning	Apr 28, 2025	Autonomous DrivingRecommendation Systems	—Unverified
A Two-stage Framework and Reinforcement Learning-based Optimization Algorithms for Complex Scheduling Problems	Mar 10, 2021	Combinatorial OptimizationEarth Observation	—Unverified
AirCapRL: Autonomous Aerial Human Motion Capture using Deep Reinforcement Learning	Jul 13, 2020	Decision MakingDeep Reinforcement Learning	—Unverified
Adaptive control of a mechatronic system using constrained residual reinforcement learning	Oct 6, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
A Tutorial Introduction to Reinforcement Learning	Apr 3, 2023	Q-Learningreinforcement-learning	—Unverified
ATTRITION: Attacking Static Hardware Trojan Detection Techniques Using Reinforcement Learning	Aug 26, 2022	reinforcement-learningReinforcement Learning	—Unverified
Attribute Controllable Beautiful Caucasian Face Generation by Aesthetics Driven Reinforcement Learning	Aug 9, 2022	AttributeFace Generation	—Unverified
Attractor Selection in Nonlinear Energy Harvesting Using Deep Reinforcement Learning	Oct 3, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
AI Planning: A Primer and Survey (Preliminary Report)	Dec 7, 2024	Decision MakingReinforcement Learning (RL)	—Unverified
A centralized reinforcement learning method for multi-agent job scheduling in Grid	Sep 11, 2016	reinforcement-learningReinforcement Learning	—Unverified
Attraction-Repulsion Actor-Critic for Continuous Control Reinforcement Learning	Sep 17, 2019	continuous-controlContinuous Control	—Unverified
ACNMP: Skill Transfer and Task Extrapolation through Learning from Demonstration and Reinforcement Learning via Representation Sharing	Mar 25, 2020	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Attitude Control of Highly Maneuverable Aircraft Using an Improved Q-learning	Oct 22, 2022	continuous-controlContinuous Control	—Unverified
AIGenC: An AI generalisation model via creativity	May 19, 2022	modelreinforcement-learning	—Unverified
Teaching on a Budget in Multi-Agent Deep Reinforcement Learning	Apr 19, 2019	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
DearFSAC: An Approach to Optimizing Unreliable Federated Learning via Deep Reinforcement Learning	Jan 30, 2022	Deep Reinforcement LearningFederated Learning	—Unverified
Attention Routing: track-assignment detailed routing using attention-based reinforcement learning	Apr 20, 2020	reinforcement-learningReinforcement Learning	—Unverified
Attention-Privileged Reinforcement Learning	Nov 19, 2019	reinforcement-learningReinforcement Learning	—Unverified
AIGB: Generative Auto-bidding via Conditional Diffusion Modeling	May 25, 2024	Reinforcement Learning (RL)	—Unverified
Attention Privileged Reinforcement Learning for Domain Transfer	Sep 25, 2019	reinforcement-learningReinforcement Learning	—Unverified
Attention or memory? Neurointerpretable agents in space and time	Jul 9, 2020	Atari GamesDimensionality Reduction	—Unverified
AI-Driven Resource Allocation in Optical Wireless Communication Systems	Apr 8, 2023	ManagementReinforcement Learning (RL)	—Unverified
Robust Model-free Reinforcement Learning with Multi-objective Bayesian Optimization	Oct 29, 2019	Bayesian Optimizationreinforcement-learning	—Unverified
Death and Suicide in Universal Artificial Intelligence	Jun 2, 2016	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Attention Graph for Multi-Robot Social Navigation with Deep Reinforcement Learning	Jan 31, 2024	Deep Reinforcement LearningGraph Neural Network	—Unverified
Attention-driven Robotic Manipulation	Jan 1, 2021	reinforcement-learningReinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 58 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified