Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2851–2875 of 15113 papers

Title	Date	Tasks	Status
Augmenting Control over Exploration Space in Molecular Dynamics Simulators to Streamline De Novo Analysis through Generative Control Policies	Jun 26, 2023	Drug DiscoveryInductive Bias	—Unverified
AceReason-Nemotron 1.1: Advancing Math and Code Reasoning through SFT and RL Synergy	Jun 16, 2025	MathReinforcement Learning (RL)	—Unverified
Augmenting Automated Game Testing with Deep Reinforcement Learning	Mar 29, 2021	Deep Reinforcement LearningFPS Games	—Unverified
Augmented Replay Memory in Reinforcement Learning With Continuous Control	Dec 29, 2019	continuous-controlContinuous Control	—Unverified
Data Quality-aware Mixed-precision Quantization via Hybrid Reinforcement Learning	Feb 9, 2023	Quantizationreinforcement-learning	—Unverified
Daylight: Assessing Generalization Skills of Deep Reinforcement Learning Agents	Jan 1, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Modified DDPG car-following model with a real-world human driving experience with CARLA simulator	Dec 29, 2021	Autonomous DrivingDeep Reinforcement Learning	—Unverified
Augmented Random Search for Quadcopter Control: An alternative to Reinforcement Learning	Nov 28, 2019	continuous-controlContinuous Control	—Unverified
Combining Multi-Objective Bayesian Optimization with Reinforcement Learning for TinyML	May 23, 2023	Bayesian OptimizationHyperparameter Optimization	—Unverified
AITuning: Machine Learning-based Tuning Tool for Run-Time Communication Libraries	Sep 13, 2019	BIG-bench Machine LearningDeep Reinforcement Learning	—Unverified
AISYN: AI-driven Reinforcement Learning-Based Logic Synthesis Framework	Feb 8, 2023	reinforcement-learningReinforcement Learning	—Unverified
AUGMENTED POLICY GRADIENT METHODS FOR EFFICIENT REINFORCEMENT LEARNING	Sep 25, 2019	Policy Gradient Methodsreinforcement-learning	—Unverified
Adaptive Control of Differentially Private Linear Quadratic Systems	Aug 26, 2021	Reinforcement Learning (RL)	—Unverified
AAPO: Enhance the Reasoning Capabilities of LLMs with Advantage Momentum	May 20, 2025	Mathematical ReasoningReinforcement Learning (RL)	—Unverified
Heterogeneous Knowledge for Augmented Modular Reinforcement Learning	Jun 1, 2023	Decision Makingreinforcement-learning	—Unverified
Augmented Memory Networks for Streaming-Based Active One-Shot Learning	Mar 20, 2019	Active LearningOne-Shot Learning	—Unverified
Adaptive Control of an Inverted Pendulum by a Reinforcement Learning-based LQR Method	Sep 30, 2023	BenchmarkingReinforcement Learning (RL)	—Unverified
Augmented Memory Networks for Streaming-Based Active One-Shot Learning	Sep 4, 2019	Active LearningOne-Shot Learning	—Unverified
Augmented Lagrangian-Based Safe Reinforcement Learning Approach for Distribution System Volt/VAR Control	Oct 19, 2024	Reinforcement Learning (RL)Safe Reinforcement Learning	—Unverified
AirRL: A Reinforcement Learning Approach to Urban Air Quality Inference	Mar 27, 2020	Air Quality Inferencereinforcement-learning	—Unverified
ACERAC: Efficient reinforcement learning in fine time discretization	Apr 8, 2021	reinforcement-learningReinforcement Learning	—Unverified
Augmented Intelligence in Smart Intersections: Local Digital Twins-Assisted Hybrid Autonomous Driving	Oct 16, 2024	Autonomous DrivingReinforcement Learning (RL)	—Unverified
A Two-Time-Scale Stochastic Optimization Framework with Applications in Control and Reinforcement Learning	Sep 29, 2021	Reinforcement Learning (RL)Stochastic Optimization	—Unverified
AI Recommendation Systems for Lane-Changing Using Adherence-Aware Reinforcement Learning	Apr 28, 2025	Autonomous DrivingRecommendation Systems	—Unverified
A Two-stage Framework and Reinforcement Learning-based Optimization Algorithms for Complex Scheduling Problems	Mar 10, 2021	Combinatorial OptimizationEarth Observation	—Unverified

Show:10 25 50

← PrevPage 115 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified