Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2651–2700 of 15113 papers

Title	Date	Tasks	Status
Adaptive Learning Rates for Multi-Agent Reinforcement Learning	Jan 1, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Longitudinal Dynamic versus Kinematic Models for Car-Following Control Using Deep Reinforcement Learning	May 7, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Automating Privilege Escalation with Deep Reinforcement Learning	Oct 4, 2021	BIG-bench Machine LearningDeep Reinforcement Learning	—Unverified
Automating Predictive Modeling Process using Reinforcement Learning	Mar 2, 2019	Decision MakingDecision Making Under Uncertainty	—Unverified
Automating Control of Overestimation Bias for Reinforcement Learning	Oct 26, 2021	Continuous ControlQ-Learning	—Unverified
Alpha-divergence bridges maximum likelihood and reinforcement learning in neural sequence generation	Jan 1, 2018	Machine Translationreinforcement-learning	—Unverified
Cross-Domain Transfer in Reinforcement Learning using Target Apprentice	Jan 22, 2018	reinforcement-learningReinforcement Learning	—Unverified
Cross-Embodiment Dexterous Grasping with Reinforcement Learning	Oct 3, 2024	reinforcement-learningReinforcement Learning	—Unverified
Automatic View Planning with Multi-scale Deep Reinforcement Learning Agents	Jun 8, 2018	AnatomyDeep Reinforcement Learning	—Unverified
Alpha-DAG: a reinforcement learning based algorithm to learn Directed Acyclic Graphs	Jan 1, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Automatic tuning of hyper-parameters of reinforcement learning algorithms using Bayesian optimization with behavioral cloning	Dec 15, 2021	Bayesian OptimizationMeta-Learning	—Unverified
AlphaD3M: Machine Learning Pipeline Synthesis	Nov 3, 2021	AutoMLBIG-bench Machine Learning	—Unverified
Adaptive Learning of Design Strategies over Non-Hierarchical Multi-Fidelity Models via Policy Alignment	Nov 16, 2024	Reinforcement Learning (RL)Scheduling	—Unverified
Automatic Treatment Planning using Reinforcement Learning for High-dose-rate Prostate Brachytherapy	Jun 11, 2025	AnatomyReinforcement Learning (RL)	—Unverified
Automatic Text Summarization Using Reinforcement Learning with Embedding Features	Nov 1, 2017	ARCInformation Retrieval	—Unverified
Adaptive learning for financial markets mixing model-based and model-free RL for volatility targeting	Apr 19, 2021	Deep Reinforcement Learningmodel	—Unverified
Automatic Speech Recognition using Advanced Deep Learning Approaches: A survey	Mar 2, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Automatic Source Code Summarization via Reinforcement Learning	Dec 14, 2020	Cloud ComputingCode Summarization	—Unverified
CROPS: A Deployable Crop Management System Over All Possible State Availabilities	Nov 9, 2024	AllManagement	—Unverified
Cross-Domain Perceptual Reward Functions	May 25, 2017	Deep Reinforcement Learningreinforcement-learning	—Unverified
Automatic Risk Adaptation in Distributional Reinforcement Learning	Jun 11, 2021	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Automatic Representation for Lifetime Value Recommender Systems	Feb 23, 2017	Recommendation SystemsReinforcement Learning	—Unverified
A Lower Bound for the Sample Complexity of Inverse Reinforcement Learning	Mar 7, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Learning to Rewrite Prompts for Personalized Text Generation	Sep 29, 2023	Language ModellingLarge Language Model	—Unverified
Automatic Poetry Generation with Mutual Reinforcement Learning	Oct 1, 2018	reinforcement-learningReinforcement Learning	—Unverified
Adaptive Intelligent Secondary Control of Microgrids Using a Biologically-Inspired Reinforcement Learning	May 2, 2019	reinforcement-learningReinforcement Learning	—Unverified
ACL-QL: Adaptive Conservative Level in Q-Learning for Offline Reinforcement Learning	Dec 22, 2024	D4RLQ-Learning	—Unverified
Automatic, Personalized, and Flexible Playlist Generation using Reinforcement Learning	Sep 12, 2018	DiversityLanguage Modeling	—Unverified
A Local Temporal Difference Code for Distributional Reinforcement Learning	Dec 1, 2020	Distributional Reinforcement LearningImputation	—Unverified
Automatic Machine Learning by Pipeline Synthesis using Model-Based Reinforcement Learning and a Grammar	May 24, 2019	AutoMLBayesian Optimization	—Unverified
Automatic low-bit hybrid quantization of neural networks through meta learning	Apr 24, 2020	Meta-LearningQuantization	—Unverified
Almost Optimal Model-Free Reinforcement Learningvia Reference-Advantage Decomposition	Dec 1, 2020	reinforcement-learningReinforcement Learning	—Unverified
Adaptive Insurance Reserving with CVaR-Constrained Reinforcement Learning under Macroeconomic Regimes	Apr 13, 2025	Reinforcement Learning (RL)	—Unverified
An Empirical Study on Hyperparameters and their Interdependence for RL Generalization	Jun 2, 2019	reinforcement-learningReinforcement Learning	—Unverified
CrossNorm: On Normalization for Off-Policy Reinforcement Learning	Sep 25, 2019	MuJoCoreinforcement-learning	—Unverified
CubeTR: Learning to Solve the Rubik's Cube using Transformers	Sep 29, 2021	reinforcement-learningReinforcement Learning	—Unverified
DanZero: Mastering GuanDan Game with Reinforcement Learning	Oct 31, 2022	Card GamesGPU	—Unverified
Almost Optimal Model-Free Reinforcement Learning via Reference-Advantage Decomposition	Apr 21, 2020	reinforcement-learningReinforcement Learning	—Unverified
Centerline Depth World Reinforcement Learning-based Left Atrial Appendage Orifice Localization	Apr 2, 2019	reinforcement-learningReinforcement Learning	—Unverified
Adaptive Informative Path Planning Using Deep Reinforcement Learning for UAV-based Active Sensing	Sep 28, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Automatic Goal Generation using Dynamical Distance Learning	Mar 9, 2021	Decision MakingReinforcement Learning (RL)	—Unverified
Automatic Goal Generation using Dynamical Distance Learning	Nov 7, 2021	Decision MakingReinforcement Learning (RL)	—Unverified
Adaptive Honeypot Engagement through Reinforcement Learning of Semi-Markov Decision Processes	Jun 27, 2019	reinforcement-learningReinforcement Learning	—Unverified
Automatic Gesture Recognition in Robot-assisted Surgery with Reinforcement Learning and Tree Search	Feb 20, 2020	Action SegmentationGesture Recognition	—Unverified
Automatic Financial Trading Agent for Low-risk Portfolio Management using Deep Reinforcement Learning	Sep 7, 2019	Deep Reinforcement LearningManagement	—Unverified
All Roads Lead to Likelihood: The Value of Reinforcement Learning in Fine-Tuning	Mar 3, 2025	AllReinforcement Learning (RL)	—Unverified
A Closer Look at Reward Decomposition for High-Level Robotic Explanations	Apr 25, 2023	Reinforcement Learning (RL)Vocal Bursts Intensity Prediction	—Unverified
Automatic Face Aging in Videos via Deep Reinforcement Learning	Nov 27, 2018	Deep Reinforcement LearningFace Verification	—Unverified
Automatic Exploration Process Adjustment for Safe Reinforcement Learning with Joint Chance Constraint Satisfaction	Mar 5, 2021	Decision MakingObject	—Unverified
Automatic Essay Scoring Incorporating Rating Schema via Reinforcement Learning	Oct 1, 2018	Machine Translationreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 54 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified