Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4201–4250 of 15113 papers

Title	Date	Tasks	Status
Adaptive patch foraging in deep reinforcement learning agents	Oct 14, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Adaptive perturbation adversarial training: based on reinforcement learning	Aug 30, 2021	reinforcement-learningReinforcement Learning	—Unverified
Adaptive Policy Learning for Offline-to-Online Reinforcement Learning	Mar 14, 2023	continuous-controlContinuous Control	—Unverified
Adaptive Policy Transfer in Reinforcement Learning	May 10, 2021	reinforcement-learningReinforcement Learning	—Unverified
Adaptive Probabilistic Trajectory Optimization via Efficient Approximate Inference	Aug 22, 2016	Model Predictive ControlReinforcement Learning	—Unverified
Adaptive Q-learning for Interaction-Limited Reinforcement Learning	Sep 29, 2021	Offline RLQ-Learning	—Unverified
Adaptive Q-Network: On-the-fly Target Selection for Deep Reinforcement Learning	May 25, 2024	Atari GamesAutoML	—Unverified
Adaptive Reinforcement Learning for Unobservable Random Delays	Jun 17, 2025	reinforcement-learningReinforcement Learning	—Unverified
Adaptive Reinforcement Learning for State Avoidance in Discrete Event Systems	Feb 28, 2025	Decision MakingReinforcement Learning (RL)	—Unverified
Adaptive Reinforcement Learning Model for Simulation of Urban Mobility during Crises	Sep 2, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Adaptive Reinforcement Learning through Evolving Self-Modifying Neural Networks	May 22, 2020	Meta-Learningreinforcement-learning	—Unverified
Adaptive Reward-Poisoning Attacks against Reinforcement Learning	Mar 27, 2020	reinforcement-learningReinforcement Learning	—Unverified
Adaptive Road Configurations for Improved Autonomous Vehicle-Pedestrian Interactions using Reinforcement Learning	Mar 22, 2023	Autonomous VehiclesManagement	—Unverified
Adaptive Rollout Length for Model-Based RL Using Model-Free Deep RL	Jun 6, 2022	Decision MakingDeep Reinforcement Learning	—Unverified
Adaptive routing protocols for determining optimal paths in AI multi-agent systems: a priority- and learning-enhanced approach	Mar 10, 2025	Reinforcement Learning (RL)	—Unverified
Adaptive Safe Reinforcement Learning-Enabled Optimization of Battery Fast-Charging Protocols	Jun 18, 2024	Reinforcement Learning (RL)Safe Reinforcement Learning	—Unverified
Adaptive Sampling Quasi-Newton Methods for Derivative-Free Stochastic Optimization	Oct 29, 2019	reinforcement-learningReinforcement Learning	—Unverified
Adaptive Sampling Quasi-Newton Methods for Zeroth-Order Stochastic Optimization	Sep 24, 2021	Reinforcement Learning (RL)Stochastic Optimization	—Unverified
Adaptive Security Policy Management in Cloud Environments Using Reinforcement Learning	May 13, 2025	Deep Reinforcement LearningIntrusion Detection	—Unverified
Adaptive Selection of Informative Path Planning Strategies via Reinforcement Learning	Aug 14, 2021	GPRPrediction	—Unverified
Adaptive Shooting for Bots in First Person Shooter Games Using Reinforcement Learning	Jun 14, 2018	reinforcement-learningReinforcement Learning	—Unverified
Adaptive Stochastic ADMM for Decentralized Reinforcement Learning in Edge Industrial IoT	Jun 30, 2021	Decision MakingEdge-computing	—Unverified
Adaptive Stochastic Nonlinear Model Predictive Control with Look-ahead Deep Reinforcement Learning for Autonomous Vehicle Motion Control	Nov 7, 2023	Decision MakingDeep Reinforcement Learning	—Unverified
Adaptive Stress Testing: Finding Likely Failure Events with Reinforcement Learning	Nov 6, 2018	Autonomous DrivingCollision Avoidance	—Unverified
Adaptive Stress Testing for Adversarial Learning in a Financial Environment	Jul 8, 2021	Fraud Detectionregression	—Unverified
Adaptive Stress Testing for Autonomous Vehicles	Feb 5, 2019	Autonomous VehiclesDecision Making	—Unverified
Adaptive Stress Testing without Domain Heuristics using Go-Explore	Apr 8, 2020	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Adaptive Structural Hyper-Parameter Configuration by Q-Learning	Mar 2, 2020	Evolutionary AlgorithmsQ-Learning	—Unverified
Adaptive Temporal Difference Learning with Linear Function Approximation	Feb 20, 2020	OpenAI Gymreinforcement-learning	—Unverified
Adaptive Torque Control of Exoskeletons under Spasticity Conditions via Reinforcement Learning	Mar 14, 2025	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Adaptive Trade-Offs in Off-Policy Learning	Oct 16, 2019	Off-policy evaluationreinforcement-learning	—Unverified
Adaptive trading strategies across liquidity pools	Aug 18, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Reinforcement Learning for Adaptive Traffic Signal Control: Turn-Based and Time-Based Approaches to Reduce Congestion	Aug 28, 2024	reinforcement-learningReinforcement Learning (RL)	—Unverified
Adaptive Transit Signal Priority based on Deep Reinforcement Learning and Connected Vehicles in a Traffic Microsimulation Environment	Jul 31, 2024	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Adaptive Tree Backup Algorithms for Temporal-Difference Reinforcement Learning	Jun 4, 2022	reinforcement-learningReinforcement Learning	—Unverified
Adaptive Trust Region Policy Optimization: Global Convergence and Faster Rates for Regularized MDPs	Sep 6, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Adaptive User Journeys in Pharma E-Commerce with Reinforcement Learning: Insights from SwipeRx	Aug 15, 2024	ManagementReinforcement Learning (RL)	—Unverified
Adaptive Warm-Start MCTS in AlphaZero-like Deep Reinforcement Learning	May 13, 2021	Board GamesDeep Reinforcement Learning	—Unverified
Adapt-to-Learn: Policy Transfer in Reinforcement Learning	Sep 25, 2019	reinforcement-learningReinforcement Learning	—Unverified
AURO: Reinforcement Learning for Adaptive User Retention Optimization in Recommender Systems	Oct 6, 2023	NavigateRecommendation Systems	—Unverified
A Database of Multimodal Data to Construct a Simulated Dialogue Partner with Varying Degrees of Cognitive Health	Jun 1, 2022	Dialogue ManagementManagement	—Unverified
A data-driven choice of misfit function for FWI using reinforcement learning	Feb 8, 2020	reinforcement-learningReinforcement Learning	—Unverified
A Data-Driven Model-Reference Adaptive Control Approach Based on Reinforcement Learning	Mar 17, 2023	reinforcement-learningReinforcement Learning (RL)	—Unverified
A Dataset for Developing and Benchmarking Active Vision	Feb 27, 2017	BenchmarkingGeneral Classification	—Unverified
AdaTest:Reinforcement Learning and Adaptive Sampling for On-chip Hardware Trojan Detection	Apr 12, 2022	Backdoor AttackReinforcement Learning (RL)	—Unverified
AdaWM: Adaptive World Model based Planning for Autonomous Driving	Jan 22, 2025	Autonomous DrivingModel-based Reinforcement Learning	—Unverified
Adding Conditional Control to Diffusion Models with Reinforcement Learning	Jun 17, 2024	reinforcement-learningReinforcement Learning	—Unverified
Addressing Distribution Shift in Online Reinforcement Learning with Offline Datasets	Jan 1, 2021	D4RLMuJoCo	—Unverified
Addressing Extrapolation Error in Deep Offline Reinforcement Learning	Jan 1, 2021	Offline RLreinforcement-learning	—Unverified
Addressing Inherent Uncertainty: Risk-Sensitive Behavior Generation for Automated Driving using Distributional Reinforcement Learning	Feb 5, 2021	Distributional Reinforcement LearningReinforcement Learning (RL)	—Unverified

Show:10 25 50

← PrevPage 85 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified