Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4151–4200 of 15113 papers

Title	Date	Tasks	Status
Adapting Surprise Minimizing Reinforcement Learning Techniques for Transactive Control	Nov 11, 2021	Navigatereinforcement-learning	—Unverified
Adapting the Exploration Rate for Value-of-Information-Based Reinforcement Learning	Dec 20, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Adapting the Function Approximation Architecture in Online Reinforcement Learning	Jun 17, 2021	reinforcement-learningReinforcement Learning	—Unverified
Adapting User Interfaces with Model-based Reinforcement Learning	Mar 11, 2021	modelModel-based Reinforcement Learning	—Unverified
Adapting World Models with Latent-State Dynamics Residuals	Apr 3, 2025	MuJoCoReinforcement Learning (RL)	—Unverified
Adaptive 3D UI Placement in Mixed Reality Using Deep Reinforcement Learning	Apr 30, 2025	Deep Reinforcement LearningMixed Reality	—Unverified
Adaptive ABAC Policy Learning: A Reinforcement Learning Approach	May 18, 2021	AttributeManagement	—Unverified
Adaptive action supervision in reinforcement learning from real-world multi-agent demonstrations	May 22, 2023	Dynamic Time Warpingreinforcement-learning	—Unverified
Adaptive Actor-Critic Based Optimal Regulation for Drift-Free Uncertain Nonlinear Systems	Jun 13, 2024	Reinforcement Learning (RL)	—Unverified
Adaptive Adversarial Training for Meta Reinforcement Learning	Apr 27, 2021	Generative Adversarial NetworkMeta-Learning	—Unverified
Adaptive Aggregation for Safety-Critical Control	Feb 7, 2023	reinforcement-learningReinforcement Learning	—Unverified
Adaptive and Multiple Time-scale Eligibility Traces for Online Deep Reinforcement Learning	Aug 23, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Adaptive Batch Size for Safe Policy Gradients	Dec 1, 2017	Policy Gradient MethodsReinforcement Learning	—Unverified
Adaptive Behavior Generation for Autonomous Driving using Deep Reinforcement Learning with Compact Semantic States	Sep 10, 2018	Autonomous DrivingDeep Reinforcement Learning	—Unverified
Deep Reinforcement Learning for Adaptive Caching in Hierarchical Content Delivery Networks	Feb 27, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
ACNMP: Skill Transfer and Task Extrapolation through Learning from Demonstration and Reinforcement Learning via Representation Sharing	Mar 25, 2020	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Adaptive control of a mechatronic system using constrained residual reinforcement learning	Oct 6, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Adaptive Control of an Inverted Pendulum by a Reinforcement Learning-based LQR Method	Sep 30, 2023	BenchmarkingReinforcement Learning (RL)	—Unverified
Adaptive Control of Differentially Private Linear Quadratic Systems	Aug 26, 2021	Reinforcement Learning (RL)	—Unverified
Adaptive Coordination Offsets for Signalized Arterial Intersections using Deep Reinforcement Learning	Aug 6, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Adaptive Decision Making at the Intersection for Autonomous Vehicles Based on Skill Discovery	Jul 24, 2022	Autonomous DrivingAutonomous Vehicles	—Unverified
Adaptive Dialog Policy Learning with Hindsight and User Modeling	May 7, 2020	Reinforcement Learning (RL)	—Unverified
Adaptive Discounting of Training Time Attacks	Jan 5, 2024	Reinforcement Learning (RL)	—Unverified
Adaptive Discrete Communication Bottlenecks with Dynamic Vector Quantization	Feb 2, 2022	Quantizationreinforcement-learning	—Unverified
Policy Zooming: Adaptive Discretization-based Infinite-Horizon Average-Reward Reinforcement Learning	May 29, 2024	reinforcement-learningReinforcement Learning (RL)	—Unverified
Adaptive Discretization in Online Reinforcement Learning	Oct 29, 2021	Managementreinforcement-learning	—Unverified
Adaptive Droplet Routing in Digital Microfluidic Biochips Using Deep Reinforcement Learning	Jan 1, 2020	Deep Reinforcement LearningOpenAI Gym	—Unverified
Adaptive Energy Management for Real Driving Conditions via Transfer Reinforcement Learning	Jul 24, 2020	energy managementManagement	—Unverified
Adaptive Experience Selection for Policy Gradient	Feb 17, 2020	continuous-controlContinuous Control	—Unverified
Adaptive Federated Learning and Digital Twin for Industrial Internet of Things	Oct 25, 2020	ClusteringDeep Reinforcement Learning	—Unverified
Adaptive Genomic Evolution of Neural Network Topologies (AGENT) for State-to-Action Mapping in Autonomous Agents	Mar 17, 2019	Collision AvoidanceDiversity	—Unverified
Adaptive Graph Capsule Convolutional Networks	Sep 29, 2021	GPUReinforcement Learning (RL)	—Unverified
Adaptive Height Optimisation for Cellular-Connected UAVs using Reinforcement Learning	Jul 27, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Adaptive Honeypot Engagement through Reinforcement Learning of Semi-Markov Decision Processes	Jun 27, 2019	reinforcement-learningReinforcement Learning	—Unverified
Adaptive Informative Path Planning Using Deep Reinforcement Learning for UAV-based Active Sensing	Sep 28, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Adaptive Insurance Reserving with CVaR-Constrained Reinforcement Learning under Macroeconomic Regimes	Apr 13, 2025	Reinforcement Learning (RL)	—Unverified
Adaptive Intelligent Secondary Control of Microgrids Using a Biologically-Inspired Reinforcement Learning	May 2, 2019	reinforcement-learningReinforcement Learning	—Unverified
Adaptive learning for financial markets mixing model-based and model-free RL for volatility targeting	Apr 19, 2021	Deep Reinforcement Learningmodel	—Unverified
Adaptive Learning of Design Strategies over Non-Hierarchical Multi-Fidelity Models via Policy Alignment	Nov 16, 2024	Reinforcement Learning (RL)Scheduling	—Unverified
Adaptive Learning Rates for Multi-Agent Reinforcement Learning	Jan 1, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Adaptive Load Shedding for Grid Emergency Control via Deep Reinforcement Learning	Feb 25, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Adaptive model selection in photonic reservoir computing by reinforcement learning	Apr 27, 2020	Load ForecastingModel Selection	—Unverified
Adaptive Modulation and Coding based on Reinforcement Learning for 5G Networks	Nov 25, 2019	Q-Learningreinforcement-learning	—Unverified
Adaptive Multi-Fidelity Reinforcement Learning for Variance Reduction in Engineering Design Optimization	Mar 23, 2025	Reinforcement Learning (RL)Scheduling	—Unverified
Adaptive Multi-model Fusion Learning for Sparse-Reward Reinforcement Learning	Jan 1, 2021	Predictionreinforcement-learning	—Unverified
Adaptive Multi-pass Decoder for Neural Machine Translation	Oct 1, 2018	DecoderMachine Translation	—Unverified
Adaptive Neural Architectures for Recommender Systems	Nov 11, 2020	Deep Reinforcement LearningRecommendation Systems	—Unverified
Adaptive operator selection utilising generalised experience	Dec 4, 2023	Reinforcement Learning (RL)	—Unverified
Adaptive optimal training of animal behavior	Dec 1, 2016	Experimental Designreinforcement-learning	—Unverified
Adaptive Parameter Selection in Evolutionary Algorithms by Reinforcement Learning with Dynamic Discretization of Parameter Range	Mar 22, 2016	Evolutionary Algorithmsreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 84 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified