Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6701–6750 of 15113 papers

Title	Date	Tasks	Status
Dynamically meeting performance objectives for multiple services on a service mesh	Oct 8, 2022	BlockingManagement	—Unverified
Dynamically writing coupled memories using a reinforcement learning agent, meeting physical bounds	May 6, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Dynamic Angle Selection in X-Ray CT: A Reinforcement Learning Approach to Optimal Stopping	Mar 16, 2025	Computed Tomography (CT)Experimental Design	—Unverified
Dynamic Bicycle Dispatching of Dockless Public Bicycle-sharing Systems using Multi-objective Reinforcement Learning	Jan 19, 2021	Multi-Objective Reinforcement LearningReinforcement Learning (RL)	—Unverified
Dynamic Channel Access via Meta-Reinforcement Learning	Dec 24, 2021	channel selectionDeep Reinforcement Learning	—Unverified
Dynamic Collaborative Multi-Agent Reinforcement Learning Communication for Autonomous Drone Reforestation	Nov 14, 2022	Graph Neural NetworkMulti-agent Reinforcement Learning	—Unverified
Dynamic Context Selection for Document-level Neural Machine Translation via Reinforcement Learning	Oct 9, 2020	Machine Translationreinforcement-learning	—Unverified
Dynamic Contrastive Skill Learning with State-Transition Based Skill Clustering and Dynamic Length Adjustment	Apr 21, 2025	Contrastive LearningDecision Making	—Unverified
Dynamic-Depth Context Tree Weighting	Dec 1, 2017	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Dynamic Dialogue Policy for Continual Reinforcement Learning	Apr 12, 2022	Continual Learningreinforcement-learning	—Unverified
Dynamic Dispatching for Large-Scale Heterogeneous Fleet via Multi-agent Deep Reinforcement Learning	Aug 24, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Dynamic Experience Replay	Mar 4, 2020	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Dynamic Face Video Segmentation via Reinforcement Learning	Jul 2, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Dynamic Graph Configuration with Reinforcement Learning for Connected Autonomous Vehicle Trajectories	Oct 14, 2019	Autonomous Vehiclesreinforcement-learning	—Unverified
Dynamic Horizon Value Estimation for Model-based Reinforcement Learning	Sep 21, 2020	Model-based Reinforcement LearningNovelty Detection	—Unverified
Dynamic Input for Deep Reinforcement Learning in Autonomous Driving	Jul 25, 2019	Autonomous DrivingDecision Making	—Unverified
Dynamic Interaction-Aware Scene Understanding for Reinforcement Learning in Autonomous Driving	Sep 30, 2019	Autonomous DrivingDecision Making	—Unverified
Dynamic Learning Rate for Deep Reinforcement Learning: A Bandit Approach	Oct 16, 2024	Deep Reinforcement LearningMeta-Learning	—Unverified
Dynamic Load Balancing for EV Charging Stations Using Reinforcement Learning and Demand Prediction	Mar 9, 2025	Graph Neural NetworkReinforcement Learning (RL)	—Unverified
Dynamic Matching Markets in Power Grid: Concepts and Solution using Deep Reinforcement Learning	Apr 12, 2021	Deep Reinforcement LearningDiversity	—Unverified
Dynamic Measurement Scheduling for Adverse Event Forecasting using Deep RL	Dec 1, 2018	Deep Reinforcement LearningReinforcement Learning	—Unverified
Dynamic Memory-based Curiosity: A Bootstrap Approach for Exploration	Aug 24, 2022	Reinforcement Learning (RL)	—Unverified
Dynamic Multichannel Access via Multi-agent Reinforcement Learning: Throughput and Fairness Guarantees	May 10, 2021	FairnessMulti-agent Reinforcement Learning	—Unverified
Dynamic network congestion pricing based on deep reinforcement learning	Jun 24, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Dynamic Noises of Multi-Agent Environments Can Improve Generalization: Agent-based Models meets Reinforcement Learning	Mar 26, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Dynamic Non-Prehensile Object Transport via Model-Predictive Reinforcement Learning	Nov 27, 2024	Model Predictive Controlreinforcement-learning	—Unverified
Dynamic object goal pushing with mobile manipulators through model-free constrained reinforcement learning	Feb 3, 2025	FrictionObject	—Unverified
Dynamic Obstacle Avoidance with Bounded Rationality Adversarial Reinforcement Learning	Mar 14, 2025	BenchmarkingNavigate	—Unverified
Dynamic Optimization of Storage Systems Using Reinforcement Learning Techniques	Dec 29, 2024	CPUQ-Learning	—Unverified
A Dynamic Penalty Function Approach for Constraints-Handling in Reinforcement Learning	Dec 22, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Enhancing Digital Health Services: A Machine Learning Approach to Personalized Exercise Goal Setting	Apr 3, 2022	Deep Reinforcement LearningManagement	—Unverified
Dynamic Planning in Open-Ended Dialogue using Reinforcement Learning	Jul 25, 2022	Natural Language Understandingreinforcement-learning	—Unverified
A General Framework on Enhancing Portfolio Management with Reinforcement Learning	Nov 26, 2019	Asset ManagementDeep Reinforcement Learning	—Unverified
Dynamic Pricing on E-commerce Platform with Deep Reinforcement Learning: A Field Experiment	Dec 5, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Dynamic Pricing on E-commerce Platform with Deep Reinforcement Learning	Sep 27, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
Dynamic probabilistic logic models for effective abstractions in RL	Oct 15, 2021	reinforcement-learningReinforcement Learning	—Unverified
Dynamic RAN Slicing for Service-Oriented Vehicular Networks via Constrained Learning	Dec 3, 2020	Reinforcement Learning (RL)	—Unverified
Dynamic Regret of Policy Optimization in Non-stationary Environments	Jun 30, 2020	Reinforcement Learning (RL)	—Unverified
Dynamic Reinforcement Learning for Actors	Feb 14, 2025	reinforcement-learningReinforcement Learning	—Unverified
Hierarchical Reinforcement Learning for Relay Selection and Power Optimization in Two-Hop Cooperative Relay Network	Nov 10, 2020	Deep Reinforcement LearningHierarchical Reinforcement Learning	—Unverified
Dynamic Resource Allocation for Metaverse Applications with Deep Reinforcement Learning	Feb 27, 2023	Deep Reinforcement Learningreinforcement-learning	—Unverified
Dynamic Retail Pricing via Q-Learning -- A Reinforcement Learning Framework for Enhanced Revenue Management	Nov 27, 2024	Decision MakingManagement	—Unverified
DynamicRouteGPT: A Real-Time Multi-Vehicle Dynamic Navigation Framework Based on Large Language Models	Aug 26, 2024	Bayesian InferenceCausal Inference	—Unverified
Dynamics-Adaptive Continual Reinforcement Learning via Progressive Contextualization	Sep 1, 2022	Bayesian InferenceKnowledge Distillation	—Unverified
Dynamic Safe Interruptibility for Decentralized Multi-Agent Reinforcement Learning	Apr 10, 2017	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Dynamic Sampling that Adapts: Iterative DPO for Self-Aware Mathematical Reasoning	May 22, 2025	Mathematical ReasoningReinforcement Learning (RL)	—Unverified
Dynamics Generalization via Information Bottleneck in Deep Reinforcement Learning	Aug 3, 2020	Decision MakingDeep Reinforcement Learning	—Unverified
Dynamic Shielding for Reinforcement Learning in Black-Box Environments	Jul 27, 2022	reinforcement-learningReinforcement Learning	—Unverified
Dynamic Spectrum Access for Ambient Backscatter Communication-assisted D2D Systems with Quantum Reinforcement Learning	Oct 23, 2024	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Dynamic Temporal Reconciliation by Reinforcement learning	Jan 28, 2022	reinforcement-learningReinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 135 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified