Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6726–6750 of 15113 papers

Title	Date	Tasks	Status
Dynamic Non-Prehensile Object Transport via Model-Predictive Reinforcement Learning	Nov 27, 2024	Model Predictive Controlreinforcement-learning	—Unverified
Dynamic object goal pushing with mobile manipulators through model-free constrained reinforcement learning	Feb 3, 2025	FrictionObject	—Unverified
Dynamic Obstacle Avoidance with Bounded Rationality Adversarial Reinforcement Learning	Mar 14, 2025	BenchmarkingNavigate	—Unverified
Dynamic Optimization of Storage Systems Using Reinforcement Learning Techniques	Dec 29, 2024	CPUQ-Learning	—Unverified
A Dynamic Penalty Function Approach for Constraints-Handling in Reinforcement Learning	Dec 22, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Enhancing Digital Health Services: A Machine Learning Approach to Personalized Exercise Goal Setting	Apr 3, 2022	Deep Reinforcement LearningManagement	—Unverified
Dynamic Planning in Open-Ended Dialogue using Reinforcement Learning	Jul 25, 2022	Natural Language Understandingreinforcement-learning	—Unverified
A General Framework on Enhancing Portfolio Management with Reinforcement Learning	Nov 26, 2019	Asset ManagementDeep Reinforcement Learning	—Unverified
Dynamic Pricing on E-commerce Platform with Deep Reinforcement Learning: A Field Experiment	Dec 5, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Dynamic Pricing on E-commerce Platform with Deep Reinforcement Learning	Sep 27, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
Dynamic probabilistic logic models for effective abstractions in RL	Oct 15, 2021	reinforcement-learningReinforcement Learning	—Unverified
Dynamic RAN Slicing for Service-Oriented Vehicular Networks via Constrained Learning	Dec 3, 2020	Reinforcement Learning (RL)	—Unverified
Dynamic Regret of Policy Optimization in Non-stationary Environments	Jun 30, 2020	Reinforcement Learning (RL)	—Unverified
Dynamic Reinforcement Learning for Actors	Feb 14, 2025	reinforcement-learningReinforcement Learning	—Unverified
Hierarchical Reinforcement Learning for Relay Selection and Power Optimization in Two-Hop Cooperative Relay Network	Nov 10, 2020	Deep Reinforcement LearningHierarchical Reinforcement Learning	—Unverified
Dynamic Resource Allocation for Metaverse Applications with Deep Reinforcement Learning	Feb 27, 2023	Deep Reinforcement Learningreinforcement-learning	—Unverified
Dynamic Retail Pricing via Q-Learning -- A Reinforcement Learning Framework for Enhanced Revenue Management	Nov 27, 2024	Decision MakingManagement	—Unverified
DynamicRouteGPT: A Real-Time Multi-Vehicle Dynamic Navigation Framework Based on Large Language Models	Aug 26, 2024	Bayesian InferenceCausal Inference	—Unverified
Dynamics-Adaptive Continual Reinforcement Learning via Progressive Contextualization	Sep 1, 2022	Bayesian InferenceKnowledge Distillation	—Unverified
Dynamic Safe Interruptibility for Decentralized Multi-Agent Reinforcement Learning	Apr 10, 2017	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Dynamic Sampling that Adapts: Iterative DPO for Self-Aware Mathematical Reasoning	May 22, 2025	Mathematical ReasoningReinforcement Learning (RL)	—Unverified
Dynamics Generalization via Information Bottleneck in Deep Reinforcement Learning	Aug 3, 2020	Decision MakingDeep Reinforcement Learning	—Unverified
Dynamic Shielding for Reinforcement Learning in Black-Box Environments	Jul 27, 2022	reinforcement-learningReinforcement Learning	—Unverified
Dynamic Spectrum Access for Ambient Backscatter Communication-assisted D2D Systems with Quantum Reinforcement Learning	Oct 23, 2024	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Dynamic Temporal Reconciliation by Reinforcement learning	Jan 28, 2022	reinforcement-learningReinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 270 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified