Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2601–2625 of 15113 papers

Title	Date	Tasks	Status
A Collaborative Multi-agent Reinforcement Learning Framework for Dialog Action Decomposition	Nov 1, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
A Machine Learning Approach to Routing	Aug 10, 2017	BIG-bench Machine LearningDeep Reinforcement Learning	—Unverified
Reinforcement Learning with Non-Markovian Rewards	Dec 5, 2019	Q-Learningreinforcement-learning	—Unverified
Coordinated Multi-Agent Exploration Using Shared Goals	Jan 1, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Coordinated Random Access for Industrial IoT With Correlated Traffic By Reinforcement-Learning	Sep 17, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Coordinating Disaster Emergency Response with Heuristic Reinforcement Learning	Nov 12, 2018	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Autonomous navigation of catheters and guidewires in mechanical thrombectomy using inverse reinforcement learning	Jun 18, 2024	Autonomous NavigationReinforcement Learning (RL)	—Unverified
Autonomous Navigation of an Ultrasound Probe Towards Standard Scan Planes with Deep Reinforcement Learning	Mar 1, 2021	Autonomous NavigationDeep Reinforcement Learning	—Unverified
A Machine Learning Approach for Task and Resource Allocation in Mobile Edge Computing Based Networks	Jul 20, 2020	BIG-bench Machine LearningEdge-computing	—Unverified
A Machine Learning Approach for Prosumer Management in Intraday Electricity Markets	Mar 11, 2022	BIG-bench Machine LearningManagement	—Unverified
Autonomous Maintenance in IoT Networks via AoI-driven Deep Reinforcement Learning	Dec 31, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Adaptive Multi-pass Decoder for Neural Machine Translation	Oct 1, 2018	DecoderMachine Translation	—Unverified
A Cognitive Architecture Based on a Learning Classifier System with Spiking Classifiers	Aug 31, 2015	reinforcement-learningReinforcement Learning	—Unverified
Autonomous Learning of Features for Control: Experiments with Embodied and Situated Agents	Sep 15, 2020	continuous-controlContinuous Control	—Unverified
Autonomous Industrial Management via Reinforcement Learning: Self-Learning Agents for Decision-Making -- A Review	Oct 20, 2019	Decision MakingFault Detection	—Unverified
A Lyapunov Theory for Finite-Sample Guarantees of Asynchronous Q-Learning and TD-Learning Variants	Feb 2, 2021	Q-LearningReinforcement Learning (RL)	—Unverified
Autonomous Highway Driving using Deep Reinforcement Learning	Mar 29, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Autonomous Extraction of a Hierarchical Structure of Tasks in Reinforcement Learning, A Sequential Associate Rule Mining Approach	Nov 17, 2018	reinforcement-learningReinforcement Learning	—Unverified
A Lyapunov Drift-Plus-Penalty Method Tailored for Reinforcement Learning with Queue Stability	Jun 4, 2025	reinforcement-learningReinforcement Learning	—Unverified
Adaptive Multi-model Fusion Learning for Sparse-Reward Reinforcement Learning	Jan 1, 2021	Predictionreinforcement-learning	—Unverified
Autonomous Extracting a Hierarchical Structure of Tasks in Reinforcement Learning and Multi-task Reinforcement Learning	Sep 14, 2017	reinforcement-learningReinforcement Learning	—Unverified
Adaptive Multi-Fidelity Reinforcement Learning for Variance Reduction in Engineering Design Optimization	Mar 23, 2025	Reinforcement Learning (RL)Scheduling	—Unverified
Autonomous Drone Swarm Navigation and Multi-target Tracking in 3D Environments with Dynamic Obstacles	Feb 13, 2022	Deep Reinforcement LearningManagement	—Unverified
Autonomous Drone Racing with Deep Reinforcement Learning	Mar 15, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
AltGraph: Redesigning Quantum Circuits Using Generative Graph Models for Efficient Optimization	Feb 23, 2024	Reinforcement Learning (RL)	—Unverified

Show:10 25 50

← PrevPage 105 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified