SOTAVerified|Agents Browse Leaderboard About

Q-Learning

The goal of Q-learning is to learn a policy, which tells an agent what action to take under what circumstances.

( Image credit: Playing Atari with Deep Reinforcement Learning )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1351–1375 of 1918 papers

Title	Date	Tasks	Status
Offline Guarded Safe Reinforcement Learning for Medical Treatment Optimization Strategies	May 22, 2025	Offline RLQ-Learning	—Unverified
Offline Q-Learning on Diverse Multi-Task Data Both Scales And Generalizes	Nov 28, 2022	Offline RLQ-Learning	—Unverified
Offline Reinforcement Learning and Sequence Modeling for Downlink Link Adaptation	Oct 30, 2024	Offline RLQ-Learning	—Unverified
Offline Reinforcement Learning for Wireless Network Optimization with Mixture Datasets	Nov 19, 2023	ManagementOffline RL	—Unverified
Offline Reinforcement Learning with Differentiable Function Approximation is Provably Efficient	Oct 3, 2022	Decision MakingOffline RL	—Unverified
Offline Reinforcement Learning with Imbalanced Datasets	Jul 6, 2023	D4RLOffline RL	—Unverified
Offline RL With Realistic Datasets: Heteroskedasticity and Support Constraints	Nov 2, 2022	Atari GamesOffline RL	—Unverified
Offline Robot Reinforcement Learning with Uncertainty-Guided Human Expert Sampling	Dec 16, 2022	MuJoCoQ-Learning	—Unverified
Composite Q-learning: Multi-scale Q-function Decomposition and Separable Optimization	Sep 30, 2019	Q-LearningReinforcement Learning	—Unverified
Off-policy Multi-step Q-learning	Sep 25, 2019	Q-Learning	—Unverified
On Assessing The Safety of Reinforcement Learning algorithms Using Formal Methods	Nov 8, 2021	Autonomous VehiclesQ-Learning	—Unverified
On Bellman's principle of optimality and Reinforcement learning for safety-constrained Markov decision process	Feb 25, 2023	Q-Learningreinforcement-learning	—Unverified
On-board Deep Q-Network for UAV-assisted Online Power Transfer and Data Collection	Jun 4, 2019	Deep Reinforcement LearningQ-Learning	—Unverified
On Convergence of Average-Reward Off-Policy Control Algorithms in Weakly Communicating MDPs	Sep 30, 2022	Q-Learning	—Unverified
On Convergence of Average-Reward Q-Learning in Weakly Communicating Markov Decision Processes	Aug 29, 2024	Q-LearningReinforcement Learning (RL)	—Unverified
On Decentralizing Federated Reinforcement Learning in Multi-Robot Scenarios	Jul 19, 2022	Federated LearningQ-Learning	—Unverified
On Designing Multi-UAV aided Wireless Powered Dynamic Communication via Hierarchical Deep Reinforcement Learning	Dec 13, 2023	Deep Reinforcement LearningQ-Learning	—Unverified
On Global Convergence Rates for Federated Policy Gradient under Heterogeneous Environment	May 29, 2025	Federated LearningPolicy Gradient Methods	—Unverified
On Information Asymmetry in Competitive Multi-Agent Reinforcement Learning: Convergence and Optimality	Oct 21, 2020	Multi-agent Reinforcement LearningQ-Learning	—Unverified
Online Adaptive Optimal Control Algorithm Based on Synchronous Integral Reinforcement Learning With Explorations	May 19, 2021	Q-Learningreinforcement-learning	—Unverified
Online Antenna Tuning in Heterogeneous Cellular Networks with Deep Reinforcement Learning	Mar 15, 2019	Deep Reinforcement LearningQ-Learning	—Unverified
On-line Building Energy Optimization using Deep Reinforcement Learning	Jul 18, 2017	Deep Reinforcement Learningenergy management	—Unverified
Online Frequency Scheduling by Learning Parallel Actions	Jun 7, 2024	Graph Neural NetworkQ-Learning	—Unverified
Online inductive learning from answer sets for efficient reinforcement learning exploration	Jan 13, 2025	Inductive LearningInductive logic programming	—Unverified
Online Learning for Offloading and Autoscaling in Energy Harvesting Mobile Edge Computing	Mar 17, 2017	Edge-computingManagement	—Unverified

Show:10 25 50

← PrevPage 55 of 77Next →

No leaderboard results yet.