SOTAVerified|Agents Browse Leaderboard About

Q-Learning

The goal of Q-learning is to learn a policy, which tells an agent what action to take under what circumstances.

( Image credit: Playing Atari with Deep Reinforcement Learning )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 276–300 of 1918 papers

Title	Date	Tasks	Status
Edge Delayed Deep Deterministic Policy Gradient: efficient continuous control for edge scenarios	Dec 9, 2024	continuous-controlContinuous Control	—Unverified
DRL4AOI: A DRL Framework for Semantic-aware AOI Segmentation in Location-Based Services	Dec 6, 2024	Deep Reinforcement LearningQ-Learning	CodeCode Available
Demonstration Selection for In-Context Learning via Reinforcement Learning	Dec 5, 2024	ClassificationDiversity	—Unverified
Comparative Analysis of Multi-Agent Reinforcement Learning Policies for Crop Planning Decision Support	Dec 3, 2024	Computational EfficiencyFairness	—Unverified
Mean-Field Sampling for Cooperative Multi-Agent Reinforcement Learning	Dec 1, 2024	Decision MakingMulti-agent Reinforcement Learning	—Unverified
Q-learning-based Model-free Safety Filter	Nov 29, 2024	modelQ-Learning	—Unverified
Dynamic Retail Pricing via Q-Learning -- A Reinforcement Learning Framework for Enhanced Revenue Management	Nov 27, 2024	Decision MakingManagement	—Unverified
Time-Scale Separation in Q-Learning: Extending TD() for Action-Value Function Decomposition	Nov 21, 2024	Q-LearningReinforcement Learning (RL)	—Unverified
Almost Sure Convergence Rates and Concentration of Stochastic Approximation and Reinforcement Learning with Markovian Noise	Nov 20, 2024	Q-Learning	—Unverified
Structure learning with Temporal Gaussian Mixture for model-based Reinforcement Learning	Nov 18, 2024	Decision MakingModel-based Reinforcement Learning	—Unverified
Mitigating Relative Over-Generalization in Multi-Agent Reinforcement Learning	Nov 17, 2024	Multi-agent Reinforcement LearningQ-Learning	—Unverified
Coverage Analysis for Digital Cousin Selection -- Improving Multi-Environment Q-Learning	Nov 13, 2024	Q-Learning	—Unverified
Overcoming the Curse of Dimensionality in Reinforcement Learning Through Approximate Factorization	Nov 12, 2024	Q-LearningReinforcement Learning (RL)	—Unverified
Navigation with QPHIL: Quantizing Planner for Hierarchical Implicit Q-Learning	Nov 12, 2024	Imitation LearningOffline RL	—Unverified
Enhancing Robot Assistive Behaviour with Reinforcement Learning and Theory of Mind	Nov 11, 2024	Q-Learning	CodeCode Available
Real-World Offline Reinforcement Learning from Vision Language Model Feedback	Nov 8, 2024	Language ModelingLanguage Modelling	—Unverified
Reinforcement Learning for Adaptive Resource Scheduling in Complex System Environments	Nov 8, 2024	Cloud ComputingEdge-computing	—Unverified
Asymptotic regularity of a generalised stochastic Halpern scheme with applications	Nov 7, 2024	Q-LearningStochastic Optimization	—Unverified
Q-SFT: Q-Learning for Language Models via Supervised Fine-Tuning	Nov 7, 2024	Offline RLPolicy Gradient Methods	—Unverified
Maximizing User Connectivity in AI-Enabled Multi-UAV Networks: A Distributed Strategy Generalized to Arbitrary User Distributions	Nov 7, 2024	Deep Reinforcement LearningQ-Learning	—Unverified
Think Smart, Act SMARL! Analyzing Probabilistic Logic Shields for Multi-Agent Reinforcement Learning	Nov 7, 2024	Multi-agent Reinforcement LearningQ-Learning	CodeCode Available
Temporal-Difference Learning Using Distributed Error Signals	Nov 6, 2024	Q-Learning	CodeCode Available
Simulation of Nanorobots with Artificial Intelligence and Reinforcement Learning for Advanced Cancer Cell Detection and Tracking	Nov 4, 2024	Cell DetectionNavigate	CodeCode Available
Regret of exploratory policy improvement and q-learning	Nov 2, 2024	Q-Learning	—Unverified
HAVER: Instance-Dependent Error Bounds for Maximum Mean Estimation and Applications to Q-Learning and Monte Carlo Tree Search	Nov 1, 2024	Q-Learning	—Unverified

Show:10 25 50

← PrevPage 12 of 77Next →

No leaderboard results yet.