SOTAVerified|Agents Browse Leaderboard About

Q-Learning

The goal of Q-learning is to learn a policy, which tells an agent what action to take under what circumstances.

( Image credit: Playing Atari with Deep Reinforcement Learning )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1701–1725 of 1918 papers

Title	Date	Tasks	Status
BIBI System Description: Building with CNNs and Breaking with Deep Reinforcement Learning	Sep 1, 2017	Deep Reinforcement LearningQ-Learning	—Unverified
Biomimetic Ultra-Broadband Perfect Absorbers Optimised with Reinforcement Learning	Oct 28, 2019	Q-Learningreinforcement-learning	—Unverified
Blackwell Online Learning for Markov Decision Processes	Dec 28, 2020	Learning TheoryQ-Learning	—Unverified
BMG-Q: Localized Bipartite Match Graph Attention Q-Learning for Ride-Pooling Order Dispatch	Jan 23, 2025	Graph AttentionGraph Sampling	—Unverified
BOFormer: Learning to Solve Multi-Objective Bayesian Optimization via Non-Markovian RL	May 28, 2025	Bayesian OptimizationHyperparameter Optimization	—Unverified
Boosting Offline Reinforcement Learning with Residual Generative Modeling	Jun 19, 2021	Offline RLQ-Learning	—Unverified
Bootstrapped Hindsight Experience replay with Counterintuitive Prioritization	Sep 29, 2021	Q-Learning	—Unverified
Bootstrapping Expectiles in Reinforcement Learning	Jun 6, 2024	Q-Learningreinforcement-learning	—Unverified
Breaking the Deadly Triad with a Target Network	Jan 21, 2021	Q-Learning	—Unverified
Breaking the Sample Complexity Barrier to Regret-Optimal Model-Free Reinforcement Learning	Oct 9, 2021	Q-Learningreinforcement-learning	—Unverified
Bridging the Gap Between Value and Policy Based Reinforcement Learning	Feb 28, 2017	Q-Learningreinforcement-learning	—Unverified
Bridging the Performance Gap Between Target-Free and Target-Based Reinforcement Learning With Iterated Q-Learning	Jun 4, 2025	Q-Learning	—Unverified
Cache-Aided NOMA Mobile Edge Computing: A Reinforcement Learning Approach	Jun 20, 2019	Edge-computingQ-Learning	—Unverified
Caching Placement and Resource Allocation for Cache-Enabling UAV NOMA Networks	Aug 12, 2020	Q-LearningScheduling	—Unverified
CAN ALTQ LEARN FASTER: EXPERIMENTS AND THEORY	Sep 25, 2019	Atari GamesQ-Learning	—Unverified
Can LLM be a Good Path Planner based on Prompt Engineering? Mitigating the Hallucination for Path Planning	Aug 23, 2024	HallucinationPrompt Engineering	—Unverified
Can Q-Learning be Improved with Advice?	Oct 25, 2021	Q-Learningreinforcement-learning	—Unverified
Can Q-learning solve Multi Armed Bantids?	Oct 21, 2021	Decision MakingQ-Learning	—Unverified
Can Temporal-Difference and Q-Learning Learn Representation? A Mean-Field Theory	Jun 8, 2020	Deep Reinforcement LearningQ-Learning	—Unverified
Can Temporal-Diﬀerence and Q-Learning Learn Representation? A Mean-Field Theory	Dec 1, 2020	Deep Reinforcement LearningQ-Learning	—Unverified
CAQL: Continuous Action Q-Learning	Sep 26, 2019	continuous-controlContinuous Control	—Unverified
Career Path Recommendations for Long-term Income Maximization: A Reinforcement Learning Approach	Sep 11, 2023	Q-Learningreinforcement-learning	—Unverified
CARL-DTN: Context Adaptive Reinforcement Learning based Routing Algorithm in Delay Tolerant Network	May 2, 2021	Q-Learningreinforcement-learning	—Unverified
Catalytic evolution of cooperation in a population with behavioural bimodality	Jun 17, 2024	Q-Learning	—Unverified
Catch Me If You Can: Improving Adversaries in Cyber-Security With Q-Learning Algorithms	Feb 7, 2023	Q-Learning	—Unverified

Show:10 25 50

← PrevPage 69 of 77Next →

No leaderboard results yet.