SOTAVerified|Agents Browse Leaderboard About

Q-Learning

The goal of Q-learning is to learn a policy, which tells an agent what action to take under what circumstances.

( Image credit: Playing Atari with Deep Reinforcement Learning )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 726–750 of 1918 papers

Title	Date	Tasks	Status
Exploration with Unreliable Intrinsic Reward in Multi-Agent Reinforcement Learning	Jun 5, 2019	Multi-agent Reinforcement LearningQ-Learning	—Unverified
Exploratory Control with Tsallis Entropy for Latent Factor Models	Nov 14, 2022	Q-Learning	—Unverified
Exploring Competitive and Collusive Behaviors in Algorithmic Pricing with Deep Reinforcement Learning	Mar 14, 2025	Deep Reinforcement LearningQ-Learning	—Unverified
A Deep Reinforcement Learning Trader without Offline Training	Mar 1, 2023	Deep Reinforcement LearningQ-Learning	—Unverified
Action-modulated midbrain dopamine activity arises from distributed control policies	Jul 1, 2022	Q-Learningreinforcement-learning	—Unverified
Accelerated Target Updates for Q-learning	May 7, 2019	Atari GamesQ-Learning	—Unverified
Equivalence Between Policy Gradients and Soft Q-Learning	Apr 21, 2017	Policy Gradient MethodsQ-Learning	—Unverified
Episodic Exploration for Deep Deterministic Policies: An Application to StarCraft Micromanagement Tasks	Sep 10, 2016	Q-Learningreinforcement-learning	—Unverified
Fast Adaptive Anti-Jamming Channel Access via Deep Q Learning and Coarse-Grained Spectrum Prediction	Feb 7, 2025	Deep Reinforcement LearningQ-Learning	—Unverified
Environment Transformer and Policy Optimization for Model-Based Offline Reinforcement Learning	Mar 7, 2023	Continuous ControlOffline RL	—Unverified
Chrome Dino Run using Reinforcement Learning	Aug 15, 2020	Q-Learningreinforcement-learning	—Unverified
Entropy-Augmented Entropy-Regularized Reinforcement Learning and a Continuous Path from Policy Gradient to Q-Learning	May 18, 2020	Q-Learning	—Unverified
Faster Deep Q-learning using Neural Episodic Control	Jan 6, 2018	Deep Reinforcement LearningQ-Learning	—Unverified
Faster Non-asymptotic Convergence for Double Q-learning	Dec 1, 2021	Q-Learning	—Unverified
Faster Q-Learning Algorithms for Restless Bandits	Sep 6, 2024	Multi-Armed BanditsQ-Learning	—Unverified
Entropic Risk Optimization in Discounted MDPs: Sample Complexity Bounds with a Generative Model	May 30, 2025	Q-Learning	—Unverified
Fast-Fading Channel and Power Optimization of the Magnetic Inductive Cellular Network	Jun 7, 2024	Q-Learning	—Unverified
Chemoreception and chemotaxis of a three-sphere swimmer	May 5, 2022	Q-Learning	—Unverified
Federated Double Deep Q-learning for Joint Delay and Energy Minimization in IoT networks	Apr 2, 2021	Deep Reinforcement LearningFederated Learning	—Unverified
Federated Offline Reinforcement Learning: Collaborative Single-Policy Coverage Suffices	Feb 8, 2024	Federated LearningOffline RL	—Unverified
Federated Q-Learning: Linear Regret Speedup with Low Communication Cost	Dec 22, 2023	Q-Learningreinforcement-learning	—Unverified
Federated Q-Learning with Reference-Advantage Decomposition: Almost Optimal Regret and Logarithmic Communication Cost	May 29, 2024	Q-Learning	—Unverified
Federated Stochastic Approximation under Markov Noise and Heterogeneity: Applications in Reinforcement Learning	Jun 21, 2022	Q-Learningreinforcement-learning	—Unverified
FedHQL: Federated Heterogeneous Q-Learning	Jan 26, 2023	Q-Learningreinforcement-learning	—Unverified
Ensemble Bootstrapping for Q-Learning	Feb 28, 2021	Atari GamesQ-Learning	—Unverified

Show:10 25 50

← PrevPage 30 of 77Next →

No leaderboard results yet.