SOTAVerified|Agents Browse Leaderboard About

Q-Learning

The goal of Q-learning is to learn a policy, which tells an agent what action to take under what circumstances.

( Image credit: Playing Atari with Deep Reinforcement Learning )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 776–800 of 1918 papers

Title	Date	Tasks	Status
Fitted Q-Learning for Relational Domains	Jun 10, 2020	Q-Learning	—Unverified
Learning in Discounted-cost and Average-cost Mean-field Games	Dec 31, 2019	Q-Learning	—Unverified
Fixed-Horizon Temporal Difference Methods for Stable Reinforcement Learning	Sep 9, 2019	Q-Learningreinforcement-learning	—Unverified
Entropy-Augmented Entropy-Regularized Reinforcement Learning and a Continuous Path from Policy Gradient to Q-Learning	May 18, 2020	Q-Learning	—Unverified
Entropic Risk Optimization in Discounted MDPs: Sample Complexity Bounds with a Generative Model	May 30, 2025	Q-Learning	—Unverified
Floyd-Warshall Reinforcement Learning: Learning from Past Experiences to Reach New Goals	Sep 25, 2018	Q-Learningreinforcement-learning	—Unverified
FM3Q: Factorized Multi-Agent MiniMax Q-Learning for Two-Team Zero-Sum Markov Game	Feb 1, 2024	Multi-agent Reinforcement LearningQ-Learning	—Unverified
Chemoreception and chemotaxis of a three-sphere swimmer	May 5, 2022	Q-Learning	—Unverified
FPGA Architecture for Deep Learning and its application to Planetary Robotics	Jan 26, 2017	CPUQ-Learning	—Unverified
Ensemble Bootstrapping for Q-Learning	Feb 28, 2021	Atari GamesQ-Learning	—Unverified
Characterizing the Action-Generalization Gap in Deep Q-Learning	May 11, 2022	Q-LearningReinforcement Learning (RL)	—Unverified
From r to Q^*: Your Language Model is Secretly a Q-Function	Apr 18, 2024	Language ModelingLanguage Modelling	—Unverified
An FPGA-Based On-Device Reinforcement Learning Approach using Online Sequential Learning	May 10, 2020	L2 RegularizationOpenAI Gym	—Unverified
A Deep Reinforcement Learning Framework for Contention-Based Spectrum Sharing	Oct 5, 2021	Deep Reinforcement LearningFairness	—Unverified
Full Gradient Deep Reinforcement Learning for Average-Reward Criterion	Apr 7, 2023	Deep Reinforcement LearningMulti-Armed Bandits	—Unverified
Channel Estimation via Successive Denoising in MIMO OFDM Systems: A Reinforcement Learning Approach	Jan 25, 2021	DenoisingQ-Learning	—Unverified
Enhancing reinforcement learning by a finite reward response filter with a case study in intelligent structural control	Oct 25, 2020	Q-Learningreinforcement-learning	—Unverified
Enhancing Q-Learning with Large Language Model Heuristics	May 6, 2024	Decision MakingLanguage Modeling	—Unverified
Gap-Dependent Bounds for Federated Q-learning	Feb 5, 2025	Q-Learning	—Unverified
Gap-Dependent Bounds for Q-Learning using Reference-Advantage Decomposition	Oct 10, 2024	Q-Learning	—Unverified
Gap-Dependent Bounds for Two-Player Markov Games	Jul 1, 2021	Q-LearningVocal Bursts Valence Prediction	—Unverified
GenCos' Behaviors Modeling Based on Q Learning Improved by Dichotomy	Aug 4, 2020	Q-Learning	—Unverified
Challenging On Car Racing Problem from OpenAI gym	Nov 2, 2019	Car Racingcontinuous-control	—Unverified
An Experimental Comparison Between Temporal Difference and Residual Gradient with Neural Network Approximation	May 25, 2022	Q-Learningreinforcement-learning	—Unverified
Enhancing Classification Performance via Reinforcement Learning for Feature Selection	Mar 9, 2024	Classificationfeature selection	—Unverified

Show:10 25 50

← PrevPage 32 of 77Next →

No leaderboard results yet.