SOTAVerified|Agents Browse Leaderboard About

Q-Learning

The goal of Q-learning is to learn a policy, which tells an agent what action to take under what circumstances.

( Image credit: Playing Atari with Deep Reinforcement Learning )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1301–1325 of 1918 papers

Title	Date	Tasks	Status
Multi-agent Reinforcement Learning in Bayesian Stackelberg Markov Games for Adaptive Moving Target Defense	Jul 20, 2020	Multi-agent Reinforcement LearningQ-Learning	—Unverified
Multi-Agent Reinforcement Learning in a Realistic Limit Order Book Market Simulation	Jun 10, 2020	Multi-agent Reinforcement LearningQ-Learning	—Unverified
Multi-agent Reinforcement Learning with Deep Networks for Diverse Q-Vectors	Jun 12, 2024	Multi-agent Reinforcement LearningQ-Learning	—Unverified
Multiagent Soft Q-Learning	Apr 25, 2018	Policy Gradient MethodsQ-Learning	—Unverified
Multi-Armed Bandits for Correlated Markovian Environments with Smoothed Reward Feedback	Mar 11, 2018	Multi-Armed BanditsQ-Learning	—Unverified
Multi-Bellman operator for convergence of Q-learning with linear function approximation	Sep 28, 2023	Q-Learning	—Unverified
Multicrew Scheduling and Routing in Road Network Restoration Based on Deep Q-learning	Nov 24, 2021	Q-LearningScheduling	—Unverified
Multi Exit Configuration of Mesoscopic Pedestrian Simulation	Sep 6, 2016	Q-Learning	—Unverified
Multi-Objective-Optimization Multi-AUV Assisted Data Collection Framework for IoUT Based on Offline Reinforcement Learning	Oct 15, 2024	Collision AvoidanceOffline RL	—Unverified
Multi-objective Optimization of Notifications Using Offline Reinforcement Learning	Jul 7, 2022	Q-Learningreinforcement-learning	—Unverified
Multi-Objective Reinforcement Learning for Critical Scenario Generation of Autonomous Vehicles	Feb 18, 2025	Autonomous VehiclesMulti-Objective Reinforcement Learning	—Unverified
Multiple Correlated Jammers Nullification using LSTM-based Deep Dueling Neural Network	Feb 8, 2022	Q-Learning	—Unverified
Multi-Power Level Q-Learning Algorithm for Random Access in NOMA mMTC Systems	Jan 12, 2023	Q-Learning	—Unverified
Multi Pseudo Q-learning Based Deterministic Policy Gradient for Tracking Control of Autonomous Underwater Vehicles	Sep 7, 2019	Policy Gradient MethodsQ-Learning	—Unverified
Multi-Source AoI-Constrained Resource Minimization under HARQ: Heterogeneous Sampling Processes	Jul 19, 2022	Q-LearningScheduling	—Unverified
Multi-step Reinforcement Learning: A Unifying Algorithm	Mar 3, 2017	Q-Learningreinforcement-learning	—Unverified
Music Generation using Human-In-The-Loop Reinforcement Learning	Jan 25, 2025	Music GenerationQ-Learning	—Unverified
Mutation-Bias Learning in Games	May 28, 2024	Multi-agent Reinforcement LearningQ-Learning	—Unverified
Mutual-Information Regularization in Markov Decision Processes and Actor-Critic Learning	Sep 11, 2019	MuJoCoQ-Learning	—Unverified
M-Walk: Learning to Walk over Graphs using Monte Carlo Tree Search	Feb 12, 2018	Knowledge Base CompletionLink Prediction	—Unverified
Nash Equilibrium Between Consumer Electronic Devices and DoS Attacker for Distributed IoT-enabled RSE Systems	Apr 13, 2025	Q-LearningState Estimation	—Unverified
Nash Soft Actor-Critic LEO Satellite Handover Management Algorithm for Flying Vehicles	Jan 31, 2024	BlockingManagement	—Unverified
Natural Gradient Deep Q-learning	Mar 20, 2018	Deep Reinforcement LearningHyperparameter Optimization	—Unverified
Navigating Intelligence: A Survey of Google OR-Tools and Machine Learning for Global Path Planning in Autonomous Vehicles	Mar 5, 2025	Autonomous VehiclesQ-Learning	—Unverified
Navigation In Urban Environments Amongst Pedestrians Using Multi-Objective Deep Reinforcement Learning	Oct 11, 2021	Autonomous DrivingAutonomous Navigation	—Unverified

Show:10 25 50

← PrevPage 53 of 77Next →

No leaderboard results yet.