SOTAVerified|Agents Browse Leaderboard About Blog

Q-Learning

The goal of Q-learning is to learn a policy, which tells an agent what action to take under what circumstances.

( Image credit: Playing Atari with Deep Reinforcement Learning )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 26–50 of 1918 papers

Title	Date	Tasks	Status
Automatic Reward Shaping from Confounded Offline Data	May 16, 2025	Atari GamesDeep Reinforcement Learning	—Unverified
ShiQ: Bringing back Bellman to LLMs	May 16, 2025	Q-LearningReinforcement Learning (RL)	—Unverified
Bias or Optimality? Disentangling Bayesian Inference and Learning Biases in Human Decision-Making	May 12, 2025	Bayesian InferenceDecision Making	—Unverified
Convert Language Model into a Value-based Strategic Planner	May 11, 2025	Language ModelingLanguage Modelling	—Unverified
Universal Approximation Theorem for Deep Q-Learning via FBSDE System	May 9, 2025	Q-Learning	—Unverified
A Large Language Model-Enhanced Q-learning for Capacitated Vehicle Routing Problem with Time Windows	May 9, 2025	Combinatorial OptimizationLanguage Modeling	—Unverified
A critical assessment of reinforcement learning methods for microswimmer navigation in complex flows	May 8, 2025	Autonomous NavigationHyperparameter Optimization	CodeCode Available
Merging and Disentangling Views in Visual Reinforcement Learning for Robotic Manipulation	May 7, 2025	DisentanglementLightweight Deployment	—Unverified
VLM Q-Learning: Aligning Vision-Language Models for Interactive Decision-Making	May 6, 2025	Decision MakingGeneral Knowledge	—Unverified
Meta-Black-Box-Optimization through Offline Q-function Learning	May 4, 2025	BenchmarkingMamba	CodeCode Available
Universal Approximation Theorem of Deep Q-Networks	May 4, 2025	Deep Reinforcement LearningQ-Learning	—Unverified
Rank-One Modified Value Iteration	May 3, 2025	Q-Learning	—Unverified
Q-Learning with Clustered-SMART (cSMART) Data: Examining Moderators in the Construction of Clustered Adaptive Interventions	May 1, 2025	Q-Learning	—Unverified
Learning Neural Control Barrier Functions from Offline Data with Conservatism	May 1, 2025	Q-Learning	—Unverified
Dynamic and Distributed Routing in IoT Networks based on Multi-Objective Q-Learning	May 1, 2025	Q-Learning	—Unverified
Interactive Double Deep Q-network: Integrating Human Interventions and Evaluative Predictions in Reinforcement Learning of Autonomous Driving	Apr 28, 2025	Autonomous DrivingQ-Learning	—Unverified
Non-Asymptotic Guarantees for Average-Reward Q-Learning with Adaptive Stepsizes	Apr 25, 2025	Q-Learning	—Unverified
SAPO-RL: Sequential Actuator Placement Optimization for Fuselage Assembly via Reinforcement Learning	Apr 24, 2025	Decision MakingQ-Learning	—Unverified
Mixed-Precision Conjugate Gradient Solvers with RL-Driven Precision Tuning	Apr 19, 2025	Computational EfficiencyQ-Learning	—Unverified
Understanding the theoretical properties of projected Bellman equation, linear Q-learning, and approximate value iteration	Apr 15, 2025	Q-Learning	—Unverified
Nash Equilibrium Between Consumer Electronic Devices and DoS Attacker for Distributed IoT-enabled RSE Systems	Apr 13, 2025	Q-LearningState Estimation	—Unverified
A Framework of decision-relevant observability: Reinforcement Learning converges under relative ignorability	Apr 10, 2025	Causal InferenceDecision Making	—Unverified
State Estimation Using Particle Filtering in Adaptive Machine Learning Methods: Integrating Q-Learning and NEAT Algorithms with Noisy Radar Measurements	Apr 10, 2025	Q-LearningState Estimation	—Unverified
OmniEcon Nexus: Global Microeconomic Simulation Engine	Apr 7, 2025	Data IntegrationPortfolio Optimization	CodeCode Available
Deep Reinforcement Learning Algorithms for Option Hedging	Apr 7, 2025	Deep Reinforcement LearningQ-Learning	CodeCode Available

Show:10 25 50

← PrevPage 2 of 77Next →

No leaderboard results yet.