SOTAVerified|Agents Browse Leaderboard About Blog

Q-Learning

The goal of Q-learning is to learn a policy, which tells an agent what action to take under what circumstances.

( Image credit: Playing Atari with Deep Reinforcement Learning )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 21–30 of 1918 papers

Title	Date	Tasks	Status	Hype
Reinforcement Learning for Stock Transactions	May 22, 2025	Q-Learningreinforcement-learning	—Unverified	0
Offline Guarded Safe Reinforcement Learning for Medical Treatment Optimization Strategies	May 22, 2025	Offline RLQ-Learning	—Unverified	0
OPA-Pack: Object-Property-Aware Robotic Bin Packing	May 19, 2025	ObjectQ-Learning	—Unverified	0
When a Reinforcement Learning Agent Encounters Unknown Unknowns	May 19, 2025	AI AgentQ-Learning	—Unverified	0
Imagination-Limited Q-Learning for Offline Reinforcement Learning	May 18, 2025	D4RLQ-Learning	—Unverified	0
Automatic Reward Shaping from Confounded Offline Data	May 16, 2025	Atari GamesDeep Reinforcement Learning	—Unverified	0
ShiQ: Bringing back Bellman to LLMs	May 16, 2025	Q-LearningReinforcement Learning (RL)	—Unverified	0
Bias or Optimality? Disentangling Bayesian Inference and Learning Biases in Human Decision-Making	May 12, 2025	Bayesian InferenceDecision Making	—Unverified	0
Convert Language Model into a Value-based Strategic Planner	May 11, 2025	Language ModelingLanguage Modelling	—Unverified	0
A Large Language Model-Enhanced Q-learning for Capacitated Vehicle Routing Problem with Time Windows	May 9, 2025	Combinatorial OptimizationLanguage Modeling	—Unverified	0

Show:10 25 50

← PrevPage 3 of 192Next →

No leaderboard results yet.