SOTAVerified|Agents Browse Leaderboard About

Q-Learning

The goal of Q-learning is to learn a policy, which tells an agent what action to take under what circumstances.

( Image credit: Playing Atari with Deep Reinforcement Learning )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 976–1000 of 1918 papers

Title	Date	Tasks	Status
PickLLM: Context-Aware RL-Assisted Large Language Model Routing	Dec 12, 2024	Language ModelingLanguage Modelling	—Unverified
PID Accelerated Temporal Difference Algorithms	Jul 11, 2024	Q-LearningReinforcement Learning (RL)	—Unverified
Planning and Learning in Average Risk-aware MDPs	Mar 22, 2025	Q-Learning	—Unverified
Planning and Learning with Stochastic Action Sets	May 7, 2018	Q-LearningReinforcement Learning	—Unverified
Planning Irregular Object Packing via Hierarchical Reinforcement Learning	Nov 17, 2022	Hierarchical Reinforcement LearningObject	—Unverified
Planning with RL and episodic-memory behavioral priors	Jul 5, 2022	Imitation LearningQ-Learning	—Unverified
Playing a 2D Game Indefinitely using NEAT and Reinforcement Learning	Jul 28, 2022	Q-Learningreinforcement-learning	—Unverified
Playing against Nature: causal discovery for decision making under uncertainty	Jul 3, 2018	Causal DiscoveryDecision Making	—Unverified
Pointer Networks with Q-Learning for Combinatorial Optimization	Nov 5, 2023	Combinatorial OptimizationGraph Embedding	—Unverified
Policy Learning with a Natural Language Action Space: A Causal Approach	Feb 24, 2025	Decision MakingQ-Learning	—Unverified
Policy Tree Network	Sep 25, 2019	Model-based Reinforcement LearningMuJoCo	—Unverified
Polyphonic Music Composition: An Adversarial Inverse Reinforcement Learning Approach	Sep 29, 2021	Q-Learningreinforcement-learning	—Unverified
PooL: Pheromone-inspired Communication Framework forLarge Scale Multi-Agent Reinforcement Learning	Feb 20, 2022	Multi-agent Reinforcement LearningQ-Learning	—Unverified
Potential-Based Advice for Stochastic Policy Learning	Jul 20, 2019	Q-LearningReinforcement Learning	—Unverified
Potential Impacts of Smart Homes on Human Behavior: A Reinforcement Learning Approach	Feb 26, 2021	Hierarchical Reinforcement LearningQ-Learning	—Unverified
Pragmatic Implementation of Reinforcement Algorithms For Path Finding On Raspberry Pi	Dec 7, 2021	Collision AvoidanceQ-Learning	—Unverified
Predicting the Need for Blood Transfusion in Intensive Care Units with Reinforcement Learning	Jun 26, 2022	Decision MakingQ-Learning	—Unverified
Predictive Crypto-Asset Automated Market Making Architecture for Decentralized Finance using Deep Reinforcement Learning	Sep 28, 2022	Deep Reinforcement LearningQ-Learning	—Unverified
Prelimit Coupling and Steady-State Convergence of Constant-stepsize Nonsmooth Contractive SA	Apr 9, 2024	Q-Learning	—Unverified
Preventing Value Function Collapse in Ensemble Q-Learning by Maximizing Representation Diversity	Jan 1, 2021	DiversityQ-Learning	—Unverified
Principal-Agent Reinforcement Learning: Orchestrating AI Agents with Contracts	Jul 25, 2024	Q-Learningreinforcement-learning	—Unverified
Prioritized Sweeping Neural DynaQ with Multiple Predecessors, and Hippocampal Replays	Feb 15, 2018	HippocampusQ-Learning	—Unverified
Privacy-Cost Management in Smart Meters with Mutual Information-Based Reinforcement Learning	Jun 10, 2020	Deep Reinforcement LearningManagement	—Unverified
Privacy-Cost Management in Smart Meters Using Deep Reinforcement Learning	Mar 10, 2020	Deep Reinforcement LearningManagement	—Unverified
Probabilistic Curriculum Learning for Goal-Based Reinforcement Learning	Apr 2, 2025	continuous-controlContinuous Control	—Unverified

Show:10 25 50

← PrevPage 40 of 77Next →

No leaderboard results yet.