SOTAVerified|Agents Browse Leaderboard About

Q-Learning

The goal of Q-learning is to learn a policy, which tells an agent what action to take under what circumstances.

( Image credit: Playing Atari with Deep Reinforcement Learning )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 326–350 of 1918 papers

Title	Date	Tasks	Status
Optimized Monte Carlo Tree Search for Enhanced Decision Making in the FrozenLake Environment	Sep 25, 2024	Decision MakingQ-Learning	—Unverified
Agent-state based policies in POMDPs: Beyond belief-state MDPs	Sep 24, 2024	Q-Learning	—Unverified
A Multi-Agent Multi-Environment Mixed Q-Learning for Partially Decentralized Wireless Network Optimization	Sep 24, 2024	Q-Learning	CodeCode Available
Learning to Play Video Games with Intuitive Physics Priors	Sep 20, 2024	Decision MakingObject	—Unverified
Data-Efficient Quadratic Q-Learning Using LMIs	Sep 18, 2024	Q-LearningReinforcement Learning (RL)	—Unverified
Automating proton PBS treatment planning for head and neck cancers using policy gradient-based deep reinforcement learning	Sep 17, 2024	Deep Reinforcement LearningQ-Learning	—Unverified
Audio-Driven Reinforcement Learning for Head-Orientation in Naturalistic Environments	Sep 16, 2024	Audio Signal ProcessingDeep Reinforcement Learning	CodeCode Available
Offline Reinforcement Learning for Learning to Dispatch for Job Shop Scheduling	Sep 16, 2024	Combinatorial Optimizationcounterfactual	CodeCode Available
SHIRE: Enhancing Sample Efficiency using Human Intuition in REinforcement Learning	Sep 16, 2024	Deep Reinforcement LearningOptical Flow Estimation	—Unverified
KAN v.s. MLP for Offline Reinforcement Learning	Sep 15, 2024	D4RLKolmogorov-Arnold Networks	—Unverified
Autonomous Vehicle Decision-Making Framework for Considering Malicious Behavior at Unsignalized Intersections	Sep 11, 2024	Autonomous VehiclesDecision Making	—Unverified
Double Successive Over-Relaxation Q-Learning with an Extension to Deep Reinforcement Learning	Sep 10, 2024	Deep Reinforcement LearningOpenAI Gym	CodeCode Available
Reinforcement Learning for Rate Maximization in IRS-aided OWC Networks	Sep 7, 2024	Q-Learningreinforcement-learning	—Unverified
Reward-Directed Score-Based Diffusion Models via q-Learning	Sep 7, 2024	Q-LearningReinforcement Learning (RL)	—Unverified
Whittle Index Learning Algorithms for Restless Bandits with Constant Stepsizes	Sep 6, 2024	Multi-Armed BanditsQ-Learning	—Unverified
Faster Q-Learning Algorithms for Restless Bandits	Sep 6, 2024	Multi-Armed BanditsQ-Learning	—Unverified
Asynchronous Stochastic Approximation and Average-Reward Reinforcement Learning	Sep 5, 2024	Q-Learningreinforcement-learning	—Unverified
On the Convergence Rates of Federated Q-Learning across Heterogeneous Environments	Sep 5, 2024	Q-Learning	—Unverified
Robust Q-Learning under Corrupted Rewards	Sep 5, 2024	Q-Learning	CodeCode Available
Reinforcement Learning-enabled Satellite Constellation Reconfiguration and Retasking for Mission-Critical Applications	Sep 3, 2024	Q-LearningReinforcement Learning (RL)	—Unverified
Accelerated Multi-objective Task Learning using Modified Q-learning Algorithm	Sep 2, 2024	Q-Learning	—Unverified
Imitating Language via Scalable Inverse Reinforcement Learning	Sep 2, 2024	DiversityImitation Learning	—Unverified
The Sample-Communication Complexity Trade-off in Federated Q-Learning	Aug 30, 2024	Q-Learning	—Unverified
On Convergence of Average-Reward Q-Learning in Weakly Communicating Markov Decision Processes	Aug 29, 2024	Q-LearningReinforcement Learning (RL)	—Unverified
Coverage Analysis of Multi-Environment Q-Learning Algorithms for Wireless Network Optimization	Aug 29, 2024	Q-Learning	—Unverified

Show:10 25 50

← PrevPage 14 of 77Next →

No leaderboard results yet.