SOTAVerified|Agents Browse Leaderboard About

Q-Learning

The goal of Q-learning is to learn a policy, which tells an agent what action to take under what circumstances.

( Image credit: Playing Atari with Deep Reinforcement Learning )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1901–1918 of 1918 papers

Title	Date	Tasks	Status	Hype
Personalized Medical Treatments Using Novel Reinforcement Learning Algorithms	Jun 16, 2014	Q-Learningreinforcement-learning	—Unverified	0
Single-Agent vs. Multi-Agent Techniques for Concurrent Reinforcement Learning of Negotiation Dialogue Policies	Jun 1, 2014	Dialogue ManagementMulti-agent Reinforcement Learning	—Unverified	0
Empirically Evaluating Multiagent Learning Algorithms	Jan 31, 2014	Q-Learning	—Unverified	0
Adaptive Stochastic Resource Control: A Machine Learning Approach	Jan 15, 2014	BIG-bench Machine LearningClustering	—Unverified	0
Optimal Demand Response Using Device Based Reinforcement Learning	Jan 8, 2014	energy managementManagement	—Unverified	0
Two Timescale Convergent Q-learning for Sleep--Scheduling in Wireless Sensor Networks	Dec 27, 2013	feature selectionIntrusion Detection	—Unverified	0
Q-learning optimization in a multi-agents system for image segmentation	Nov 23, 2013	Image SegmentationQ-Learning	—Unverified	0
Risk-sensitive Reinforcement Learning	Nov 8, 2013	Decision MakingQ-Learning	—Unverified	0
Approximate Kalman Filter Q-Learning for Continuous State-Space MDPs	Sep 26, 2013	Q-Learning	—Unverified	0
The association problem in wireless networks: a Policy Gradient Reinforcement Learning approach	Jun 11, 2013	Q-Learningreinforcement-learning	—Unverified	0
Projective simulation for classical learning agents: a comprehensive investigation	May 7, 2013	Q-LearningReinforcement Learning	—Unverified	0
Hybrid Q-Learning Applied to Ubiquitous recommender system	Mar 10, 2013	Q-LearningRecommendation Systems	—Unverified	0
Speedy Q-Learning	Dec 1, 2011	Q-Learning	—Unverified	0
Double Q-learning	Dec 1, 2010	Q-Learningreinforcement-learning	—Unverified	0
Convergent Temporal-Difference Learning with Arbitrary Smooth Function Approximation	Dec 1, 2009	Q-Learning	—Unverified	0
Least-Squares Policy Iteration	Dec 4, 2003	Q-Learningreinforcement-learning	CodeCode Available	0
Between MDPs and semi-MDPs: A framework for temporal abstraction in reinforcement learning	Aug 6, 1999	Q-Learningreinforcement-learning	—Unverified	0
Hierarchical Reinforcement Learning with the MAXQ Value Function Decomposition	May 21, 1999	Hierarchical Reinforcement LearningQ-Learning	CodeCode Available	0

Show:10 25 50

← PrevPage 39 of 39Next →

No leaderboard results yet.