Q-Learning

The goal of Q-learning is to learn a policy, which tells an agent what action to take under what circumstances.

( Image credit: Playing Atari with Deep Reinforcement Learning )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1701–1750 of 1918 papers

Title	Date	Tasks	Status
Learning through Probing: a decentralized reinforcement learning architecture for social dilemmas	Sep 26, 2018	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Floyd-Warshall Reinforcement Learning: Learning from Past Experiences to Reach New Goals	Sep 25, 2018	Q-Learningreinforcement-learning	—Unverified
Target Transfer Q-Learning and Its Convergence Analysis	Sep 21, 2018	Q-LearningReinforcement Learning	—Unverified
Model-Free Adaptive Optimal Control of Episodic Fixed-Horizon Manufacturing Processes using Reinforcement Learning	Sep 18, 2018	Model Predictive ControlQ-Learning	CodeCode Available
Optimal Matrix Momentum Stochastic Approximation and Applications to Q-learning	Sep 17, 2018	Q-LearningReinforcement Learning	—Unverified
Hidden Markov Model Estimation-Based Q-learning for Partially Observable Markov Decision Process	Sep 17, 2018	Q-Learning	—Unverified
Deterministic Implementations for Reproducibility in Deep Reinforcement Learning	Sep 15, 2018	Deep Reinforcement LearningQ-Learning	CodeCode Available
Sampled Policy Gradient for Learning to Play the Game Agar.io	Sep 15, 2018	Game DesignQ-Learning	CodeCode Available
Towards Better Interpretability in Deep Q-Networks	Sep 15, 2018	Deep Reinforcement LearningQ-Learning	CodeCode Available
Directed Exploration in PAC Model-Free Reinforcement Learning	Aug 31, 2018	Efficient Explorationmodel	—Unverified
MARL-FWC: Optimal Coordination of Freeway Traffic Control Measures	Aug 27, 2018	Multi-agent Reinforcement LearningQ-Learning	—Unverified
BlockQNN: Efficient Block-wise Neural Network Architecture Generation	Aug 16, 2018	GPUimage-classification	CodeCode Available
Automatic Derivation Of Formulas Using Reforcement Learning	Aug 15, 2018	Q-Learning	—Unverified
A Framework for Automated Cellular Network Tuning with Reinforcement Learning	Aug 13, 2018	ManagementQ-Learning	CodeCode Available
Multi-Agent Deep Reinforcement Learning for Dynamic Power Allocation in Wireless Networks	Aug 1, 2018	Deep Reinforcement LearningQ-Learning	CodeCode Available
Robbins-Monro conditions for persistent exploration learning strategies	Aug 1, 2018	Q-Learning	—Unverified
A Reinforcement Learning Approach to Target Tracking in a Camera Network	Jul 26, 2018	Q-Learningreinforcement-learning	—Unverified
Variational Bayesian Reinforcement Learning with Regret Bounds	Jul 25, 2018	Q-Learningreinforcement-learning	—Unverified
Accelerated Structure-Aware Reinforcement Learning for Delay-Sensitive Energy Harvesting Wireless Sensors	Jul 22, 2018	Q-Learningreinforcement-learning	—Unverified
Discrete linear-complexity reinforcement learning in continuous action spaces for Q-learning algorithms	Jul 16, 2018	Q-Learningreinforcement-learning	—Unverified
Remember and Forget for Experience Replay	Jul 16, 2018	Deep Reinforcement LearningPolicy Gradient Methods	CodeCode Available
Video Summarisation by Classification with Deep Reinforcement Learning	Jul 9, 2018	ClassificationDecision Making	—Unverified
Playing against Nature: causal discovery for decision making under uncertainty	Jul 3, 2018	Causal DiscoveryDecision Making	—Unverified
Learning to Explore via Meta-Policy Gradient	Jul 1, 2018	continuous-controlContinuous Control	—Unverified
Using Reward Machines for High-Level Task Specification and Decomposition in Reinforcement Learning	Jul 1, 2018	Hierarchical Reinforcement LearningQ-Learning	CodeCode Available
Learning to Coordinate with Coordination Graphs in Repeated Single-Stage Multi-Agent Decision Problems	Jul 1, 2018	Multi-Armed BanditsQ-Learning	—Unverified
Many-Goals Reinforcement Learning	Jun 22, 2018	AllQ-Learning	—Unverified
Reinforcement Learning using Augmented Neural Networks	Jun 20, 2018	Q-Learningreinforcement-learning	—Unverified
Action Learning for 3D Point Cloud Based Organ Segmentation	Jun 14, 2018	Organ SegmentationQ-Learning	—Unverified
Automatic formation of the structure of abstract machines in hierarchical reinforcement learning with state clustering	Jun 13, 2018	ClusteringHierarchical Reinforcement Learning	—Unverified
Distributional Advantage Actor-Critic	Jun 10, 2018	Q-Learningquantile regression	—Unverified
Fidelity-based Probabilistic Q-learning for Control of Quantum Systems	Jun 8, 2018	Q-LearningReinforcement Learning	—Unverified
A Finite Time Analysis of Temporal Difference Learning With Linear Function Approximation	Jun 6, 2018	Q-LearningReinforcement Learning	—Unverified
Hyperparameter Optimization for Tracking With Continuous Deep Q-Learning	Jun 1, 2018	Hyperparameter OptimizationObject Tracking	—Unverified
Depth and nonlinearity induce implicit exploration for RL	May 29, 2018	Q-Learningreinforcement-learning	—Unverified
Hierarchical clustering with deep Q-learning	May 28, 2018	ClusteringQ-Learning	—Unverified
Learning Self-Imitating Diverse Policies	May 25, 2018	continuous-controlContinuous Control	—Unverified
When Simple Exploration is Sample Efficient: Identifying Sufficient Conditions for Random Exploration to Yield PAC RL Algorithms	May 23, 2018	Efficient ExplorationQ-Learning	—Unverified
Learning Sampling Policies for Domain Adaptation	May 19, 2018	ClassificationDomain Adaptation	—Unverified
Algorithmic Trading with Fitted Q Iteration and Heston Model	May 18, 2018	Algorithmic TradingQ-Learning	—Unverified
GAN Q-learning	May 13, 2018	Distributional Reinforcement LearningOpenAI Gym	CodeCode Available
Stochastic Approximation for Risk-aware Markov Decision Processes	May 11, 2018	Q-Learning	—Unverified
Planning and Learning with Stochastic Action Sets	May 7, 2018	Q-LearningReinforcement Learning	—Unverified
A Hybrid Q-Learning Sine-Cosine-based Strategy for Addressing the Combinatorial Test Suite Minimization Problem	Apr 27, 2018	Q-Learning	—Unverified
Multiagent Soft Q-Learning	Apr 25, 2018	Policy Gradient MethodsQ-Learning	—Unverified
Benchmarking projective simulation in navigation problems	Apr 23, 2018	BenchmarkingQ-Learning	—Unverified
Towards Symbolic Reinforcement Learning with Common Sense	Apr 23, 2018	Common Sense ReasoningDeep Reinforcement Learning	CodeCode Available
State Distribution-aware Sampling for Deep Q-learning	Apr 23, 2018	Atari GamesOpenAI Gym	—Unverified
Nonparametric Stochastic Compositional Gradient Descent for Q-Learning in Continuous Markov Decision Problems	Apr 19, 2018	Q-LearningStochastic Optimization	CodeCode Available
Reinforced Co-Training	Apr 17, 2018	Clickbait DetectionGeneral Classification	—Unverified

Show:10 25 50

← PrevPage 35 of 39Next →

No leaderboard results yet.