Q-Learning

The goal of Q-learning is to learn a policy, which tells an agent what action to take under what circumstances.

( Image credit: Playing Atari with Deep Reinforcement Learning )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1726–1750 of 1918 papers

Title	Date	Tasks	Status	Hype
Algorithmic Trading with Fitted Q Iteration and Heston Model	May 18, 2018	Algorithmic TradingQ-Learning	—Unverified	0
GAN Q-learning	May 13, 2018	Distributional Reinforcement LearningOpenAI Gym	CodeCode Available	0
Stochastic Approximation for Risk-aware Markov Decision Processes	May 11, 2018	Q-Learning	—Unverified	0
Planning and Learning with Stochastic Action Sets	May 7, 2018	Q-LearningReinforcement Learning	—Unverified	0
A Hybrid Q-Learning Sine-Cosine-based Strategy for Addressing the Combinatorial Test Suite Minimization Problem	Apr 27, 2018	Q-Learning	—Unverified	0
Multiagent Soft Q-Learning	Apr 25, 2018	Policy Gradient MethodsQ-Learning	—Unverified	0
Towards Symbolic Reinforcement Learning with Common Sense	Apr 23, 2018	Common Sense ReasoningDeep Reinforcement Learning	CodeCode Available	0
Benchmarking projective simulation in navigation problems	Apr 23, 2018	BenchmarkingQ-Learning	—Unverified	0
State Distribution-aware Sampling for Deep Q-learning	Apr 23, 2018	Atari GamesOpenAI Gym	—Unverified	0
Nonparametric Stochastic Compositional Gradient Descent for Q-Learning in Continuous Markov Decision Problems	Apr 19, 2018	Q-LearningStochastic Optimization	CodeCode Available	0
Reinforced Co-Training	Apr 17, 2018	Clickbait DetectionGeneral Classification	—Unverified	0
State-Augmentation Transformations for Risk-Sensitive Reinforcement Learning	Apr 16, 2018	Q-Learningreinforcement-learning	—Unverified	0
CytonRL: an Efficient Reinforcement Learning Open-source Toolkit Implemented in C++	Apr 14, 2018	GPUQ-Learning	CodeCode Available	0
Hierarchical Modular Reinforcement Learning Method and Knowledge Acquisition of State-Action Rule for Multi-target Problem	Apr 8, 2018	PositionQ-Learning	—Unverified	0
Information Maximizing Exploration with a Latent Dynamics Model	Apr 4, 2018	continuous-controlContinuous Control	—Unverified	0
Joint Learning of Interactive Spoken Content Retrieval and Trainable User Simulator	Apr 1, 2018	Information RetrievalQ-Learning	—Unverified	0
Deep Reinforcement Learning for Traffic Light Control in Vehicular Networks	Mar 29, 2018	Deep Reinforcement LearningQ-Learning	CodeCode Available	0
Learning Synergies between Pushing and Grasping with Self-supervised Deep Reinforcement Learning	Mar 27, 2018	Deep Reinforcement LearningQ-Learning	CodeCode Available	1
Natural Gradient Deep Q-learning	Mar 20, 2018	Deep Reinforcement LearningHyperparameter Optimization	—Unverified	0
Composable Deep Reinforcement Learning for Robotic Manipulation	Mar 19, 2018	Deep Reinforcement LearningQ-Learning	CodeCode Available	0
Learning to Explore with Meta-Policy Gradient	Mar 13, 2018	Q-LearningReinforcement Learning	—Unverified	0
Multi-Armed Bandits for Correlated Markovian Environments with Smoothed Reward Feedback	Mar 11, 2018	Multi-Armed BanditsQ-Learning	—Unverified	0
Deep reinforcement learning for time series: playing idealized trading games	Mar 11, 2018	Deep Reinforcement LearningQ-Learning	CodeCode Available	0
SA-IGA: A Multiagent Reinforcement Learning Method Towards Socially Optimal Outcomes	Mar 8, 2018	Q-Learningreinforcement-learning	—Unverified	0
Smoothed Action Value Functions for Learning Gaussian Policies	Mar 6, 2018	continuous-controlContinuous Control	—Unverified	0

Show:10 25 50

← PrevPage 70 of 77Next →

No leaderboard results yet.