Q-Learning

The goal of Q-learning is to learn a policy, which tells an agent what action to take under what circumstances.

( Image credit: Playing Atari with Deep Reinforcement Learning )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1851–1900 of 1918 papers

Title	Date	Tasks	Status
The Game Imitation: Deep Supervised Convolutional Networks for Quick Video Game AI	Feb 18, 2017	Decision MakingImitation Learning	—Unverified
Collaborative Deep Reinforcement Learning for Joint Object Search	Feb 18, 2017	Active Object LocalizationDeep Reinforcement Learning	—Unverified
FPGA Architecture for Deep Learning and its application to Planetary Robotics	Jan 26, 2017	CPUQ-Learning	—Unverified
Learning to predict where to look in interactive environments using deep recurrent q-learning	Dec 17, 2016	Atari GamesQ-Learning	—Unverified
Playing Doom with SLAM-Augmented Deep Reinforcement Learning	Dec 1, 2016	Deep Reinforcement Learningobject-detection	CodeCode Available
Designing Neural Network Architectures using Reinforcement Learning	Nov 7, 2016	General Classificationimage-classification	CodeCode Available
Q-Prop: Sample-Efficient Policy Gradient with An Off-Policy Critic	Nov 7, 2016	continuous-controlContinuous Control	CodeCode Available
A Differentiable Physics Engine for Deep Learning in Robotics	Nov 5, 2016	CPUDeep Learning	—Unverified
Combining policy gradient and Q-learning	Nov 5, 2016	Atari GamesQ-Learning	—Unverified
Learning to Play in a Day: Faster Deep Reinforcement Learning by Optimality Tightening	Nov 5, 2016	Atari GamesDeep Reinforcement Learning	CodeCode Available
Using a Deep Reinforcement Learning Agent for Traffic Signal Control	Nov 3, 2016	Deep Reinforcement LearningQ-Learning	—Unverified
Combating Reinforcement Learning's Sisyphean Curse with Intrinsic Fear	Nov 3, 2016	Atari GamesDeep Reinforcement Learning	—Unverified
Internet of Things Applications: Animal Monitoring with Unmanned Aerial Vehicle	Oct 17, 2016	Q-LearningTraveling Salesman Problem	—Unverified
Active exploration in parameterized reinforcement learning	Oct 6, 2016	Meta-LearningQ-Learning	CodeCode Available
Modelling Stock-market Investors as Reinforcement Learning Agents [Correction]	Sep 20, 2016	Decision MakingQ-Learning	—Unverified
Playing FPS Games with Deep Reinforcement Learning	Sep 18, 2016	Deep Reinforcement LearningFPS Games	CodeCode Available
Interactive Spoken Content Retrieval by Deep Reinforcement Learning	Sep 16, 2016	Deep Reinforcement LearningQ-Learning	—Unverified
3D Simulation for Robot Arm Control with Deep Q-Learning	Sep 13, 2016	Deep Reinforcement LearningQ-Learning	—Unverified
Episodic Exploration for Deep Deterministic Policies: An Application to StarCraft Micromanagement Tasks	Sep 10, 2016	Q-Learningreinforcement-learning	—Unverified
Multi Exit Configuration of Mesoscopic Pedestrian Simulation	Sep 6, 2016	Q-Learning	—Unverified
Q-Learning with Basic Emotions	Sep 6, 2016	Q-Learning	—Unverified
BBQ-Networks: Efficient Exploration in Deep Reinforcement Learning for Task-Oriented Dialogue Systems	Aug 17, 2016	Deep Reinforcement LearningEfficient Exploration	—Unverified
Learning to Communicate with Deep Multi-Agent Reinforcement Learning	May 21, 2016	Multi-agent Reinforcement LearningQ-Learning	CodeCode Available
ViZDoom: A Doom-based AI Research Platform for Visual Reinforcement Learning	May 6, 2016	Atari GamesFPS Games	CodeCode Available
Neurohex: A Deep Q-learning Hex Agent	Apr 24, 2016	Atari GamesGame of Go	—Unverified
Reinforcement Learning approach for Real Time Strategy Games Battle city and S3	Feb 16, 2016	Q-LearningReal-Time Strategy Games	—Unverified
Using Deep Q-Learning to Control Optimization Hyperparameters	Feb 12, 2016	Q-LearningReinforcement Learning	—Unverified
Angrier Birds: Bayesian reinforcement learning	Jan 6, 2016	Efficient ExplorationQ-Learning	CodeCode Available
Taming the Noise in Reinforcement Learning via Soft Updates	Dec 28, 2015	Q-Learningreinforcement-learning	CodeCode Available
Increasing the Action Gap: New Operators for Reinforcement Learning	Dec 15, 2015	Atari GamesQ-Learning	CodeCode Available
Q-Networks for Binary Vector Actions	Dec 4, 2015	Q-Learningreinforcement-learning	—Unverified
Deep Reinforcement Learning with Attention for Slate Markov Decision Processes with High-Dimensional States and Actions	Dec 3, 2015	Deep Reinforcement LearningQ-Learning	—Unverified
Robotic Search & Rescue via Online Multi-task Reinforcement Learning	Nov 29, 2015	Lifelong learningQ-Learning	—Unverified
Learning Simple Algorithms from Examples	Nov 23, 2015	Q-Learning	CodeCode Available
Deep Reinforcement Learning with a Natural Language Action Space	Nov 14, 2015	Deep Reinforcement LearningQ-Learning	CodeCode Available
A disembodied developmental robotic agent called Samu Bátfai	Nov 9, 2015	Q-LearningReinforcement Learning	CodeCode Available
Two Phase Q-learning for Bidding-based Vehicle Sharing	Sep 29, 2015	Decision MakingQ-Learning	—Unverified
Optimization of anemia treatment in hemodialysis patients via reinforcement learning	Sep 14, 2015	Decision MakingQ-Learning	—Unverified
Distributed Deep Q-Learning	Aug 18, 2015	Q-Learningreinforcement-learning	—Unverified
Artificial Prediction Markets for Online Prediction of Continuous Variables-A Preliminary Report	Aug 11, 2015	Decision MakingPrediction	—Unverified
Self-Learning Cloud Controllers: Fuzzy Q-Learning for Knowledge Evolution	Jul 2, 2015	Q-LearningSelf-Learning	CodeCode Available
Online Transfer Learning in Reinforcement Learning Domains	Jul 2, 2015	Q-Learningreinforcement-learning	—Unverified
Decentralized Q-Learning for Stochastic Teams and Games	Jun 25, 2015	Q-Learning	—Unverified
Autonomous CRM Control via CLV Approximation with Deep Reinforcement Learning in Discrete and Continuous Action Space	Apr 8, 2015	Deep Reinforcement LearningManagement	—Unverified
Energy Sharing for Multiple Sensor Nodes with Finite Buffers	Mar 17, 2015	Q-Learning	—Unverified
Correct-by-synthesis reinforcement learning with temporal logic constraints	Mar 5, 2015	Motion PlanningQ-Learning	—Unverified
Empirical Q-Value Iteration	Nov 30, 2014	Q-Learning	—Unverified
Q-learning for Optimal Control of Continuous-time Systems	Oct 11, 2014	Q-LearningReinforcement Learning	—Unverified
Learning to Cooperate via Policy Search	Aug 7, 2014	Q-Learningreinforcement-learning	—Unverified
Reinforcement Learning Based Algorithm for the Maximization of EV Charging Station Revenue	Jul 4, 2014	Q-Learningreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 38 of 39Next →

No leaderboard results yet.