Q-Learning

The goal of Q-learning is to learn a policy, which tells an agent what action to take under what circumstances.

( Image credit: Playing Atari with Deep Reinforcement Learning )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1151–1200 of 1918 papers

Title	Date	Tasks	Status
SOLO: Search Online, Learn Offline for Combinatorial Optimization Problems	Apr 4, 2021	Combinatorial OptimizationDecision Making	—Unverified
Federated Double Deep Q-learning for Joint Delay and Energy Minimization in IoT networks	Apr 2, 2021	Deep Reinforcement LearningFederated Learning	—Unverified
Regularized Softmax Deep Multi-Agent Q-Learning	Mar 22, 2021	Multi-agent Reinforcement LearningQ-Learning	—Unverified
Reinforcement Learning based on Scenario-tree MPC for ASVs	Mar 22, 2021	Model Predictive ControlPoint Tracking	—Unverified
Variational quantum compiling with double Q-learning	Mar 22, 2021	Q-LearningReinforcement Learning (RL)	—Unverified
Convergence of Finite Memory Q-Learning for POMDPs and Near Optimality of Learned Policies under Filter Stability	Mar 22, 2021	Q-Learning	—Unverified
S4RL: Surprisingly Simple Self-Supervision for Offline Reinforcement Learning	Mar 10, 2021	Autonomous DrivingD4RL	—Unverified
A Jointly Optimal Design of Control and Scheduling in Networked Systems under Denial-of-Service Attacks	Mar 10, 2021	Q-LearningScheduling	—Unverified
The Effect of Q-function Reuse on the Total Regret of Tabular, Model-Free, Reinforcement Learning	Mar 7, 2021	Q-LearningTransfer Learning	—Unverified
Decentralized Microgrid Energy Management: A Multi-agent Correlated Q-learning Approach	Mar 6, 2021	energy managementenergy trading	—Unverified
Correlated Deep Q-learning based Microgrid Energy Management	Mar 6, 2021	energy managementManagement	—Unverified
UCB Momentum Q-learning: Correcting the bias without forgetting	Mar 1, 2021	Q-Learning	CodeCode Available
Ensemble Bootstrapping for Q-Learning	Feb 28, 2021	Atari GamesQ-Learning	—Unverified
Potential Impacts of Smart Homes on Human Behavior: A Reinforcement Learning Approach	Feb 26, 2021	Hierarchical Reinforcement LearningQ-Learning	—Unverified
Reinforcement learning approach for resource allocation in humanitarian logistics	Feb 25, 2021	HumanitarianQ-Learning	—Unverified
No-Regret Reinforcement Learning with Heavy-Tailed Rewards	Feb 25, 2021	Deep Reinforcement LearningQ-Learning	—Unverified
Balancing Rational and Other-Regarding Preferences in Cooperative-Competitive Environments	Feb 24, 2021	Multi-agent Reinforcement LearningQ-Learning	CodeCode Available
Sequential Learning-based IaaS Composition	Feb 24, 2021	ClusteringQ-Learning	—Unverified
Greedy-Step Off-Policy Reinforcement Learning	Feb 23, 2021	Q-Learningreinforcement-learning	—Unverified
Understanding algorithmic collusion with experience replay	Feb 18, 2021	Q-Learning	CodeCode Available
A Discrete-Time Switching System Analysis of Q-learning	Feb 17, 2021	Q-Learning	—Unverified
Cooperation and Reputation Dynamics with Reinforcement Learning	Feb 15, 2021	Q-Learningreinforcement-learning	—Unverified
Reversible Action Design for Combinatorial Optimization with Reinforcement Learning	Feb 14, 2021	Combinatorial OptimizationQ-Learning	—Unverified
Is Q-Learning Minimax Optimal? A Tight Sample Complexity Analysis	Feb 12, 2021	Natural QuestionsQ-Learning	—Unverified
Hedging of Financial Derivative Contracts via Monte Carlo Tree Search	Feb 11, 2021	Q-Learningreinforcement-learning	—Unverified
Simple Agent, Complex Environment: Efficient Reinforcement Learning with Agent States	Feb 10, 2021	Q-Learningreinforcement-learning	—Unverified
Model-Augmented Q-learning	Feb 7, 2021	modelQ-Learning	—Unverified
Revisiting Prioritized Experience Replay: A Value Perspective	Feb 5, 2021	Atari GamesQ-Learning	CodeCode Available
Experience-Based Heuristic Search: Robust Motion Planning with Deep Q-Learning	Feb 5, 2021	Autonomous DrivingAutonomous Vehicles	—Unverified
A review of motion planning algorithms for intelligent robotics	Feb 4, 2021	Motion PlanningQ-Learning	—Unverified
Deep reinforcement learning-based image classification achieves perfect testing set accuracy for MRI brain tumors with a training set of only 30 images	Feb 4, 2021	ClassificationDeep Reinforcement Learning	—Unverified
A step toward a reinforcement learning de novo genome assembler	Feb 2, 2021	Deep Reinforcement LearningQ-Learning	—Unverified
A Lyapunov Theory for Finite-Sample Guarantees of Asynchronous Q-Learning and TD-Learning Variants	Feb 2, 2021	Q-LearningReinforcement Learning (RL)	—Unverified
QoS-Aware Power Minimization of Distributed Many-Core Servers using Transfer Q-Learning	Feb 2, 2021	Q-Learning	—Unverified
Variation-resistant Q-learning: Controlling and Utilizing Estimation Bias in Reinforcement Learning for Better Performance	Feb 1, 2021	Q-Learningreinforcement-learning	CodeCode Available
CoordiQ : Coordinated Q-learning for Electric Vehicle Charging Recommendation	Jan 28, 2021	Decision MakingQ-Learning	—Unverified
Reinforcement Learning based Per-antenna Discrete Power Control for Massive MIMO Systems	Jan 28, 2021	Q-Learningreinforcement-learning	—Unverified
Reinforcement Learning Assisted Beamforming for Inter-cell Interference Mitigation in 5G Massive MIMO Networks	Jan 27, 2021	Q-Learningreinforcement-learning	—Unverified
Robust Android Malware Detection System against Adversarial Attacks using Q-Learning	Jan 27, 2021	Adversarial DefenseAndroid Malware Detection	—Unverified
Channel Estimation via Successive Denoising in MIMO OFDM Systems: A Reinforcement Learning Approach	Jan 25, 2021	DenoisingQ-Learning	—Unverified
Solving optimal stopping problems with Deep Q-Learning	Jan 24, 2021	Q-LearningReinforcement Learning (RL)	—Unverified
Fire Threat Detection From Videos with Q-Rough Sets	Jan 21, 2021	Q-LearningSegmentation	—Unverified
Breaking the Deadly Triad with a Target Network	Jan 21, 2021	Q-Learning	—Unverified
Reinforcement learning based recommender systems: A survey	Jan 15, 2021	Collaborative FilteringDeep Reinforcement Learning	—Unverified
Continuous Deep Q-Learning with Simulator for Stabilization of Uncertain Discrete-Time Systems	Jan 13, 2021	Q-LearningReinforcement Learning (RL)	CodeCode Available
Learning Augmented Index Policy for Optimal Service Placement at the Network Edge	Jan 10, 2021	Q-Learning	—Unverified
Robust and Scalable Routing with Multi-Agent Deep Reinforcement Learning for MANETs	Jan 9, 2021	Deep Reinforcement LearningQ-Learning	—Unverified
Safe Coupled Deep Q-Learning for Recommendation Systems	Jan 8, 2021	Q-LearningRecommendation Systems	—Unverified
Preventing Value Function Collapse in Ensemble Q-Learning by Maximizing Representation Diversity	Jan 1, 2021	DiversityQ-Learning	—Unverified
Success-Rate Targeted Reinforcement Learning by Disorientation Penalty	Jan 1, 2021	Decision MakingQ-Learning	—Unverified

Show:10 25 50

← PrevPage 24 of 39Next →

No leaderboard results yet.