Q-Learning

The goal of Q-learning is to learn a policy, which tells an agent what action to take under what circumstances.

( Image credit: Playing Atari with Deep Reinforcement Learning )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1201–1250 of 1918 papers

Title	Date	Tasks	Status
Robust Android Malware Detection System against Adversarial Attacks using Q-Learning	Jan 27, 2021	Adversarial DefenseAndroid Malware Detection	—Unverified
Robust and Scalable Routing with Multi-Agent Deep Reinforcement Learning for MANETs	Jan 9, 2021	Deep Reinforcement LearningQ-Learning	—Unverified
Robust Auto-landing Control of an agile Regional Jet Using Fuzzy Q-learning	Feb 21, 2023	Q-Learningreinforcement-learning	—Unverified
Exploring the Noise Resilience of Successor Features and Predecessor Features Algorithms in One and Two-Dimensional Environments	Apr 14, 2023	Decision MakingQ-Learning	—Unverified
Robust Deep Reinforcement Learning with Adversarial Attacks	Dec 11, 2017	Deep Reinforcement LearningQ-Learning	—Unverified
Robust Multi-Agent Reinforcement Learning with Model Uncertainty	Dec 1, 2020	modelMulti-agent Reinforcement Learning	—Unverified
Robust Path Following on Rivers Using Bootstrapped Reinforcement Learning	Mar 24, 2023	Deep Reinforcement LearningQ-Learning	—Unverified
Robust Q-learning	Mar 27, 2020	Q-Learningregression	—Unverified
RP-DQN: An application of Q-Learning to Vehicle Routing Problems	Apr 25, 2021	BIG-bench Machine LearningQ-Learning	—Unverified
RSS-Based Q-Learning for Indoor UAV Navigation	May 31, 2019	Q-Learning	—Unverified
Runtime Adaptation in Wireless Sensor Nodes Using Structured Learning	Jun 15, 2020	Q-LearningReinforcement Learning (RL)	—Unverified
S4RL: Surprisingly Simple Self-Supervision for Offline Reinforcement Learning	Mar 10, 2021	Autonomous DrivingD4RL	—Unverified
Safe Coupled Deep Q-Learning for Recommendation Systems	Jan 8, 2021	Q-LearningRecommendation Systems	—Unverified
Safe Learning for Near Optimal Scheduling	May 19, 2020	Q-LearningScheduling	—Unverified
Safe Q-learning for continuous-time linear systems	Apr 26, 2023	Q-Learning	—Unverified
Safe Reinforcement Learning via Projection on a Safe Set: How to Achieve Optimality?	Apr 2, 2020	Policy Gradient MethodsQ-Learning	—Unverified
Safety-guaranteed Reinforcement Learning based on Multi-class Support Vector Machine	Jun 12, 2020	Q-Learningreinforcement-learning	—Unverified
Safe Wasserstein Constrained Deep Q-Learning	Feb 7, 2020	Q-Learning	—Unverified
SA-IGA: A Multiagent Reinforcement Learning Method Towards Socially Optimal Outcomes	Mar 8, 2018	Q-Learningreinforcement-learning	—Unverified
Sales Time Series Analytics Using Deep Q-Learning	Jan 6, 2022	Active LearningDecision Making	—Unverified
Same-Day Delivery with Fairness	Jul 19, 2020	FairnessQ-Learning	—Unverified
Sample Complexity of Asynchronous Q-Learning: Sharper Analysis and Variance Reduction	Jun 4, 2020	Q-Learning	—Unverified
Sample Complexity of Kernel-Based Q-Learning	Feb 1, 2023	Q-LearningReinforcement Learning (RL)	—Unverified
Sample Complexity of Variance-reduced Distributionally Robust Q-learning	May 28, 2023	Decision MakingQ-Learning	—Unverified
Sample-Efficient Reinforcement Learning for Linearly-Parameterized MDPs with a Generative Model	May 28, 2021	Q-Learningreinforcement-learning	—Unverified
Sample Efficient Reinforcement Learning in Mixed Systems through Augmented Samples and Its Applications to Queueing Networks	May 25, 2023	Q-Learning	—Unverified
Sample-Efficient Reinforcement Learning via Counterfactual-Based Data Augmentation	Dec 16, 2020	counterfactualData Augmentation	—Unverified
Sample-Optimal Parametric Q-Learning Using Linearly Additive Features	Feb 13, 2019	Q-Learning	—Unverified
SAPO-RL: Sequential Actuator Placement Optimization for Fuselage Assembly via Reinforcement Learning	Apr 24, 2025	Decision MakingQ-Learning	—Unverified
SBEED: Convergent Reinforcement Learning with Nonlinear Function Approximation	Dec 29, 2017	Q-Learningreinforcement-learning	—Unverified
^2-exploration for Reinforcement Learning	Sep 29, 2021	General Reinforcement LearningQ-Learning	—Unverified
Learning NP-Hard Multi-Agent Assignment Planning using GNN: Inference on a Random Graph and Provable Auction-Fitted Q-learning	May 29, 2019	Combinatorial OptimizationDecision Making	—Unverified
Scalable multi-agent reinforcement learning for distributed control of residential energy flexibility	Mar 7, 2022	Multi-agent Reinforcement LearningQ-Learning	—Unverified
Scale-invariant temporal history (SITH): optimal slicing of the past in an uncertain world	Dec 19, 2017	Q-LearningReinforcement Learning	—Unverified
Scheduled Curiosity-Deep Dyna-Q: Efficient Exploration for Dialog Policy Learning	Jan 31, 2024	Efficient ExplorationModel-based Reinforcement Learning	—Unverified
ScreenerNet: Learning Self-Paced Curriculum for Deep Neural Networks	Jan 3, 2018	Deep Reinforcement LearningQ-Learning	—Unverified
Search For Deep Graph Neural Networks	Sep 21, 2021	DiversityQ-Learning	—Unverified
Seasonal Station-Keeping of Short Duration High Altitude Balloons using Deep Reinforcement Learning	Feb 7, 2025	Deep Reinforcement LearningDiversity	—Unverified
Selective Pseudo-Labeling with Reinforcement Learning for Semi-Supervised Domain Adaptation	Dec 7, 2020	Domain AdaptationQ-Learning	—Unverified
Self-correcting Q-Learning	Dec 2, 2020	Q-Learning	—Unverified
Self-driving scale car trained by Deep reinforcement learning	Sep 8, 2019	Autonomous DrivingDeep Reinforcement Learning	—Unverified
Self-Imitation Learning via Generalized Lower Bound Q-learning	Jun 12, 2020	continuous-controlContinuous Control	—Unverified
Self-Inspection Method of Unmanned Aerial Vehicles in Power Plants Using Deep Q-Network Reinforcement Learning	Mar 16, 2023	Autonomous NavigationQ-Learning	—Unverified
Relevance-Guided Modeling of Object Dynamics for Reinforcement Learning	Mar 3, 2020	Atari GamesDeep Reinforcement Learning	—Unverified
Self-Supervised Reinforcement Learning for Recommender Systems	Jun 10, 2020	Q-LearningRecommendation Systems	—Unverified
Self-Sustaining Multiple Access with Continual Deep Reinforcement Learning for Dynamic Metaverse Applications	Sep 18, 2023	Continual LearningDeep Reinforcement Learning	—Unverified
Semantic-Aware Remote Estimation of Multiple Markov Sources Under Constraints	Mar 25, 2024	Q-LearningReinforcement Learning (RL)	—Unverified
Semi-Supervised Off Policy Reinforcement Learning	Dec 9, 2020	ImputationQ-Learning	—Unverified
Sepsis World Model: A MIMIC-based OpenAI Gym "World Model" Simulator for Sepsis Treatment	Dec 15, 2019	modelOpenAI Gym	—Unverified
Sequential Learning-based IaaS Composition	Feb 24, 2021	ClusteringQ-Learning	—Unverified

Show:10 25 50

← PrevPage 25 of 39Next →

No leaderboard results yet.