Q-Learning

The goal of Q-learning is to learn a policy, which tells an agent what action to take under what circumstances.

( Image credit: Playing Atari with Deep Reinforcement Learning )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 751–800 of 1918 papers

Title	Date	Tasks	Status
Logit-Q Dynamics for Efficient Learning in Stochastic Teams	Feb 20, 2023	Q-Learning	—Unverified
Online Statistical Inference for Nonlinear Stochastic Approximation with Markovian Data	Feb 15, 2023	Q-Learningvalid	—Unverified
Deep Offline Reinforcement Learning for Real-world Treatment Optimization Applications	Feb 15, 2023	Decision MakingManagement	—Unverified
Computation Offloading for Uncertain Marine Tasks by Cooperation of UAVs and Vessels	Feb 13, 2023	Q-Learning	—Unverified
A Lifetime Extended Energy Management Strategy for Fuel Cell Hybrid Electric Vehicles via Self-Learning Fuzzy Reinforcement Learning	Feb 13, 2023	energy managementManagement	—Unverified
Differentially Private Deep Q-Learning for Pattern Privacy Preservation in MEC Offloading	Feb 9, 2023	Edge-computingQ-Learning	—Unverified
MACOptions: Multi-Agent Learning with Centralized Controller and Options Framework	Feb 7, 2023	Q-Learning	—Unverified
Catch Me If You Can: Improving Adversaries in Cyber-Security With Q-Learning Algorithms	Feb 7, 2023	Q-Learning	—Unverified
Offline Minimax Soft-Q-learning Under Realizability and Partial Coverage	Feb 5, 2023	Offline RLQ-Learning	—Unverified
Diversity Through Exclusion (DTE): Niche Identification for Reinforcement Learning through Value-Decomposition	Feb 2, 2023	DiversityQ-Learning	—Unverified
Best Possible Q-Learning	Feb 2, 2023	Multi-agent Reinforcement LearningQ-Learning	—Unverified
Sample Complexity of Kernel-Based Q-Learning	Feb 1, 2023	Q-LearningReinforcement Learning (RL)	—Unverified
The impact of surplus sharing on the outcomes of specific investments under negotiated transfer pricing: An agent-based simulation with fuzzy Q-learning agents	Jan 28, 2023	Decision MakingQ-Learning	—Unverified
Analyzing Robustness of the Deep Reinforcement Learning Algorithm in Ramp Metering Applications Considering False Data Injection Attack and Defense	Jan 28, 2023	Adversarial AttackDeep Reinforcement Learning	—Unverified
RCsearcher: Reaction Center Identification in Retrosynthesis via Deep Q-Learning	Jan 28, 2023	Deep Reinforcement LearningGraph Neural Network	—Unverified
Single-Trajectory Distributionally Robust Reinforcement Learning	Jan 27, 2023	Decision MakingQ-Learning	—Unverified
Learning from Multiple Independent Advisors in Multi-agent Reinforcement Learning	Jan 26, 2023	Multi-agent Reinforcement LearningQ-Learning	CodeCode Available
FedHQL: Federated Heterogeneous Q-Learning	Jan 26, 2023	Q-Learningreinforcement-learning	—Unverified
Asymptotic Convergence and Performance of Multi-Agent Q-Learning Dynamics	Jan 23, 2023	Q-Learning	—Unverified
Asynchronous Deep Double Duelling Q-Learning for Trading-Signal Execution in Limit Order Book Markets	Jan 20, 2023	Deep Reinforcement LearningManagement	—Unverified
Risk-Averse Reinforcement Learning via Dynamic Time-Consistent Risk Measures	Jan 14, 2023	Q-Learningreinforcement-learning	—Unverified
Decentralized model-free reinforcement learning in stochastic games with average-reward objective	Jan 13, 2023	Q-Learningreinforcement-learning	—Unverified
Hierarchical Deep Q-Learning Based Handover in Wireless Networks with Dual Connectivity	Jan 13, 2023	Q-Learningreinforcement-learning	—Unverified
Multi-Power Level Q-Learning Algorithm for Random Access in NOMA mMTC Systems	Jan 12, 2023	Q-Learning	—Unverified
Tuning Path Tracking Controllers for Autonomous Cars Using Reinforcement Learning	Jan 9, 2023	NavigateQ-Learning	—Unverified
Temporal Difference Learning with Compressed Updates: Error-Feedback meets Reinforcement Learning	Jan 3, 2023	Multi-agent Reinforcement LearningQ-Learning	—Unverified
Contextual Conservative Q-Learning for Offline Reinforcement Learning	Jan 3, 2023	MuJoCoQ-Learning	—Unverified
Deep Spectral Q-learning with Application to Mobile Health	Jan 3, 2023	Q-Learning	—Unverified
NARS vs. Reinforcement learning: ONA vs. Q-Learning	Dec 23, 2022	Q-Learningreinforcement-learning	CodeCode Available
Decoding surface codes with deep reinforcement learning and probabilistic policy reuse	Dec 22, 2022	Deep Reinforcement LearningQ-Learning	—Unverified
Control of Continuous Quantum Systems with Many Degrees of Freedom based on Convergent Reinforcement Learning	Dec 21, 2022	Deep Reinforcement LearningQ-Learning	CodeCode Available
Bandit approach to conflict-free multi-agent Q-learning in view of photonic implementation	Dec 20, 2022	Decision MakingMulti-agent Reinforcement Learning	—Unverified
Taming Lagrangian Chaos with Multi-Objective Reinforcement Learning	Dec 19, 2022	Multi-Objective Reinforcement LearningQ-Learning	—Unverified
Offline Robot Reinforcement Learning with Uncertainty-Guided Human Expert Sampling	Dec 16, 2022	MuJoCoQ-Learning	—Unverified
Distributed-Training-and-Execution Multi-Agent Reinforcement Learning for Power Control in HetNet	Dec 15, 2022	Deep Reinforcement LearningMulti-agent Reinforcement Learning	CodeCode Available
VOQL: Towards Optimal Regret in Model-free RL with Nonlinear Function Approximation	Dec 12, 2022	Q-Learningregression	—Unverified
Frugal Reinforcement-based Active Learning	Dec 9, 2022	Active LearningDiversity	—Unverified
Reinforcement Learning for Resilient Power Grids	Dec 8, 2022	Q-Learningreinforcement-learning	—Unverified
PALMER: Perception-Action Loop with Memory for Long-Horizon Planning	Dec 8, 2022	Q-LearningRepresentation Learning	—Unverified
EASpace: Enhanced Action Space for Policy Transfer	Dec 7, 2022	Q-LearningTransfer Learning	CodeCode Available
A Machine with Short-Term, Episodic, and Semantic Memory Systems	Dec 5, 2022	Q-LearningReinforcement Learning (RL)	CodeCode Available
Automata Learning meets Shielding	Dec 4, 2022	Q-LearningReinforcement Learning (RL)	CodeCode Available
Welfare and Fairness in Multi-objective Reinforcement Learning	Nov 30, 2022	FairnessMulti-Objective Reinforcement Learning	CodeCode Available
Automatic Discovery of Multi-perspective Process Model using Reinforcement Learning	Nov 30, 2022	Model DiscoveryQ-Learning	—Unverified
State-Aware Proximal Pessimistic Algorithms for Offline Reinforcement Learning	Nov 28, 2022	Offline RLQ-Learning	—Unverified
QLAMMP: A Q-Learning Agent for Optimizing Fees on Automated Market Making Protocols	Nov 28, 2022	Q-Learning	—Unverified
Causal Deep Reinforcement Learning Using Observational Data	Nov 28, 2022	Autonomous DrivingCausal Inference	—Unverified
Offline Q-Learning on Diverse Multi-Task Data Both Scales And Generalizes	Nov 28, 2022	Offline RLQ-Learning	—Unverified
UAV-Assisted Space-Air-Ground Integrated Networks: A Technical Review of Recent Learning Algorithms	Nov 27, 2022	FairnessQ-Learning	—Unverified
Explainable and Safe Reinforcement Learning for Autonomous Air Mobility	Nov 24, 2022	Adversarial AttackDeep Reinforcement Learning	CodeCode Available

Show:10 25 50

← PrevPage 16 of 39Next →

No leaderboard results yet.