SOTAVerified|Agents Browse Leaderboard About

Q-Learning

The goal of Q-learning is to learn a policy, which tells an agent what action to take under what circumstances.

( Image credit: Playing Atari with Deep Reinforcement Learning )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 776–800 of 1918 papers

Title	Date	Tasks	Status
Temporal Difference Learning with Compressed Updates: Error-Feedback meets Reinforcement Learning	Jan 3, 2023	Multi-agent Reinforcement LearningQ-Learning	—Unverified
Contextual Conservative Q-Learning for Offline Reinforcement Learning	Jan 3, 2023	MuJoCoQ-Learning	—Unverified
Deep Spectral Q-learning with Application to Mobile Health	Jan 3, 2023	Q-Learning	—Unverified
NARS vs. Reinforcement learning: ONA vs. Q-Learning	Dec 23, 2022	Q-Learningreinforcement-learning	CodeCode Available
Decoding surface codes with deep reinforcement learning and probabilistic policy reuse	Dec 22, 2022	Deep Reinforcement LearningQ-Learning	—Unverified
Control of Continuous Quantum Systems with Many Degrees of Freedom based on Convergent Reinforcement Learning	Dec 21, 2022	Deep Reinforcement LearningQ-Learning	CodeCode Available
Bandit approach to conflict-free multi-agent Q-learning in view of photonic implementation	Dec 20, 2022	Decision MakingMulti-agent Reinforcement Learning	—Unverified
Taming Lagrangian Chaos with Multi-Objective Reinforcement Learning	Dec 19, 2022	Multi-Objective Reinforcement LearningQ-Learning	—Unverified
Offline Robot Reinforcement Learning with Uncertainty-Guided Human Expert Sampling	Dec 16, 2022	MuJoCoQ-Learning	—Unverified
Distributed-Training-and-Execution Multi-Agent Reinforcement Learning for Power Control in HetNet	Dec 15, 2022	Deep Reinforcement LearningMulti-agent Reinforcement Learning	CodeCode Available
VOQL: Towards Optimal Regret in Model-free RL with Nonlinear Function Approximation	Dec 12, 2022	Q-Learningregression	—Unverified
Frugal Reinforcement-based Active Learning	Dec 9, 2022	Active LearningDiversity	—Unverified
Reinforcement Learning for Resilient Power Grids	Dec 8, 2022	Q-Learningreinforcement-learning	—Unverified
PALMER: Perception-Action Loop with Memory for Long-Horizon Planning	Dec 8, 2022	Q-LearningRepresentation Learning	—Unverified
EASpace: Enhanced Action Space for Policy Transfer	Dec 7, 2022	Q-LearningTransfer Learning	CodeCode Available
A Machine with Short-Term, Episodic, and Semantic Memory Systems	Dec 5, 2022	Q-LearningReinforcement Learning (RL)	CodeCode Available
Automata Learning meets Shielding	Dec 4, 2022	Q-LearningReinforcement Learning (RL)	CodeCode Available
Welfare and Fairness in Multi-objective Reinforcement Learning	Nov 30, 2022	FairnessMulti-Objective Reinforcement Learning	CodeCode Available
Automatic Discovery of Multi-perspective Process Model using Reinforcement Learning	Nov 30, 2022	Model DiscoveryQ-Learning	—Unverified
State-Aware Proximal Pessimistic Algorithms for Offline Reinforcement Learning	Nov 28, 2022	Offline RLQ-Learning	—Unverified
QLAMMP: A Q-Learning Agent for Optimizing Fees on Automated Market Making Protocols	Nov 28, 2022	Q-Learning	—Unverified
Causal Deep Reinforcement Learning Using Observational Data	Nov 28, 2022	Autonomous DrivingCausal Inference	—Unverified
Offline Q-Learning on Diverse Multi-Task Data Both Scales And Generalizes	Nov 28, 2022	Offline RLQ-Learning	—Unverified
UAV-Assisted Space-Air-Ground Integrated Networks: A Technical Review of Recent Learning Algorithms	Nov 27, 2022	FairnessQ-Learning	—Unverified
Explainable and Safe Reinforcement Learning for Autonomous Air Mobility	Nov 24, 2022	Adversarial AttackDeep Reinforcement Learning	CodeCode Available

Show:10 25 50

← PrevPage 32 of 77Next →

No leaderboard results yet.