SOTAVerified|Agents Browse Leaderboard About

Q-Learning

The goal of Q-learning is to learn a policy, which tells an agent what action to take under what circumstances.

( Image credit: Playing Atari with Deep Reinforcement Learning )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 326–350 of 1918 papers

Title	Date	Tasks	Status	Hype
Continuous-time Risk-sensitive Reinforcement Learning via Quadratic Variation Penalty	Apr 19, 2024	Q-Learningreinforcement-learning	—Unverified	0
From r to Q^*: Your Language Model is Secretly a Q-Function	Apr 18, 2024	Language ModelingLanguage Modelling	—Unverified	0
Empowering Embodied Visual Tracking with Visual Foundation Models and Offline RL	Apr 15, 2024	GPUOffline RL	—Unverified	0
Advancing Forest Fire Prevention: Deep Reinforcement Learning for Effective Firebreak Placement	Apr 12, 2024	Deep Reinforcement LearningQ-Learning	—Unverified	0
Traffic Signal Control and Speed Offset Coordination Using Q-Learning for Arterial Road Networks	Apr 9, 2024	Q-LearningTraffic Signal Control	—Unverified	0
Prelimit Coupling and Steady-State Convergence of Constant-stepsize Nonsmooth Contractive SA	Apr 9, 2024	Q-Learning	—Unverified	0
Deep Reinforcement Learning Control for Disturbance Rejection in a Nonlinear Dynamic System with Parametric Uncertainty	Apr 6, 2024	Deep Reinforcement LearningQ-Learning	—Unverified	0
Growing Q-Networks: Solving Continuous Control Tasks with Adaptive Control Resolution	Apr 5, 2024	continuous-controlContinuous Control	—Unverified	0
Superior Genetic Algorithms for the Target Set Selection Problem Based on Power-Law Parameter Choices and Simple Greedy Heuristics	Apr 5, 2024	Q-Learning	CodeCode Available	0
Laser Learning Environment: A new environment for coordination-critical multi-agent tasks	Apr 4, 2024	Multi-agent Reinforcement LearningQ-Learning	CodeCode Available	1
Data-Driven Knowledge Transfer in Batch Q^* Learning	Apr 1, 2024	Decision MakingMarketing	—Unverified	0
Utilizing Maximum Mean Discrepancy Barycenter for Propagating the Uncertainty of Value Functions in Reinforcement Learning	Mar 31, 2024	Atari GamesQ-Learning	—Unverified	0
EnCoMP: Enhanced Covert Maneuver Planning with Adaptive Threat-Aware Visibility Estimation using Offline Reinforcement Learning	Mar 29, 2024	NavigateQ-Learning	—Unverified	0
From Two-Dimensional to Three-Dimensional Environment with Q-Learning: Modeling Autonomous Navigation with Reinforcement Learning and no Libraries	Mar 27, 2024	Autonomous NavigationDecision Making	CodeCode Available	0
Compressed Federated Reinforcement Learning with a Generative Model	Mar 26, 2024	modelQ-Learning	CodeCode Available	0
Semantic-Aware Remote Estimation of Multiple Markov Sources Under Constraints	Mar 25, 2024	Q-LearningReinforcement Learning (RL)	—Unverified	0
DASA: Delay-Adaptive Multi-Agent Stochastic Approximation	Mar 25, 2024	AvgQ-Learning	—Unverified	0
A Fairness-Oriented Reinforcement Learning Approach for the Operation and Control of Shared Micromobility Services	Mar 23, 2024	FairnessQ-Learning	CodeCode Available	0
Reinforcement Learning for Online Testing of Autonomous Driving Systems: a Replication and Extension Study	Mar 20, 2024	Autonomous DrivingQ-Learning	—Unverified	0
State-Separated SARSA: A Practical Sequential Decision-Making Algorithm with Recovering Rewards	Mar 18, 2024	Decision MakingQ-Learning	—Unverified	0
Neural-Kernel Conditional Mean Embeddings	Mar 16, 2024	Deep LearningDensity Estimation	—Unverified	0
A Reinforcement Learning Approach to Dairy Farm Battery Management using Q Learning	Mar 14, 2024	ManagementQ-Learning	—Unverified	0
Model-free Resilient Controller Design based on Incentive Feedback Stackelberg Game and Q-learning	Mar 13, 2024	Q-Learning	—Unverified	0
Strategizing against Q-learners: A Control-theoretical Approach	Mar 13, 2024	Multi-agent Reinforcement LearningQ-Learning	—Unverified	0
Optimal Design and Implementation of an Open-source Emulation Platform for User-Centric Shared E-mobility Services	Mar 12, 2024	Q-Learning	—Unverified	0

Show:10 25 50

← PrevPage 14 of 77Next →

No leaderboard results yet.