Q-Learning

The goal of Q-learning is to learn a policy, which tells an agent what action to take under what circumstances.

( Image credit: Playing Atari with Deep Reinforcement Learning )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 251–275 of 1918 papers

Title	Date	Tasks	Status
Music Generation using Human-In-The-Loop Reinforcement Learning	Jan 25, 2025	Music GenerationQ-Learning	—Unverified
Coordinating Ride-Pooling with Public Transit using Reward-Guided Conservative Q-Learning: An Offline Training and Online Fine-Tuning Reinforcement Learning Framework	Jan 24, 2025	Q-LearningReinforcement Learning (RL)	—Unverified
BMG-Q: Localized Bipartite Match Graph Attention Q-Learning for Ride-Pooling Order Dispatch	Jan 23, 2025	Graph AttentionGraph Sampling	—Unverified
Random-Key Algorithms for Optimizing Integrated Operating Room Scheduling	Jan 17, 2025	Combinatorial OptimizationDecoder	—Unverified
Projection Implicit Q-Learning with Support Constraint for Offline Reinforcement Learning	Jan 15, 2025	D4RLQ-Learning	—Unverified
SPEQ: Stabilization Phases for Efficient Q-Learning in High Update-To-Data Ratio Reinforcement Learning	Jan 15, 2025	Computational Efficiencycontinuous-control	—Unverified
Data-driven inventory management for new products: An adjusted Dyna-Q approach with transfer learning	Jan 14, 2025	BenchmarkingManagement	—Unverified
Online inductive learning from answer sets for efficient reinforcement learning exploration	Jan 13, 2025	Inductive LearningInductive logic programming	—Unverified
An Empirical Study of Deep Reinforcement Learning in Continuing Tasks	Jan 12, 2025	Deep Reinforcement LearningMuJoCo	CodeCode Available
Cooperative Optimal Output Tracking for Discrete-Time Multiagent Systems: Stabilizing Policy Iteration Frameworks and Analysis	Jan 11, 2025	Q-Learning	—Unverified
Deep Transfer Q-Learning for Offline Non-Stationary Reinforcement Learning	Jan 8, 2025	Decision MakingInductive Learning	—Unverified
β-DQN: Improving Deep Q-Learning By Evolving the Behavior	Jan 1, 2025	Deep Reinforcement LearningEfficient Exploration	—Unverified
Data-Based Efficient Off-Policy Stabilizing Optimal Control Algorithms for Discrete-Time Linear Systems via Damping Coefficients	Dec 30, 2024	Q-Learningreinforcement-learning	—Unverified
Protein Structure Prediction in the 3D HP Model Using Deep Reinforcement Learning	Dec 29, 2024	Deep Reinforcement LearningProtein Structure Prediction	—Unverified
Dynamic Optimization of Storage Systems Using Reinforcement Learning Techniques	Dec 29, 2024	CPUQ-Learning	—Unverified
A Reinforcement Learning-Based Task Mapping Method to Improve the Reliability of Clustered Manycores	Dec 26, 2024	Q-LearningReinforcement Learning (RL)	—Unverified
HyperQ-Opt: Q-learning for Hyperparameter Optimization	Dec 23, 2024	Bayesian OptimizationHyperparameter Optimization	—Unverified
ACL-QL: Adaptive Conservative Level in Q-Learning for Offline Reinforcement Learning	Dec 22, 2024	D4RLQ-Learning	—Unverified
Multi-Agent Q-Learning for Real-Time Load Balancing User Association and Handover in Mobile Networks	Dec 22, 2024	Q-Learning	—Unverified
Decoding fairness: a reinforcement learning perspective	Dec 20, 2024	FairnessImitation Learning	CodeCode Available
MacLight: Multi-scene Aggregation Convolutional Learning for Traffic Signal Control	Dec 20, 2024	Graph AttentionQ-Learning	CodeCode Available
Neural-Network-Driven Reward Prediction as a Heuristic: Advancing Q-Learning for Mobile Robot Path Planning	Dec 17, 2024	Q-Learning	—Unverified
Distribution-Free Uncertainty Quantification in Mechanical Ventilation Treatment: A Conformal Deep Q-Learning Framework	Dec 17, 2024	Conformal PredictionDeep Reinforcement Learning	—Unverified
Integrated trucks assignment and scheduling problem with mixed service mode docks: A Q-learning based adaptive large neighborhood search algorithm	Dec 12, 2024	Q-LearningScheduling	—Unverified
PickLLM: Context-Aware RL-Assisted Large Language Model Routing	Dec 12, 2024	Language ModelingLanguage Modelling	—Unverified

Show:10 25 50

← PrevPage 11 of 77Next →

No leaderboard results yet.