Q-Learning

The goal of Q-learning is to learn a policy, which tells an agent what action to take under what circumstances.

( Image credit: Playing Atari with Deep Reinforcement Learning )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 351–400 of 1918 papers

Title	Date	Tasks	Status
Dynamic operator management in meta-heuristics using reinforcement learning: an application to permutation flowshop scheduling problems	Aug 27, 2024	ManagementQ-Learning	—Unverified
Optimizing TD3 for 7-DOF Robotic Arm Grasping: Overcoming Suboptimality with Exploration-Enhanced Contrastive Learning	Aug 26, 2024	Contrastive LearningQ-Learning	—Unverified
Can LLM be a Good Path Planner based on Prompt Engineering? Mitigating the Hallucination for Path Planning	Aug 23, 2024	HallucinationPrompt Engineering	—Unverified
Deviations from the Nash equilibrium and emergence of tacit collusion in a two-player optimal execution game with reinforcement learning	Aug 21, 2024	Q-Learning	—Unverified
GINO-Q: Learning an Asymptotically Optimal Index Policy for Restless Multi-armed Bandits	Aug 19, 2024	Multi-Armed BanditsQ-Learning	—Unverified
Improved Q-learning based Multi-hop Routing for UAV-Assisted Communication	Aug 17, 2024	Collision AvoidanceQ-Learning	—Unverified
A Conflicts-free, Speed-lossless KAN-based Reinforcement Learning Decision System for Interactive Driving in Roundabouts	Aug 15, 2024	Autonomous DrivingAutonomous Vehicles	—Unverified
Variance-Reduced Cascade Q-learning: Algorithms and Sample Complexity	Aug 13, 2024	Q-Learning	—Unverified
A Geometric Nash Approach in Tuning the Learning Rate in Q-Learning Algorithm	Aug 9, 2024	Q-Learning	—Unverified
Crowd Intelligence for Early Misinformation Prediction on Social Media	Aug 8, 2024	Fact CheckingMisinformation	CodeCode Available
Model-free optimal controller for discrete-time Markovian jump linear systems: A Q-learning approach	Aug 6, 2024	Q-LearningReinforcement Learning (RL)	—Unverified
QADQN: Quantum Attention Deep Q-Network for Financial Market Prediction	Aug 6, 2024	Decision MakingQ-Learning	—Unverified
Whittle's index-based age-of-information minimization in multi-energy harvesting source networks	Aug 5, 2024	Q-LearningScheduling	—Unverified
Reinforcement Learning for an Efficient and Effective Malware Investigation during Cyber Incident Response	Aug 4, 2024	Decision MakingMalware Analysis	—Unverified
Multi-Objective Deep Reinforcement Learning for Optimisation in Autonomous Systems	Aug 2, 2024	Deep Reinforcement LearningMulti-Objective Reinforcement Learning	—Unverified
Multi-agent Assessment with QoS Enhancement for HD Map Updates in a Vehicular Network	Jul 31, 2024	Q-LearningReinforcement Learning (RL)	—Unverified
Evolution of cooperation with Q-learning: the impact of information perception	Jul 29, 2024	DiversityQ-Learning	—Unverified
Evolution of cooperation in the public goods game with Q-learning	Jul 29, 2024	Decision MakingImitation Learning	—Unverified
Multi-Agent Deep Reinforcement Learning for Energy Efficient Multi-Hop STAR-RIS-Assisted Transmissions	Jul 26, 2024	Deep Reinforcement LearningQ-Learning	—Unverified
QT-TDM: Planning With Transformer Dynamics Model and Autoregressive Q-Learning	Jul 26, 2024	continuous-controlContinuous Control	—Unverified
Long-term Fairness in Ride-Hailing Platform	Jul 25, 2024	FairnessQ-Learning	—Unverified
Principal-Agent Reinforcement Learning: Orchestrating AI Agents with Contracts	Jul 25, 2024	Q-Learningreinforcement-learning	—Unverified
In Search for Architectures and Loss Functions in Multi-Objective Reinforcement Learning	Jul 23, 2024	Multi-Objective Reinforcement LearningQ-Learning	—Unverified
MODRL-TA:A Multi-Objective Deep Reinforcement Learning Framework for Traffic Allocation in E-Commerce Search	Jul 22, 2024	Data AugmentationDeep Reinforcement Learning	—Unverified
Evaluation of Reinforcement Learning for Autonomous Penetration Testing using A3C, Q-learning and DQN	Jul 22, 2024	Decision MakingQ-Learning	—Unverified
Hard Prompts Made Interpretable: Sparse Entropy Regularization for Prompt Tuning with RL	Jul 20, 2024	Few-Shot Text ClassificationQ-Learning	CodeCode Available
Coverage-aware and Reinforcement Learning Using Multi-agent Approach for HD Map QoS in a Realistic Environment	Jul 19, 2024	Q-Learning	—Unverified
Reinforcement Learning: Tutorial and Survey	Jul 18, 2024	Deep Reinforcement LearningGeneral Reinforcement Learning	—Unverified
An Agile Adaptation Method for Multi-mode Vehicle Communication Networks	Jul 18, 2024	Q-Learningreinforcement-learning	—Unverified
Deep Reinforcement Learning for Multi-Objective Optimization: Enhancing Wind Turbine Energy Generation while Mitigating Noise Emissions	Jul 18, 2024	Deep Reinforcement LearningPitch control	—Unverified
Optimistic Q-learning for average reward and episodic reinforcement learning	Jul 18, 2024	Q-Learningreinforcement-learning	—Unverified
Solving the Model Unavailable MARE using Q-Learning Algorithm	Jul 18, 2024	Q-Learning	—Unverified
Misspecified Q-Learning with Sparse Linear Function Approximation: Tight Bounds on Approximation Error	Jul 18, 2024	Q-Learning	—Unverified
Cooperative Reward Shaping for Multi-Agent Pathfinding	Jul 15, 2024	Collision AvoidanceMulti-agent Reinforcement Learning	—Unverified
Exploration in Knowledge Transfer Utilizing Reinforcement Learning	Jul 15, 2024	Q-Learningreinforcement-learning	—Unverified
PAIL: Performance based Adversarial Imitation Learning Engine for Carbon Neutral Optimization	Jul 12, 2024	Deep Reinforcement LearningImitation Learning	—Unverified
PID Accelerated Temporal Difference Algorithms	Jul 11, 2024	Q-LearningReinforcement Learning (RL)	—Unverified
Periodic agent-state based Q-learning for POMDPs	Jul 8, 2024	Q-LearningReinforcement Learning (RL)	—Unverified
A Multi-Step Minimax Q-learning Algorithm for Two-Player Zero-Sum Markov Games	Jul 5, 2024	Q-Learning	CodeCode Available
Unified continuous-time q-learning for mean-field game and mean-field control problems	Jul 5, 2024	Q-Learning	—Unverified
Robust Q-Learning for finite ambiguity sets	Jul 5, 2024	Q-Learning	CodeCode Available
Artificial Intelligence and Algorithmic Price Collusion in Two-sided Markets	Jul 4, 2024	Q-Learning	—Unverified
Continuous-time q-Learning for Jump-Diffusion Models under Tsallis Entropy	Jul 4, 2024	Q-Learning	—Unverified
Configuring Transmission Thresholds in IIoT Alarm Scenarios for Energy-Efficient Event Reporting	Jul 4, 2024	Q-LearningScheduling	—Unverified
Two-Step Q-Learning	Jul 2, 2024	Q-Learning	—Unverified
A Deep Reinforcement Learning Approach to Battery Management in Dairy Farming via Proximal Policy Optimization	Jul 1, 2024	Deep Reinforcement Learningenergy management	—Unverified
Model-based Offline Reinforcement Learning with Lower Expectile Q-Learning	Jun 30, 2024	D4RLOffline RL	—Unverified
Towards Secure and Efficient Data Scheduling for Vehicular Social Networks	Jun 28, 2024	Q-LearningScheduling	—Unverified
Contextualized Hybrid Ensemble Q-learning: Learning Fast with Control Priors	Jun 28, 2024	Car RacingQ-Learning	CodeCode Available
Decentralized Semantic Traffic Control in AVs Using RL and DQN for Dynamic Roadblocks	Jun 26, 2024	Autonomous VehiclesDecision Making	—Unverified

Show:10 25 50

← PrevPage 8 of 39Next →

No leaderboard results yet.