Q-Learning

The goal of Q-learning is to learn a policy, which tells an agent what action to take under what circumstances.

( Image credit: Playing Atari with Deep Reinforcement Learning )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 551–600 of 1918 papers

Title	Date	Tasks	Status
Deep-Dispatch: A Deep Reinforcement Learning-Based Vehicle Dispatch Algorithm for Advanced Air Mobility	Dec 17, 2023	Deep Reinforcement LearningQ-Learning	—Unverified
On Designing Multi-UAV aided Wireless Powered Dynamic Communication via Hierarchical Deep Reinforcement Learning	Dec 13, 2023	Deep Reinforcement LearningQ-Learning	—Unverified
Enhanced Q-Learning Approach to Finite-Time Reachability with Maximum Probability for Probabilistic Boolean Control Networks	Dec 12, 2023	Q-LearningTransfer Learning	—Unverified
I Open at the Close: A Deep Reinforcement Learning Evaluation of Open Streets Initiatives	Dec 12, 2023	Deep Reinforcement LearningGraph Neural Network	CodeCode Available
Efficient Sparse-Reward Goal-Conditioned Reinforcement Learning with a High Replay Ratio and Regularization	Dec 10, 2023	Q-LearningReinforcement Learning (RL)	CodeCode Available
Synthesis of Temporally-Robust Policies for Signal Temporal Logic Tasks using Reinforcement Learning	Dec 10, 2023	Q-Learning	CodeCode Available
Two-Timescale Q-Learning with Function Approximation in Zero-Sum Stochastic Games	Dec 8, 2023	Q-Learningvalid	—Unverified
Joint User Association, Interference Cancellation and Power Control for Multi-IRS Assisted UAV Communications	Dec 8, 2023	Q-LearningScheduling	—Unverified
Efficient Parallel Reinforcement Learning Framework using the Reactor Model	Dec 7, 2023	OpenAI GymQ-Learning	CodeCode Available
An efficient data-based off-policy Q-learning algorithm for optimal output feedback control of linear systems	Dec 6, 2023	Q-Learning	—Unverified
Provable Reinforcement Learning for Networked Control Systems with Stochastic Packet Disordering	Dec 5, 2023	Q-Learningreinforcement-learning	—Unverified
A Q-learning approach to the continuous control problem of robot inverted pendulum balancing	Dec 5, 2023	continuous-controlContinuous Control	—Unverified
Algorithmic collusion under competitive design	Dec 5, 2023	Q-Learning	—Unverified
Data-efficient Deep Reinforcement Learning for Vehicle Trajectory Control	Nov 30, 2023	Autonomous DrivingDeep Reinforcement Learning	—Unverified
Anomaly Detection via Learning-Based Sequential Controlled Sensing	Nov 30, 2023	Anomaly DetectionDecision Making	—Unverified
Q-learning Based Optimal False Data Injection Attack on Probabilistic Boolean Control Networks	Nov 29, 2023	Q-Learningreinforcement-learning	—Unverified
OpenSense: An Open-World Sensing Framework for Incremental Learning and Dynamic Sensor Scheduling on Embedded Edge Devices	Nov 29, 2023	Incremental LearningQ-Learning	—Unverified
Reinforcement Learning from Diffusion Feedback: Q* for Image Search	Nov 27, 2023	Data AugmentationDiversity	—Unverified
FRAC-Q-Learning: A Reinforcement Learning with Boredom Avoidance Processes for Social Robots	Nov 26, 2023	Q-Learningreinforcement-learning	—Unverified
A Nearly Optimal and Low-Switching Algorithm for Reinforcement Learning with General Function Approximation	Nov 26, 2023	Q-LearningReinforcement Learning (RL)	—Unverified
Projected Off-Policy Q-Learning (POP-QL) for Stabilizing Offline Reinforcement Learning	Nov 25, 2023	Q-LearningReinforcement Learning (RL)	—Unverified
Approximation of Convex Envelope Using Reinforcement Learning	Nov 24, 2023	Q-Learningreinforcement-learning	—Unverified
Learning to Cooperate and Communicate Over Imperfect Channels	Nov 24, 2023	Q-Learning	—Unverified
Efficient Open-world Reinforcement Learning via Knowledge Distillation and Autonomous Rule Discovery	Nov 24, 2023	Deep Reinforcement LearningKnowledge Distillation	—Unverified
On optimal tracking portfolio in incomplete markets: The reinforcement learning approach	Nov 24, 2023	Q-Learning	—Unverified
Multi-intention Inverse Q-learning for Interpretable Behavior Representation	Nov 23, 2023	Decision MakingQ-Learning	CodeCode Available
Machine learning-based decentralized TDMA for VLC IoT networks	Nov 23, 2023	Collision AvoidanceQ-Learning	—Unverified
Decentralised Q-Learning for Multi-Agent Markov Decision Processes with a Satisfiability Criterion	Nov 21, 2023	Q-Learning	—Unverified
Offline Reinforcement Learning for Wireless Network Optimization with Mixture Datasets	Nov 19, 2023	ManagementOffline RL	—Unverified
Genetic Algorithm enhanced by Deep Reinforcement Learning in parent selection mechanism and mutation : Minimizing makespan in permutation flow shop scheduling problems	Nov 10, 2023	Deep Reinforcement LearningDiversity	—Unverified
Advancing Algorithmic Trading: A Multi-Technique Enhancement of Deep Q-Network Models	Nov 9, 2023	Algorithmic TradingQ-Learning	—Unverified
Pointer Networks with Q-Learning for Combinatorial Optimization	Nov 5, 2023	Combinatorial OptimizationGraph Embedding	—Unverified
Q-Learning for Stochastic Control under General Information Structures and Non-Markovian Environments	Oct 31, 2023	Q-LearningQuantization	—Unverified
DGFN: Double Generative Flow Networks	Oct 30, 2023	Drug DiscoveryQ-Learning	—Unverified
Weakly Coupled Deep Q-Networks	Oct 28, 2023	Deep Reinforcement LearningQ-Learning	—Unverified
Lifting the Veil: Unlocking the Power of Depth in Q-learning	Oct 27, 2023	Learning TheoryManagement	—Unverified
Model-free Posterior Sampling via Learning Rate Randomization	Oct 27, 2023	modelQ-Learning	—Unverified
Integrated Freeway Traffic Control Using Q-Learning with Adjacent Arterial Traffic Considerations	Oct 25, 2023	Q-Learning	—Unverified
Reinforcement learning based local path planning for mobile robot	Oct 24, 2023	Q-Learningreinforcement-learning	—Unverified
On the Convergence and Sample Complexity Analysis of Deep Q-Networks with ε-Greedy Exploration	Oct 24, 2023	Deep Reinforcement LearningQ-Learning	—Unverified
AI on the Water: Applying DRL to Autonomous Vessel Navigation	Oct 23, 2023	Collision AvoidanceDecision Making	—Unverified
Bad Values but Good Behavior: Learning Highly Misspecified Bandits and MDPs	Oct 13, 2023	Decision MakingMulti-Armed Bandits	—Unverified
Learning RL-Policies for Joint Beamforming Without Exploration: A Batch Constrained Off-Policy Approach	Oct 12, 2023	Deep Reinforcement LearningQ-Learning	CodeCode Available
Integrated Sensing and Communication Neighbor Discovery for MANET with Gossip Mechanism	Oct 11, 2023	Integrated sensing and communicationISAC	—Unverified
Suppressing Overestimation in Q-Learning through Adversarial Behaviors	Oct 10, 2023	Q-Learning	—Unverified
Inverse Factorized Q-Learning for Cooperative Multi-agent Imitation Learning	Oct 10, 2023	Imitation LearningQ-Learning	—Unverified
Dynamic value alignment through preference aggregation of multiple objectives	Oct 9, 2023	Q-Learning	—Unverified
DeepQTest: Testing Autonomous Driving Systems with Reinforcement Learning and Real-world Weather Data	Oct 8, 2023	Autonomous DrivingQ-Learning	CodeCode Available
Digital Twin Assisted Deep Reinforcement Learning for Online Admission Control in Sliced Network	Oct 7, 2023	Decision MakingDeep Reinforcement Learning	—Unverified
Diff-Transfer: Model-based Robotic Manipulation Skill Transfer via Differentiable Physics Simulation	Oct 7, 2023	Q-Learning	—Unverified

Show:10 25 50

← PrevPage 12 of 39Next →

No leaderboard results yet.