Q-Learning

The goal of Q-learning is to learn a policy, which tells an agent what action to take under what circumstances.

( Image credit: Playing Atari with Deep Reinforcement Learning )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1001–1050 of 1918 papers

Title	Date	Tasks	Status
Towards Learning to Speak and Hear Through Multi-Agent Communication over a Continuous Acoustic Channel	Nov 4, 2021	Language AcquisitionMulti-agent Reinforcement Learning	—Unverified
Balanced Q-learning: Combining the Influence of Optimistic and Pessimistic Targets	Nov 3, 2021	Q-Learning	—Unverified
Koopman Q-learning: Offline Reinforcement Learning via Symmetries of Dynamics	Nov 2, 2021	D4RLData Augmentation	—Unverified
Decentralized Multi-Agent Reinforcement Learning: An Off-Policy Method	Oct 31, 2021	Multi-agent Reinforcement LearningQ-Learning	—Unverified
Throughput and Latency in the Distributed Q-Learning Random Access mMTC Networks	Oct 30, 2021	Q-Learning	—Unverified
Location-routing Optimisation for Urban Logistics Using Mobile Parcel Locker Based on Hybrid Q-Learning Algorithm	Oct 29, 2021	Q-Learning	—Unverified
Learning to Communicate with Reinforcement Learning for an Adaptive Traffic Control System	Oct 29, 2021	Multi-agent Reinforcement LearningQ-Learning	—Unverified
Temporal-Difference Value Estimation via Uncertainty-Guided Soft Updates	Oct 28, 2021	Q-LearningScheduling	—Unverified
Cooperative Deep Q-learning Framework for Environments Providing Image Feedback	Oct 28, 2021	Deep Reinforcement LearningQ-Learning	—Unverified
V-Learning -- A Simple, Efficient, Decentralized Algorithm for Multiagent RL	Oct 27, 2021	Medical Visual Question AnsweringQ-Learning	—Unverified
Finite Horizon Q-learning: Stability, Convergence, Simulations and an application on Smart Grids	Oct 27, 2021	Q-Learningreinforcement-learning	—Unverified
Multi-Agent Advisor Q-Learning	Oct 26, 2021	Decision MakingMulti-agent Reinforcement Learning	CodeCode Available
Automating Control of Overestimation Bias for Reinforcement Learning	Oct 26, 2021	Continuous ControlQ-Learning	—Unverified
Can Q-Learning be Improved with Advice?	Oct 25, 2021	Q-Learningreinforcement-learning	—Unverified
Deep Reinforcement Learning for Simultaneous Sensing and Channel Access in Cognitive Networks	Oct 24, 2021	Deep Reinforcement LearningQ-Learning	—Unverified
A Reinforcement Learning Approach to Parameter Selection for Distributed Optimal Power Flow	Oct 22, 2021	Distributed OptimizationQ-Learning	—Unverified
Can Q-learning solve Multi Armed Bantids?	Oct 21, 2021	Decision MakingQ-Learning	—Unverified
Playing 2048 With Reinforcement Learning	Oct 20, 2021	Playing the Game of 2048Q-Learning	CodeCode Available
Balancing Value Underestimation and Overestimation with Realistic Actor-Critic	Oct 19, 2021	continuous-controlContinuous Control	CodeCode Available
A Q-Learning-based Approach for Distributed Beam Scheduling in mmWave Networks	Oct 17, 2021	ManagementQ-Learning	—Unverified
Online Target Q-learning with Reverse Experience Replay: Efficiently finding the Optimal Policy for Linear MDPs	Oct 16, 2021	Q-LearningReinforcement Learning (RL)	—Unverified
Value Penalized Q-Learning for Recommender Systems	Oct 15, 2021	Offline RLQ-Learning	—Unverified
Provably Efficient Multi-Agent Reinforcement Learning with Fully Decentralized Communication	Oct 14, 2021	Multi-agent Reinforcement LearningQ-Learning	—Unverified
On Improving Model-Free Algorithms for Decentralized Multi-Agent Reinforcement Learning	Oct 12, 2021	Multi-agent Reinforcement LearningQ-Learning	—Unverified
Fast Block Linear System Solver Using Q-Learning Schduling for Unified Dynamic Power System Simulations	Oct 12, 2021	Q-LearningScheduling	—Unverified
Provably Efficient Reinforcement Learning in Decentralized General-Sum Markov Games	Oct 12, 2021	Multi-agent Reinforcement LearningQ-Learning	—Unverified
Navigation In Urban Environments Amongst Pedestrians Using Multi-Objective Deep Reinforcement Learning	Oct 11, 2021	Autonomous DrivingAutonomous Navigation	—Unverified
Urban traffic dynamic rerouting framework: A DRL-based model with fog-cloud architecture	Oct 11, 2021	Graph AttentionQ-Learning	—Unverified
A Deep Learning Inference Scheme Based on Pipelined Matrix Multiplication Acceleration Design and Non-uniform Quantization	Oct 10, 2021	Edge-computingQ-Learning	—Unverified
Breaking the Sample Complexity Barrier to Regret-Optimal Model-Free Reinforcement Learning	Oct 9, 2021	Q-Learningreinforcement-learning	—Unverified
Training Transition Policies via Distribution Matching for Complex Tasks	Oct 8, 2021	Hierarchical Reinforcement LearningQ-Learning	CodeCode Available
Compositional Q-learning for electrolyte repletion with imbalanced patient sub-populations	Oct 6, 2021	Decision MakingNavigate	—Unverified
A study of first-passage time minimization via Q-learning in heated gridworlds	Oct 5, 2021	Q-Learningreinforcement-learning	—Unverified
A Deep Reinforcement Learning Framework for Contention-Based Spectrum Sharing	Oct 5, 2021	Deep Reinforcement LearningFairness	—Unverified
Deep reinforcement learning for guidewire navigation in coronary artery phantom	Oct 5, 2021	Deep Reinforcement LearningQ-Learning	—Unverified
A Modified Q-Learning Algorithm for Rate-Profiling of Polarization Adjusted Convolutional (PAC) Codes	Oct 4, 2021	Q-Learningreinforcement-learning	—Unverified
Cellular traffic offloading via Opportunistic Networking with Reinforcement Learning	Oct 1, 2021	Q-Learningreinforcement-learning	—Unverified
Towards Unknown-aware Deep Q-Learning	Sep 29, 2021	Deep Reinforcement LearningOut of Distribution (OOD) Detection	—Unverified
Q-learning for real time control of heterogeneous microagent collectives	Sep 29, 2021	Q-Learning	—Unverified
Q-Learning Scheduler for Multi-Task Learning through the use of Histogram of Task Uncertainty	Sep 29, 2021	Multi-Task LearningQ-Learning	—Unverified
Polyphonic Music Composition: An Adversarial Inverse Reinforcement Learning Approach	Sep 29, 2021	Q-Learningreinforcement-learning	—Unverified
Text Generation with Efficient (Soft) Q-Learning	Sep 29, 2021	Q-LearningReinforcement Learning (RL)	—Unverified
Bootstrapped Hindsight Experience replay with Counterintuitive Prioritization	Sep 29, 2021	Q-Learning	—Unverified
Learning Explicit Credit Assignment for Multi-agent Joint Q-learning	Sep 29, 2021	Q-Learning	—Unverified
Value Refinement Network (VRN)	Sep 29, 2021	Q-LearningReinforcement Learning (RL)	—Unverified
Robust and Data-efficient Q-learning by Composite Value-estimation	Sep 29, 2021	Q-Learning	—Unverified
^2-exploration for Reinforcement Learning	Sep 29, 2021	General Reinforcement LearningQ-Learning	—Unverified
An Attempt to Model Human Trust with Reinforcement Learning	Sep 29, 2021	Decision MakingQ-Learning	—Unverified
Untangling Braids with Multi-agent Q-Learning	Sep 29, 2021	OpenAI GymQ-Learning	—Unverified
Unifying Top-down and Bottom-up for Recurrent Visual Attention	Sep 29, 2021	Q-Learning	—Unverified

Show:10 25 50

← PrevPage 21 of 39Next →

No leaderboard results yet.