Q-Learning

The goal of Q-learning is to learn a policy, which tells an agent what action to take under what circumstances.

( Image credit: Playing Atari with Deep Reinforcement Learning )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1201–1250 of 1918 papers

Title	Date	Tasks	Status
Deep Q Learning from Dynamic Demonstration with Behavioral Cloning	Jan 1, 2021	Deep Reinforcement LearningOpenAI Gym	—Unverified
Deep Q-Learning with Low Switching Cost	Jan 1, 2021	Atari GamesDeep Reinforcement Learning	—Unverified
Double Q-learning: New Analysis and Sharper Finite-time Bound	Jan 1, 2021	Q-Learning	—Unverified
Learning Movement Strategies for Moving Target Defense	Jan 1, 2021	Q-Learning	—Unverified
Addressing Distribution Shift in Online Reinforcement Learning with Offline Datasets	Jan 1, 2021	D4RLMuJoCo	—Unverified
Deep Reinforcement Learning-based Anti-jamming Power Allocation in a Two-cell NOMA Network	Jan 1, 2021	Deep Reinforcement LearningQ-Learning	—Unverified
Optimistic Exploration with Backward Bootstrapped Bonus for Deep Reinforcement Learning	Jan 1, 2021	Atari GamesDeep Reinforcement Learning	—Unverified
Uncertainty Weighted Offline Reinforcement Learning	Jan 1, 2021	Offline RLQ-Learning	—Unverified
Weighted Bellman Backups for Improved Signal-to-Noise in Q-Updates	Jan 1, 2021	Deep Reinforcement LearningQ-Learning	—Unverified
Blackwell Online Learning for Markov Decision Processes	Dec 28, 2020	Learning TheoryQ-Learning	—Unverified
Disentangled Planning and Control in Vision Based Robotics via Reward Machines	Dec 28, 2020	Q-Learning	—Unverified
POPO: Pessimistic Offline Policy Optimization	Dec 26, 2020	Offline RLQ-Learning	CodeCode Available
Assured RL: Reinforcement Learning with Almost Sure Constraints	Dec 24, 2020	Q-Learningreinforcement-learning	—Unverified
Goal Reasoning by Selecting Subgoals with Deep Q-Learning	Dec 22, 2020	Q-Learning	—Unverified
Distributed Q-Learning with State Tracking for Multi-agent Networked Control	Dec 22, 2020	Q-LearningState Estimation	—Unverified
Stabilizing Q Learning Via Soft Mellowmax Operator	Dec 17, 2020	Multi-agent Reinforcement LearningQ-Learning	—Unverified
Model-free and Bayesian Ensembling Model-based Deep Reinforcement Learning for Particle Accelerator Control Demonstrated on the FERMI FEL	Dec 17, 2020	Deep Reinforcement Learningmodel	CodeCode Available
Sample-Efficient Reinforcement Learning via Counterfactual-Based Data Augmentation	Dec 16, 2020	counterfactualData Augmentation	—Unverified
Virtual Autonomous Driving with Reinforcement Learning	Dec 14, 2020	Autonomous DrivingQ-Learning	—Unverified
Deploying Reinforcement Learning in Water Transport	Dec 14, 2020	Q-Learningreinforcement-learning	—Unverified
Semi-Supervised Off Policy Reinforcement Learning	Dec 9, 2020	ImputationQ-Learning	—Unverified
Selective Pseudo-Labeling with Reinforcement Learning for Semi-Supervised Domain Adaptation	Dec 7, 2020	Domain AdaptationQ-Learning	—Unverified
Amortized Q-learning with Model-based Action Proposals for Autonomous Driving on Highways	Dec 6, 2020	Autonomous DrivingDecision Making	—Unverified
Self-correcting Q-Learning	Dec 2, 2020	Q-Learning	—Unverified
Hippocampal representations emerge when training recurrent neural networks on a memory dependent maze navigation task	Dec 2, 2020	HippocampusQ-Learning	—Unverified
A new convergent variant of Q-learning with linear function approximation	Dec 1, 2020	Q-LearningReinforcement Learning (RL)	—Unverified
Agnostic Q-learning with Function Approximation in Deterministic Systems: Near-Optimal Bounds on Approximation Error and Sample Complexity	Dec 1, 2020	Q-Learning	—Unverified
Robust Multi-Agent Reinforcement Learning with Model Uncertainty	Dec 1, 2020	modelMulti-agent Reinforcement Learning	—Unverified
Can Temporal-Diﬀerence and Q-Learning Learn Representation? A Mean-Field Theory	Dec 1, 2020	Deep Reinforcement LearningQ-Learning	—Unverified
A Unified Switching System Perspective and Convergence Analysis of Q-Learning Algorithms	Dec 1, 2020	Q-Learning	—Unverified
Deep reinforcement learning with a particle dynamics environment applied to emergency evacuation of a room with obstacles	Nov 30, 2020	Deep Reinforcement LearningQ-Learning	—Unverified
Real-time Active Vision for a Humanoid Soccer Robot Using Deep Reinforcement Learning	Nov 27, 2020	Deep Reinforcement LearningQ-Learning	—Unverified
Reinforcement Learning-based Joint Path and Energy Optimization of Cellular-Connected Unmanned Aerial Vehicles	Nov 27, 2020	Q-LearningReinforcement Learning (RL)	—Unverified
Diluted Near-Optimal Expert Demonstrations for Guiding Dialogue Stochastic Policy Optimisation	Nov 25, 2020	Imitation LearningQ-Learning	—Unverified
Learning Principle of Least Action with Reinforcement Learning	Nov 24, 2020	Q-Learningreinforcement-learning	CodeCode Available
Solving The Lunar Lander Problem under Uncertainty using Reinforcement Learning	Nov 24, 2020	NavigateQ-Learning	CodeCode Available
Multi-Agent Reinforcement Learning for Markov Routing Games: A New Modeling Paradigm For Dynamic Traffic Assignment	Nov 22, 2020	Autonomous VehiclesBilevel Optimization	—Unverified
Provable Multi-Objective Reinforcement Learning with Generative Models	Nov 19, 2020	Multi-Objective Reinforcement LearningQ-Learning	—Unverified
C-Learning: Learning to Achieve Goals via Recursive Classification	Nov 17, 2020	ClassificationDensity Estimation	—Unverified
Constrained Model-Free Reinforcement Learning for Process Optimization	Nov 16, 2020	modelModel Predictive Control	—Unverified
A deep Q-Learning based Path Planning and Navigation System for Firefighting Environments	Nov 12, 2020	Q-Learning	—Unverified
On Using Hamiltonian Monte Carlo Sampling for Reinforcement Learning Problems in High-dimension	Nov 11, 2020	Matrix CompletionQ-Learning	—Unverified
Multi-Agent Reinforcement Learning for Channel Assignment and Power Allocation in Platoon-Based C-V2X Systems	Nov 9, 2020	Autonomous VehiclesMulti-agent Reinforcement Learning	—Unverified
Reinforced Deep Markov Models With Applications in Automatic Trading	Nov 9, 2020	Q-Learning	—Unverified
Reinforcement Learning for Assignment problem	Nov 8, 2020	Q-Learningreinforcement-learning	—Unverified
A Hysteretic Q-learning Coordination Framework for Emerging Mobility Systems in Smart Cities	Nov 5, 2020	Q-Learningreinforcement-learning	—Unverified
Control with adaptive Q-learning	Nov 3, 2020	OpenAI GymQ-Learning	CodeCode Available
Deep Jump Learning for Off-Policy Evaluation in Continuous Treatment Settings	Oct 29, 2020	Change Point DetectionOff-policy evaluation	CodeCode Available
Finite-Time Convergence Rates of Decentralized Stochastic Approximation with Applications in Multi-Agent and Multi-Task Learning	Oct 28, 2020	Multi-Task LearningQ-Learning	—Unverified
DeepFoldit -- A Deep Reinforcement Learning Neural Network Folding Proteins	Oct 28, 2020	Deep Reinforcement LearningProtein Structure Prediction	—Unverified

Show:10 25 50

← PrevPage 25 of 39Next →

No leaderboard results yet.