Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9901–9950 of 15113 papers

Title	Date	Tasks	Status	Hype
Predictive Synthesis of Quantum Materials by Probabilistic Reinforcement Learning	Sep 14, 2020	Design Synthesisreinforcement-learning	—Unverified	0
Multi-Agent Reinforcement Learning in Cournot Games	Sep 14, 2020	continuous-controlContinuous Control	—Unverified	0
Variance-Reduced Off-Policy Memory-Efficient Policy Search	Sep 14, 2020	Reinforcement Learning (RL)Stochastic Optimization	—Unverified	0
VacSIM: Learning Effective Strategies for COVID-19 Vaccine Distribution using Reinforcement Learning	Sep 14, 2020	Deep Reinforcement LearningMulti-Armed Bandits	CodeCode Available	0
Efficient Competitive Self-Play Policy Optimization	Sep 13, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Guided Policy Search Based Control of a High Dimensional Advanced Manufacturing Process	Sep 12, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Extended Radial Basis Function Controller for Reinforcement Learning	Sep 12, 2020	OpenAI Gymreinforcement-learning	—Unverified	0
Deep Learning Interference Cancellation in Wireless Networks	Sep 11, 2020	Deep LearningReinforcement Learning (RL)	—Unverified	0
Reinforcement Learning for Optimal Primary Frequency Control: A Lyapunov Approach	Sep 11, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1
Semantic-preserving Reinforcement Learning Attack Against Graph Neural Networks for Malware Detection	Sep 11, 2020	Malware Detectionreinforcement-learning	CodeCode Available	1
Physically Embedded Planning Problems: New Challenges for Reinforcement Learning	Sep 11, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Embodied Visual Navigation with Automatic Curriculum Learning in Real Environments	Sep 11, 2020	Deep Reinforcement LearningNavigate	—Unverified	0
RLCFR: Minimize Counterfactual Regret by Deep Reinforcement Learning	Sep 10, 2020	counterfactualDecision Making	—Unverified	0
TripleTree: A Versatile Interpretable Representation of Black Box Agents and their Environments	Sep 10, 2020	Deep Reinforcement LearningExplainable artificial intelligence	CodeCode Available	0
A framework for reinforcement learning with autocorrelated actions	Sep 10, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	0
COVID-19 Pandemic Cyclic Lockdown Optimization Using Reinforcement Learning	Sep 10, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Importance Weighted Policy Learning and Adaptation	Sep 10, 2020	Meta Reinforcement Learningreinforcement-learning	—Unverified	0
Deep Reinforcement Learning for Option Replication and Hedging	Sep 9, 2020	Deep Reinforcement LearningQ-Learning	—Unverified	0
AoI Minimization in Status Update Control with Energy Harvesting Sensors	Sep 9, 2020	Q-LearningReinforcement Learning (RL)	—Unverified	0
DyNODE: Neural Ordinary Differential Equations for Dynamics Modeling in Continuous Control	Sep 9, 2020	continuous-controlContinuous Control	CodeCode Available	1
Solving Challenging Dexterous Manipulation Tasks With Trajectory Optimisation and Reinforcement Learning	Sep 9, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1
Multi-Objective Model-based Reinforcement Learning for Infectious Disease Control	Sep 9, 2020	Decision MakingModel-based Reinforcement Learning	—Unverified	0
QR-MIX: Distributional Value Function Factorisation for Cooperative Multi-Agent Reinforcement Learning	Sep 9, 2020	Multi-agent Reinforcement Learningquantile regression	—Unverified	0
Phasic Policy Gradient	Sep 9, 2020	Reinforcement Learning (RL)	CodeCode Available	1
Reinforcement Learning in Non-Stationary Discrete-Time Linear-Quadratic Mean-Field Games	Sep 9, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Bayesian Inverse Reinforcement Learning for Collective Animal Movement	Sep 8, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	0
Induction and Exploitation of Subgoal Automata for Reinforcement Learning	Sep 8, 2020	Inductive logic programmingreinforcement-learning	—Unverified	0
Deep Active Inference for Partially Observable MDPs	Sep 8, 2020	Deep Reinforcement LearningQ-Learning	CodeCode Available	1
Evolutionary Reinforcement Learning via Cooperative Coevolutionary Negatively Correlated Search	Sep 8, 2020	Atari GamesEvolutionary Algorithms	—Unverified	0
Energy Expenditure Estimation Through Daily Activity Recognition Using a Smart-phone	Sep 8, 2020	Activity RecognitionReinforcement Learning (RL)	—Unverified	0
Graph neural networks-based Scheduler for Production planning problems using Reinforcement Learning	Sep 8, 2020	Distributed OptimizationGraph Neural Network	—Unverified	0
Detecting and adapting to crisis pattern with context based Deep Reinforcement Learning	Sep 7, 2020	Autonomous DrivingDeep Reinforcement Learning	—Unverified	0
Deep Learning and Reinforcement Learning for Autonomous Unmanned Aerial Systems: Roadmap for Theory to Deployment	Sep 7, 2020	BIG-bench Machine Learningreinforcement-learning	—Unverified	0
Driving Tasks Transfer in Deep Reinforcement Learning for Decision-making of Autonomous Vehicles	Sep 7, 2020	Autonomous VehiclesDecision Making	—Unverified	0
Active Learning of Causal Structures with Deep Reinforcement Learning	Sep 7, 2020	Active LearningDeep Reinforcement Learning	—Unverified	0
Robust Spoken Language Understanding with RL-based Value Error Recovery	Sep 7, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
PAC Reinforcement Learning Algorithm for General-Sum Markov Games	Sep 5, 2020	Multi-agent Reinforcement LearningQ-Learning	—Unverified	0
A Hybrid PAC Reinforcement Learning Algorithm	Sep 5, 2020	Q-Learningreinforcement-learning	—Unverified	0
Visualizing the Loss Landscape of Actor Critic Methods with Applications in Inventory Optimization	Sep 4, 2020	continuous-controlContinuous Control	—Unverified	0
ConfuciuX: Autonomous Hardware Resource Assignment for DNN Accelerators using Reinforcement Learning	Sep 4, 2020	Bayesian Optimizationreinforcement-learning	CodeCode Available	1
DRLE: Decentralized Reinforcement Learning at the Edge for Traffic Light Control in the IoV	Sep 3, 2020	Edge-computingManagement	CodeCode Available	2
Optimality-based Analysis of XCSF Compaction in Discrete Reinforcement Learning	Sep 3, 2020	OpenAI Gymreinforcement-learning	CodeCode Available	0
Sparse Meta Networks for Sequential Adaptation and its Application to Adaptive Language Modelling	Sep 3, 2020	Incremental LearningInductive Bias	—Unverified	0
Sample-Efficient Automated Deep Reinforcement Learning	Sep 3, 2020	Deep Reinforcement LearningHyperparameter Optimization	CodeCode Available	1
TAP-Net: Transport-and-Pack using Reinforcement Learning	Sep 3, 2020	Decoderreinforcement-learning	—Unverified	0
Adaptive Reinforcement Learning Model for Simulation of Urban Mobility during Crises	Sep 2, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
A reinforcement learning approach to hybrid control design	Sep 2, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Vulnerability-Aware Poisoning Mechanism for Online RL with Unknown Dynamics	Sep 2, 2020	Reinforcement Learning (RL)	—Unverified	0
PlotThread: Creating Expressive Storyline Visualizations using Reinforcement Learning	Sep 1, 2020	AI AgentEfficient Exploration	—Unverified	0
Solving the single-track train scheduling problem via Deep Reinforcement Learning	Sep 1, 2020	Deep Reinforcement LearningQ-Learning	—Unverified	0

Show:10 25 50

← PrevPage 199 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified