Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9901–9925 of 15113 papers

Title	Date	Tasks	Status	Hype
Predictive Synthesis of Quantum Materials by Probabilistic Reinforcement Learning	Sep 14, 2020	Design Synthesisreinforcement-learning	—Unverified	0
Multi-Agent Reinforcement Learning in Cournot Games	Sep 14, 2020	continuous-controlContinuous Control	—Unverified	0
Variance-Reduced Off-Policy Memory-Efficient Policy Search	Sep 14, 2020	Reinforcement Learning (RL)Stochastic Optimization	—Unverified	0
VacSIM: Learning Effective Strategies for COVID-19 Vaccine Distribution using Reinforcement Learning	Sep 14, 2020	Deep Reinforcement LearningMulti-Armed Bandits	CodeCode Available	0
Efficient Competitive Self-Play Policy Optimization	Sep 13, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Guided Policy Search Based Control of a High Dimensional Advanced Manufacturing Process	Sep 12, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Extended Radial Basis Function Controller for Reinforcement Learning	Sep 12, 2020	OpenAI Gymreinforcement-learning	—Unverified	0
Deep Learning Interference Cancellation in Wireless Networks	Sep 11, 2020	Deep LearningReinforcement Learning (RL)	—Unverified	0
Reinforcement Learning for Optimal Primary Frequency Control: A Lyapunov Approach	Sep 11, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1
Semantic-preserving Reinforcement Learning Attack Against Graph Neural Networks for Malware Detection	Sep 11, 2020	Malware Detectionreinforcement-learning	CodeCode Available	1
Physically Embedded Planning Problems: New Challenges for Reinforcement Learning	Sep 11, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Embodied Visual Navigation with Automatic Curriculum Learning in Real Environments	Sep 11, 2020	Deep Reinforcement LearningNavigate	—Unverified	0
RLCFR: Minimize Counterfactual Regret by Deep Reinforcement Learning	Sep 10, 2020	counterfactualDecision Making	—Unverified	0
TripleTree: A Versatile Interpretable Representation of Black Box Agents and their Environments	Sep 10, 2020	Deep Reinforcement LearningExplainable artificial intelligence	CodeCode Available	0
A framework for reinforcement learning with autocorrelated actions	Sep 10, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	0
COVID-19 Pandemic Cyclic Lockdown Optimization Using Reinforcement Learning	Sep 10, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Importance Weighted Policy Learning and Adaptation	Sep 10, 2020	Meta Reinforcement Learningreinforcement-learning	—Unverified	0
Deep Reinforcement Learning for Option Replication and Hedging	Sep 9, 2020	Deep Reinforcement LearningQ-Learning	—Unverified	0
AoI Minimization in Status Update Control with Energy Harvesting Sensors	Sep 9, 2020	Q-LearningReinforcement Learning (RL)	—Unverified	0
DyNODE: Neural Ordinary Differential Equations for Dynamics Modeling in Continuous Control	Sep 9, 2020	continuous-controlContinuous Control	CodeCode Available	1
Solving Challenging Dexterous Manipulation Tasks With Trajectory Optimisation and Reinforcement Learning	Sep 9, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1
Multi-Objective Model-based Reinforcement Learning for Infectious Disease Control	Sep 9, 2020	Decision MakingModel-based Reinforcement Learning	—Unverified	0
QR-MIX: Distributional Value Function Factorisation for Cooperative Multi-Agent Reinforcement Learning	Sep 9, 2020	Multi-agent Reinforcement Learningquantile regression	—Unverified	0
Phasic Policy Gradient	Sep 9, 2020	Reinforcement Learning (RL)	CodeCode Available	1
Reinforcement Learning in Non-Stationary Discrete-Time Linear-Quadratic Mean-Field Games	Sep 9, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0

Show:10 25 50

← PrevPage 397 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified