Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10401–10425 of 15113 papers

Title	Date	Tasks	Status
Decoding Polar Codes with Reinforcement Learning	Sep 15, 2020	Decoderreinforcement-learning	—Unverified
Autonomous Learning of Features for Control: Experiments with Embodied and Situated Agents	Sep 15, 2020	continuous-controlContinuous Control	—Unverified
Efficient Transformers: A Survey	Sep 14, 2020	Navigatereinforcement-learning	—Unverified
VacSIM: Learning Effective Strategies for COVID-19 Vaccine Distribution using Reinforcement Learning	Sep 14, 2020	Deep Reinforcement LearningMulti-Armed Bandits	CodeCode Available
Variance-Reduced Off-Policy Memory-Efficient Policy Search	Sep 14, 2020	Reinforcement Learning (RL)Stochastic Optimization	—Unverified
Reinforcement Learning for Dynamic Resource Optimization in 5G Radio Access Network Slicing	Sep 14, 2020	Q-Learningreinforcement-learning	—Unverified
Multi-Agent Reinforcement Learning in Cournot Games	Sep 14, 2020	continuous-controlContinuous Control	—Unverified
Predictive Synthesis of Quantum Materials by Probabilistic Reinforcement Learning	Sep 14, 2020	Design Synthesisreinforcement-learning	—Unverified
Efficient Competitive Self-Play Policy Optimization	Sep 13, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Extended Radial Basis Function Controller for Reinforcement Learning	Sep 12, 2020	OpenAI Gymreinforcement-learning	—Unverified
Guided Policy Search Based Control of a High Dimensional Advanced Manufacturing Process	Sep 12, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Deep Learning Interference Cancellation in Wireless Networks	Sep 11, 2020	Deep LearningReinforcement Learning (RL)	—Unverified
Embodied Visual Navigation with Automatic Curriculum Learning in Real Environments	Sep 11, 2020	Deep Reinforcement LearningNavigate	—Unverified
Physically Embedded Planning Problems: New Challenges for Reinforcement Learning	Sep 11, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
TripleTree: A Versatile Interpretable Representation of Black Box Agents and their Environments	Sep 10, 2020	Deep Reinforcement LearningExplainable artificial intelligence	CodeCode Available
RLCFR: Minimize Counterfactual Regret by Deep Reinforcement Learning	Sep 10, 2020	counterfactualDecision Making	—Unverified
COVID-19 Pandemic Cyclic Lockdown Optimization Using Reinforcement Learning	Sep 10, 2020	reinforcement-learningReinforcement Learning	—Unverified
Importance Weighted Policy Learning and Adaptation	Sep 10, 2020	Meta Reinforcement Learningreinforcement-learning	—Unverified
A framework for reinforcement learning with autocorrelated actions	Sep 10, 2020	reinforcement-learningReinforcement Learning	CodeCode Available
AoI Minimization in Status Update Control with Energy Harvesting Sensors	Sep 9, 2020	Q-LearningReinforcement Learning (RL)	—Unverified
Deep Reinforcement Learning for Option Replication and Hedging	Sep 9, 2020	Deep Reinforcement LearningQ-Learning	—Unverified
Multi-Objective Model-based Reinforcement Learning for Infectious Disease Control	Sep 9, 2020	Decision MakingModel-based Reinforcement Learning	—Unverified
QR-MIX: Distributional Value Function Factorisation for Cooperative Multi-Agent Reinforcement Learning	Sep 9, 2020	Multi-agent Reinforcement Learningquantile regression	—Unverified
Reinforcement Learning in Non-Stationary Discrete-Time Linear-Quadratic Mean-Field Games	Sep 9, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Graph neural networks-based Scheduler for Production planning problems using Reinforcement Learning	Sep 8, 2020	Distributed OptimizationGraph Neural Network	—Unverified

Show:10 25 50

← PrevPage 417 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified