Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9876–9900 of 15113 papers

Title	Date	Tasks	Status	Hype
GRAC: Self-Guided and Self-Regularized Actor-Critic	Sep 18, 2020	Decision MakingDeep Reinforcement Learning	CodeCode Available	0
HTMRL: Biologically Plausible Reinforcement Learning with Hierarchical Temporal Memory	Sep 18, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	0
A Contraction Approach to Model-based Reinforcement Learning	Sep 18, 2020	Imitation Learningmodel	—Unverified	0
Competitiveness of MAP-Elites against Proximal Policy Optimization on locomotion tasks in deterministic simulations	Sep 17, 2020	Evolutionary AlgorithmsReinforcement Learning (RL)	CodeCode Available	1
GeneraLight: Improving Environment Generalization of Traffic Signal Control via Meta Reinforcement Learning	Sep 17, 2020	ClusteringGenerative Adversarial Network	—Unverified	0
Finding Effective Security Strategies through Reinforcement Learning and Self-Play	Sep 17, 2020	Common Sense Reasoningreinforcement-learning	CodeCode Available	1
Knowledge-Assisted Deep Reinforcement Learning in 5G Scheduler Design: From Theoretical Framework to Implementation	Sep 17, 2020	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
SREC: Proactive Self-Remedy of Energy-Constrained UAV-Based Networks via Deep Reinforcement Learning	Sep 17, 2020	Deep Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	1
Reward Maximisation through Discrete Active Inference	Sep 17, 2020	Decision MakingModel-based Reinforcement Learning	—Unverified	0
Reconstructing Actions To Explain Deep Reinforcement Learning	Sep 17, 2020	Atari GamesDeep Reinforcement Learning	—Unverified	0
Time your hedge with Deep Reinforcement Learning	Sep 16, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Theory of Mind with Guilt Aversion Facilitates Cooperative Reinforcement Learning	Sep 16, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Transfer Learning in Deep Reinforcement Learning: A Survey	Sep 16, 2020	Decision MakingDeep Reinforcement Learning	—Unverified	0
Meta-AAD: Active Anomaly Detection with Deep Reinforcement Learning	Sep 16, 2020	Anomaly DetectionDeep Reinforcement Learning	CodeCode Available	1
Text Generation by Learning from Demonstrations	Sep 16, 2020	Machine TranslationQuestion Generation	CodeCode Available	1
DRL-FAS: A Novel Framework Based on Deep Reinforcement Learning for Face Anti-Spoofing	Sep 16, 2020	Deep Reinforcement LearningFace Anti-Spoofing	—Unverified	0
Reinforcement Learning for Strategic Recommendations	Sep 15, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Soft policy optimization using dual-track advantage estimator	Sep 15, 2020	MuJoCoReinforcement Learning (RL)	—Unverified	0
Toward Deep Supervised Anomaly Detection: Reinforcement Learning from Partially Labeled Anomaly Data	Sep 15, 2020	Anomaly DetectionDeep Reinforcement Learning	CodeCode Available	1
Autonomous Learning of Features for Control: Experiments with Embodied and Situated Agents	Sep 15, 2020	continuous-controlContinuous Control	—Unverified	0
Decoding Polar Codes with Reinforcement Learning	Sep 15, 2020	Decoderreinforcement-learning	—Unverified	0
Decoupling Representation Learning from Reinforcement Learning	Sep 14, 2020	Data AugmentationDeep Reinforcement Learning	CodeCode Available	2
Deep Actor-Critic Learning for Distributed Power Control in Wireless Mobile Networks	Sep 14, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Efficient Transformers: A Survey	Sep 14, 2020	Navigatereinforcement-learning	—Unverified	0
Reinforcement Learning for Dynamic Resource Optimization in 5G Radio Access Network Slicing	Sep 14, 2020	Q-Learningreinforcement-learning	—Unverified	0

Show:10 25 50

← PrevPage 396 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified