Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4951–5000 of 15113 papers

Title	Date	Tasks	Status	Hype
Intrinsic fluctuations of reinforcement learning promote cooperation	Sep 1, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	0
A Technique to Create Weaker Abstract Board Game Agents via Reinforcement Learning	Sep 1, 2022	Board GamesQ-Learning	—Unverified	0
Dynamics-Adaptive Continual Reinforcement Learning via Progressive Contextualization	Sep 1, 2022	Bayesian InferenceKnowledge Distillation	—Unverified	0
Deep reinforcement learning for quantum multiparameter estimation	Sep 1, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Transmit Power Control for Indoor Small Cells: A Method Based on Federated Reinforcement Learning	Aug 31, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Rethinking Conversational Recommendations: Is Decision Tree All You Need?	Aug 31, 2022	AllDeep Reinforcement Learning	CodeCode Available	1
A stabilizing reinforcement learning approach for sampled systems with partially unknown models	Aug 31, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Deep Anomaly Detection and Search via Reinforcement Learning	Aug 31, 2022	Anomaly DetectionEnsemble Learning	—Unverified	0
Cell-Free Latent Go-Explore	Aug 31, 2022	Montezuma's RevengeReinforcement Learning (RL)	CodeCode Available	1
Style-Agnostic Reinforcement Learning	Aug 31, 2022	Data Augmentationreinforcement-learning	CodeCode Available	1
Model-Based Reinforcement Learning with SINDy	Aug 30, 2022	modelModel-based Reinforcement Learning	—Unverified	0
A further exploration of deep Multi-Agent Reinforcement Learning with Hybrid Action Space	Aug 30, 2022	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified	0
An Analysis of Model-Based Reinforcement Learning From Abstracted Observations	Aug 30, 2022	Model-based Reinforcement Learningreinforcement-learning	—Unverified	0
Beyond Supervised Continual Learning: a Review	Aug 30, 2022	Continual LearningIncremental Learning	—Unverified	0
Distributed Ensembles of Reinforcement Learning Agents for Electricity Control	Aug 30, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Effective Multi-User Delay-Constrained Scheduling with Deep Recurrent Reinforcement Learning	Aug 30, 2022	Cloud ComputingDeep Reinforcement Learning	CodeCode Available	1
Evolutionary Deep Reinforcement Learning for Dynamic Slice Management in O-RAN	Aug 30, 2022	Deep Reinforcement LearningManagement	—Unverified	0
Digital Twin Assisted Risk-Aware Sleep Mode Management Using Deep Q-Networks	Aug 30, 2022	Decision MakingDeep Reinforcement Learning	—Unverified	0
Reinforcement Learning for Hardware Security: Opportunities, Developments, and Challenges	Aug 29, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Understanding the Limits of Poisoning Attacks in Episodic Reinforcement Learning	Aug 29, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Categorical semantics of compositional reinforcement learning	Aug 29, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Goal-Conditioned Q-Learning as Knowledge Distillation	Aug 28, 2022	Knowledge DistillationQ-Learning	CodeCode Available	0
Normality-Guided Distributional Reinforcement Learning for Continuous Control	Aug 28, 2022	continuous-controlContinuous Control	—Unverified	0
Unsupervised Representation Learning in Deep Reinforcement Learning: A Review	Aug 27, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
SupervisorBot: NLP-Annotated Real-Time Recommendations of Psychotherapy Treatment Strategies with Deep Reinforcement Learning	Aug 27, 2022	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
RL-DistPrivacy: Privacy-Aware Distributed Deep Inference for low latency IoT systems	Aug 27, 2022	Privacy PreservingReinforcement Learning (RL)	—Unverified	0
CH-MARL: A Multimodal Benchmark for Cooperative, Heterogeneous Multi-Agent Reinforcement Learning	Aug 26, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
DETERRENT: Detecting Trojans using Reinforcement Learning	Aug 26, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
ATTRITION: Attacking Static Hardware Trojan Detection Techniques Using Reinforcement Learning	Aug 26, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
An approach to implement Reinforcement Learning for Heterogeneous Vehicular Networks	Aug 26, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Exploiting Deep Reinforcement Learning for Edge Caching in Cell-Free Massive MIMO Systems	Aug 26, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Reinforcement Learning based Multi-connectivity Resource Allocation in Factory Automation Systems	Aug 26, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Socially Fair Reinforcement Learning	Aug 26, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Visual processing in context of reinforcement learning	Aug 26, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Symbolic Explanation of Affinity-Based Reinforcement Learning Agents with Markov Models	Aug 26, 2022	Managementreinforcement-learning	—Unverified	0
Play with Emotion: Affect-Driven Reinforcement Learning	Aug 26, 2022	Decision Makingreinforcement-learning	—Unverified	0
Towards Automated Imbalanced Learning with Deep Hierarchical Reinforcement Learning	Aug 26, 2022	Hierarchical Reinforcement Learningreinforcement-learning	CodeCode Available	1
Importance Prioritized Policy Distillation	Aug 25, 2022	Atari GamesDecision Making	CodeCode Available	0
Light-weight probing of unsupervised representations for Reinforcement Learning	Aug 25, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1
A Comparison of Reinforcement Learning Frameworks for Software Testing Tasks	Aug 25, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Autonomous Unmanned Aerial Vehicle Navigation using Reinforcement Learning: A Systematic Review	Aug 25, 2022	Navigatereinforcement-learning	—Unverified	0
Learning Task Automata for Reinforcement Learning using Hidden Markov Models	Aug 25, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Turning Mathematics Problems into Games: Reinforcement Learning and Gröbner bases together solve Integer Feasibility Problems	Aug 25, 2022	Reinforcement Learning (RL)	—Unverified	0
UAS Navigation in the Real World Using Visual Observation	Aug 25, 2022	Landmark RecognitionReinforcement Learning (RL)	—Unverified	0
Variance Reduction based Experience Replay for Policy Optimization	Aug 25, 2022	Reinforcement Learning (RL)	CodeCode Available	0
Oracle-free Reinforcement Learning in Mean-Field Games along a Single Sample Path	Aug 24, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Augmenting Reinforcement Learning with Transformer-based Scene Representation Learning for Decision-making of Autonomous Driving	Aug 24, 2022	Autonomous DrivingDecision Making	CodeCode Available	1
Hierarchical Reinforcement Learning Based Video Semantic Coding for Segmentation	Aug 24, 2022	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified	0
Dynamic Memory-based Curiosity: A Bootstrap Approach for Exploration	Aug 24, 2022	Reinforcement Learning (RL)	—Unverified	0
A model-based approach to meta-Reinforcement Learning: Transformers and tree search	Aug 24, 2022	Meta-LearningMeta Reinforcement Learning	—Unverified	0

Show:10 25 50

← PrevPage 100 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified