Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 12301–12350 of 15113 papers

Title	Date	Tasks	Status
Self-Learning Tuning for Post-Silicon Validation	Nov 17, 2021	reinforcement-learningReinforcement Learning	—Unverified
Self-optimizing adaptive optics control with Reinforcement Learning for high-contrast imaging	Aug 24, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Self-organization in a distributed coordination game through heuristic rules	Jul 31, 2016	AttributeReinforcement Learning (RL)	—Unverified
Self-Organizing Maps as a Storage and Transfer Mechanism in Reinforcement Learning	Jul 19, 2018	reinforcement-learningReinforcement Learning	—Unverified
Self-Organizing Maps for Storage and Transfer of Knowledge in Reinforcement Learning	Nov 18, 2018	Continual Learningreinforcement-learning	—Unverified
Self-Play Fine-Tuning of Diffusion Models for Text-to-Image Generation	Feb 15, 2024	Image GenerationReinforcement Learning (RL)	—Unverified
Self-Play PSRO: Toward Optimal Populations in Two-Player Zero-Sum Games	Jul 13, 2022	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Self-Play with Adversarial Critic: Provable and Scalable Offline Alignment for Language Models	Jun 6, 2024	Offline RLreinforcement-learning	—Unverified
Self-Supervised Continuous Control without Policy Gradient	Jan 1, 2021	continuous-controlContinuous Control	—Unverified
Self-Supervised Exploration via Temporal Inconsistency in Reinforcement Learning	Aug 24, 2022	reinforcement-learningReinforcement Learning	—Unverified
Self-supervised Learning of Distance Functions for Goal-Conditioned Reinforcement Learning	Jul 5, 2019	reinforcement-learningReinforcement Learning	—Unverified
Relevance-Guided Modeling of Object Dynamics for Reinforcement Learning	Mar 3, 2020	Atari GamesDeep Reinforcement Learning	—Unverified
Self-Supervised Reinforcement Learning for Recommender Systems	Jun 10, 2020	Q-LearningRecommendation Systems	—Unverified
Self-supervised reinforcement learning for speaker localisation with the iCub humanoid robot	Nov 12, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Self-supervised Reinforcement Learning with Independently Controllable Subgoals	Sep 9, 2021	reinforcement-learningReinforcement Learning	—Unverified
Self-supervised Sequential Information Bottleneck for Robust Exploration in Deep Reinforcement Learning	Sep 12, 2022	Deep Reinforcement LearningEfficient Exploration	—Unverified
Self-Supervised Sim-to-Real Adaptation for Visual Robotic Manipulation	Oct 21, 2019	Deep Reinforcement LearningDomain Adaptation	—Unverified
Self-Supervised Structured Representations for Deep Reinforcement Learning	Sep 29, 2021	Atari GamesDeep Reinforcement Learning	—Unverified
Self-timed Reinforcement Learning using Tsetlin Machine	Sep 2, 2021	reinforcement-learningReinforcement Learning	—Unverified
Self Training Autonomous Driving Agent	Apr 26, 2019	Autonomous Drivingreinforcement-learning	—Unverified
A Self-Tuning Actor-Critic Algorithm	Feb 28, 2020	Atari Gamesreinforcement-learning	—Unverified
Self-Tuning Sectorization: Deep Reinforcement Learning Meets Broadcast Beam Optimization	Jun 14, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Semantic-Aware Collaborative Deep Reinforcement Learning Over Wireless Cellular Networks	Nov 23, 2021	Decision MakingDeep Reinforcement Learning	—Unverified
Semantic-Aware Remote Estimation of Multiple Markov Sources Under Constraints	Mar 25, 2024	Q-LearningReinforcement Learning (RL)	—Unverified
Semantic Exploration from Language Abstractions and Pretrained Representations	Apr 8, 2022	Image CaptioningReinforcement Learning (RL)	—Unverified
Semantic Guidance of Dialogue Generation with Reinforcement Learning	Jul 1, 2020	DecoderDialogue Generation	—Unverified
Semantic Tracklets: An Object-Centric Representation for Visual Multi-Agent Reinforcement Learning	Aug 6, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Semi-analytical Industrial Cooling System Model for Reinforcement Learning	Jul 26, 2022	reinforcement-learningReinforcement Learning	—Unverified
Taming Multi-Agent Reinforcement Learning with Estimator Variance Reduction	Sep 2, 2022	MuJoCoMulti-agent Reinforcement Learning	—Unverified
Semi-Data-Aided Channel Estimation for MIMO Systems via Reinforcement Learning	Apr 3, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Semi-On-Policy Training for Sample Efficient Multi-Agent Policy Gradients	Apr 27, 2021	Multi-agent Reinforcement LearningPolicy Gradient Methods	—Unverified
Semi-pessimistic Reinforcement Learning	May 25, 2025	reinforcement-learningReinforcement Learning	—Unverified
Semi-supervised Offline Reinforcement Learning with Pre-trained Decision Transformers	Sep 29, 2021	D4RLOffline RL	—Unverified
Semi-Supervised Off Policy Reinforcement Learning	Dec 9, 2020	ImputationQ-Learning	—Unverified
Semi-Supervised QA with Generative Domain-Adaptive Nets	Feb 7, 2017	Domain AdaptationQuestion Answering	—Unverified
Semi-supervised reward learning for offline reinforcement learning	Dec 12, 2020	Behavioural cloningreinforcement-learning	—Unverified
SeMOPO: Learning High-quality Model and Policy from Low-quality Offline Visual Datasets	Jun 13, 2024	D4RLOffline RL	—Unverified
Sensor Control for Information Gain in Dynamic, Sparse and Partially Observed Environments	Nov 3, 2022	Reinforcement Learning (RL)	—Unverified
SensorDrop: A Reinforcement Learning Framework for Communication Overhead Reduction on the Edge	Oct 3, 2019	reinforcement-learningReinforcement Learning	—Unverified
Sensor Fusion for Robot Control through Deep Reinforcement Learning	Mar 13, 2017	Deep Reinforcement Learningreinforcement-learning	—Unverified
Sentiment Adaptive End-to-End Dialog Systems	Apr 28, 2018	reinforcement-learningReinforcement Learning	—Unverified
Sentiment Analysis for Reinforcement Learning	Oct 5, 2020	Dialogue Generationreinforcement-learning	—Unverified
Sentiment and Knowledge Based Algorithmic Trading with Deep Reinforcement Learning	Jan 26, 2020	Algorithmic TradingDeep Reinforcement Learning	—Unverified
SENTINEL: Taming Uncertainty with Ensemble-based Distributional Reinforcement Learning	Feb 22, 2021	Decision MakingDistributional Reinforcement Learning	—Unverified
Separated Proportional-Integral Lagrangian for Chance Constrained Reinforcement Learning	Feb 17, 2021	Autonomous Drivingreinforcement-learning	—Unverified
Separation of Concerns in Reinforcement Learning	Dec 15, 2016	reinforcement-learningReinforcement Learning	—Unverified
Sequence Generation with Guider Network	Nov 2, 2018	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Sequence-level Intrinsic Exploration Model for Partially Observable Domains	Sep 25, 2019	Predictionreinforcement-learning	—Unverified
Sequence-to-Sequence ASR Optimization via Reinforcement Learning	Oct 30, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Sequence Tutor: Conservative Fine-Tuning of Sequence Generation Models with KL-control	Nov 9, 2016	DiversityReinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 247 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified