Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 12251–12300 of 15113 papers

Title	Date	Tasks	Status
Search from History and Reason for Future: Two-stage Reasoning on Temporal Knowledge Graphs	Jun 1, 2021	Knowledge GraphsReinforcement Learning (RL)	—Unverified
Searching for High-Value Molecules Using Reinforcement Learning and Transformers	Oct 4, 2023	reinforcement-learningReinforcement Learning	—Unverified
Searching Learning Strategy with Reinforcement Learning for 3D Medical Image Segmentation	Jun 10, 2020	Data AugmentationImage Segmentation	—Unverified
Search on the Replay Buffer: Bridging Planning and Reinforcement Learning	Jun 12, 2019	reinforcement-learningReinforcement Learning	—Unverified
Second Thoughts are Best: Learning to Re-Align With Human Values from Text Edits	Jan 1, 2023	reinforcement-learningReinforcement Learning (RL)	—Unverified
SECRM-2D: RL-Based Efficient and Comfortable Route-Following Autonomous Driving with Analytic Safety Guarantees	Jul 23, 2024	Autonomous DrivingReinforcement Learning (RL)	—Unverified
Secure Computation Offloading in Blockchain based IoT Networks with Deep Reinforcement Learning	Aug 15, 2019	Deep Reinforcement LearningManagement	—Unverified
Security Analysis of Safe and Seldonian Reinforcement Learning Algorithms	Dec 1, 2020	reinforcement-learningReinforcement Learning	—Unverified
Security-Aware Virtual Network Embedding Algorithm based on Reinforcement Learning	Feb 3, 2022	Network Embeddingreinforcement-learning	—Unverified
SeedNet: Automatic Seed Generation With Deep Reinforcement Learning for Robust Interactive Segmentation	Jun 1, 2018	Deep Reinforcement LearningInteractive Segmentation	—Unverified
Seeing by haptic glance: reinforcement learning-based 3D object Recognition	Feb 15, 2021	3D Object RecognitionObject	—Unverified
Seeing-Eye Quadruped Navigation with Force Responsive Locomotion Control	Sep 8, 2023	Reinforcement Learning (RL)	—Unverified
Seeing is not Believing: Robust Reinforcement Learning against Spurious Correlation	Jul 15, 2023	reinforcement-learningReinforcement Learning	—Unverified
Seeking Visual Discomfort: Curiosity-driven Representations for Reinforcement Learning	Oct 2, 2021	Diversityreinforcement-learning	—Unverified
SeekNet: Improved Human Instance Segmentation and Tracking via Reinforcement Learning Based Optimized Robot Relocation	Nov 17, 2020	Human DetectionHuman Instance Segmentation	—Unverified
SEERL: Sample Efficient Ensemble Reinforcement Learning	Jan 15, 2020	continuous-controlContinuous Control	—Unverified
Segmenting Action-Value Functions Over Time-Scales in SARSA via TD(Δ)	Nov 22, 2024	Reinforcement Learning (RL)	—Unverified
Segregation Dynamics with Reinforcement Learning and Agent Based Modeling	Sep 18, 2019	reinforcement-learningReinforcement Learning	—Unverified
SEIHAI: A Sample-efficient Hierarchical AI for the MineRL Competition	Nov 17, 2021	Imitation Learningreinforcement-learning	—Unverified
Select before Act: Spatially Decoupled Action Repetition for Continuous Control	Feb 10, 2025	continuous-controlContinuous Control	—Unverified
Selecting Mechanical Parameters of a Monopode Jumping System with Reinforcement Learning	Dec 2, 2022	Navigatereinforcement-learning	—Unverified
Selecting Near-Optimal Approximate State Representations in Reinforcement Learning	May 12, 2014	reinforcement-learningReinforcement Learning	—Unverified
Selecting the State-Representation in Reinforcement Learning	Dec 1, 2011	reinforcement-learningReinforcement Learning	—Unverified
Selective Credit Assignment	Feb 20, 2022	Predictionreinforcement-learning	—Unverified
Selective Experience Sharing in Reinforcement Learning Enhances Interference Management	Jan 27, 2025	ManagementMulti-agent Reinforcement Learning	—Unverified
Selective Particle Attention: Visual Feature-Based Attention in Deep Reinforcement Learning	Aug 26, 2020	Deep Reinforcement LearningMultiple-choice	—Unverified
Selective Pseudo-Labeling with Reinforcement Learning for Semi-Supervised Domain Adaptation	Dec 7, 2020	Domain AdaptationQ-Learning	—Unverified
Selective Reviews of Bandit Problems in AI via a Statistical View	Dec 3, 2024	Decision MakingDecision Making Under Uncertainty	—Unverified
Selective Token Generation for Few-shot Language Modeling	Sep 29, 2021	Data-to-Text GenerationLanguage Modeling	—Unverified
Selective Transfer with Reinforced Transfer Network for Partial Domain Adaptation	May 26, 2019	Domain AdaptationPartial Domain Adaptation	—Unverified
Selective Uncertainty Propagation in Offline RL	Feb 1, 2023	Offline RLreinforcement-learning	—Unverified
Selector-Enhancer: Learning Dynamic Selection of Local and Non-local Attention Operation for Speech Enhancement	Dec 7, 2022	DenoisingReinforcement Learning (RL)	—Unverified
Self-Adapting Goals Allow Transfer of Predictive Models to New Tasks	Apr 4, 2019	Model-based Reinforcement Learningreinforcement-learning	—Unverified
Self-Awareness Safety of Deep Reinforcement Learning in Road Traffic Junction Driving	Jan 20, 2022	Autonomous DrivingDeep Reinforcement Learning	—Unverified
Self-Confirming Transformer for Belief-Conditioned Adaptation in Offline Multi-Agent Reinforcement Learning	Oct 6, 2023	Multi-agent Reinforcement LearningOffline RL	—Unverified
Self-Consistent Models and Values	Oct 25, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Self-Consistent Trajectory Autoencoder: Hierarchical Reinforcement Learning with Trajectory Embeddings	Jun 7, 2018	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified
Self-Critical Alternate Learning based Semantic Broadcast Communication	Dec 3, 2023	Reinforcement Learning (RL)Semantic Communication	—Unverified
Self-critical Sequence Training for Automatic Speech Recognition	Apr 13, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Self-Driving Car Racing: Application of Deep Reinforcement Learning	Oct 30, 2024	AI AgentAutonomous Driving	—Unverified
Self-driving scale car trained by Deep reinforcement learning	Sep 8, 2019	Autonomous DrivingDeep Reinforcement Learning	—Unverified
Self-Driving Telescopes: Autonomous Scheduling of Astronomical Observation Campaigns with Offline Reinforcement Learning	Nov 29, 2023	AstronomyOffline RL	—Unverified
Self-evolving Autoencoder Embedded Q-Network	Feb 18, 2024	Decision MakingReinforcement Learning (RL)	—Unverified
Self-Evolving Curriculum for LLM Reasoning	May 20, 2025	Code GenerationPolicy Gradient Methods	—Unverified
Self-Imitation Advantage Learning	Dec 22, 2020	Atari GamesImitation Learning	—Unverified
Self-Imitation Learning by Planning	Mar 25, 2021	Imitation LearningMotion Planning	—Unverified
Self-Imitation Learning from Demonstrations	Mar 21, 2022	Imitation LearningReinforcement Learning (RL)	—Unverified
Self-Improving Robots: End-to-End Autonomous Visuomotor Reinforcement Learning	Mar 2, 2023	reinforcement-learningReinforcement Learning	—Unverified
Self-Inspection Method of Unmanned Aerial Vehicles in Power Plants Using Deep Q-Network Reinforcement Learning	Mar 16, 2023	Autonomous NavigationQ-Learning	—Unverified
Self-Learned Formula Synthesis in Set Theory	Dec 3, 2019	reinforcement-learningReinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 246 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified