Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 12151–12200 of 15113 papers

Title	Date	Tasks	Status
Sample-Efficient Reinforcement Learning of Koopman eNMPC	Mar 24, 2025	reinforcement-learningReinforcement Learning	—Unverified
Sample-efficient reinforcement learning using deep Gaussian processes	Nov 2, 2020	continuous-controlContinuous Control	—Unverified
Sample Efficient Reinforcement Learning via Low-Rank Matrix Estimation	Jun 11, 2020	Learning Theoryreinforcement-learning	—Unverified
Sample-Efficient Reinforcement Learning via Counterfactual-Based Data Augmentation	Dec 16, 2020	counterfactualData Augmentation	—Unverified
Sample-Efficient Reinforcement Learning with Stochastic Ensemble Value Expansion	Jul 4, 2018	continuous-controlContinuous Control	—Unverified
Sample Efficient Reinforcement Learning with REINFORCE	Oct 22, 2020	Policy Gradient Methodsreinforcement-learning	—Unverified
Sample-Efficient Reinforcement Learning with loglog(T) Switching Cost	Feb 13, 2022	reinforcement-learningReinforcement Learning	—Unverified
Sample-Efficient Robust Multi-Agent Reinforcement Learning in the Face of Environmental Uncertainty	Apr 29, 2024	Multi-agent Reinforcement LearningReinforcement Learning (RL)	—Unverified
Sample-efficient Safe Learning for Online Nonlinear Control with Control Barrier Functions	Jul 29, 2022	Decision MakingReinforcement Learning (RL)	—Unverified
Sample Efficient Social Navigation Using Inverse Reinforcement Learning	Jun 18, 2021	reinforcement-learningReinforcement Learning	—Unverified
Sampling from Energy-based Policies using Diffusion	Oct 2, 2024	continuous-controlContinuous Control	—Unverified
Sampling Strategies for GAN Synthetic Data	Sep 10, 2019	AttributeDiversity	—Unverified
Sampling Through the Lens of Sequential Decision Making	Aug 17, 2022	Decision MakingInformation Retrieval	—Unverified
SAM-R1: Leveraging SAM for Reward Feedback in Multimodal Segmentation via Reinforcement Learning	May 28, 2025	Image SegmentationMultimodal Reasoning	—Unverified
SAM-RL: Sensing-Aware Model-Based Reinforcement Learning via Differentiable Physics-Based Simulation and Rendering	Oct 27, 2022	Deformable Object ManipulationModel-based Reinforcement Learning	—Unverified
SAPO-RL: Sequential Actuator Placement Optimization for Fuselage Assembly via Reinforcement Learning	Apr 24, 2025	Decision MakingQ-Learning	—Unverified
SARI: Structured Audio Reasoning via Curriculum-Guided Reinforcement Learning	Apr 22, 2025	Multiple-choicereinforcement-learning	—Unverified
SAT-MARL: Specification Aware Training in Multi-Agent Reinforcement Learning	Dec 14, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
SatNet: A Benchmark for Satellite Scheduling Optimization	Nov 24, 2021	Combinatorial OptimizationEvolutionary Algorithms	—Unverified
Saute RL: Almost Surely Safe Reinforcement Learning Using State Augmentation	Feb 14, 2022	reinforcement-learningReinforcement Learning	—Unverified
Say What I Want: Towards the Dark Side of Neural Dialogue Models	Sep 13, 2019	ChatbotReinforcement Learning	—Unverified
SBEED: Convergent Reinforcement Learning with Nonlinear Function Approximation	Dec 29, 2017	Q-Learningreinforcement-learning	—Unverified
^2-exploration for Reinforcement Learning	Sep 29, 2021	General Reinforcement LearningQ-Learning	—Unverified
Scaffolding Reflection in Reinforcement Learning Framework for Confinement Escape Problem	Nov 13, 2020	reinforcement-learningReinforcement Learning	—Unverified
Scalable and Incremental Learning of Gaussian Mixture Models	Jan 14, 2017	General ClassificationIncremental Learning	—Unverified
Scalable and Sample Efficient Distributed Policy Gradient Algorithms in Multi-Agent Networked Systems	Dec 13, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Scalable Bayesian Inverse Reinforcement Learning by Auto-Encoding Reward	Jan 1, 2021	Bayesian InferenceImitation Learning	—Unverified
Scalable Centralized Deep Multi-Agent Reinforcement Learning via Policy Gradients	May 22, 2018	Deep Reinforcement LearningDistributed Optimization	—Unverified
Scalable Communication for Multi-Agent Reinforcement Learning via Transformer-Based Email Mechanism	Jan 5, 2023	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Scalable, Decentralized Multi-Agent Reinforcement Learning Methods Inspired by Stigmergy and Ant Colonies	May 8, 2021	Multi-agent Reinforcement LearningNavigate	—Unverified
Scalable Deep Reinforcement Learning Algorithms for Mean Field Games	Mar 22, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Scalable Deep Reinforcement Learning for Routing and Spectrum Access in Physical Layer	Dec 22, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Scalable Deep Reinforcement Learning for Ride-Hailing	Sep 27, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Scalable Evaluation of Multi-Agent Reinforcement Learning with Melting Pot	Jul 14, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Scalable Evolution Strategies Pipeline for Solving the Vehicle Routing Problem	Oct 17, 2020	Deep Reinforcement LearningGPU	—Unverified
Scalable Fragment-Based 3D Molecular Design with Reinforcement Learning	Feb 1, 2022	Drug Discoveryreinforcement-learning	—Unverified
Scalable Grid-Aware Dynamic Matching using Deep Reinforcement Learning	Jan 31, 2023	Deep Reinforcement Learningreinforcement-learning	—Unverified
Scalable Joint Learning of Wireless Multiple-Access Policies and their Signaling	Jun 8, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Scalable Multi-Agent Inverse Reinforcement Learning via Actor-Attention-Critic	Feb 24, 2020	Open-Ended Question Answeringreinforcement-learning	—Unverified
Scalable Multi-Agent Offline Reinforcement Learning and the Role of Information	Feb 16, 2025	InformativenessReinforcement Learning (RL)	—Unverified
Scalable Multi-Agent Reinforcement Learning for Networked Systems with Average Reward	Jun 11, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Scalable multi-agent reinforcement learning for distributed control of residential energy flexibility	Mar 7, 2022	Multi-agent Reinforcement LearningQ-Learning	—Unverified
Scalable Multi-Agent Reinforcement Learning with General Utilities	Feb 15, 2023	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Scalable Multi-agent Reinforcement Learning for Factory-wide Dynamic Scheduling	Sep 20, 2024	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Scalable Multi-Task Imitation Learning with Autonomous Improvement	Feb 25, 2020	Imitation Learningreinforcement-learning	—Unverified
Scalable Online Disease Diagnosis via Multi-Model-Fused Actor-Critic Reinforcement Learning	Jun 8, 2022	Diagnosticreinforcement-learning	—Unverified
Scalable photonic reinforcement learning by time-division multiplexing of laser chaos	Mar 26, 2018	Decision Makingreinforcement-learning	—Unverified
Scalable Planning and Learning Framework Development for Swarm-to-Swarm Engagement Problems	Dec 6, 2022	Reinforcement Learning (RL)	—Unverified
Scalable Reinforcement-Learning-Based Neural Architecture Search for Cancer Deep Learning Research	Sep 1, 2019	Deep LearningNeural Architecture Search	—Unverified
Scalable Reinforcement Learning-based Neural Architecture Search	Oct 2, 2024	Neural Architecture Searchreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 244 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified