Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6001–6025 of 15113 papers

Title	Date	Tasks	Status
Simultaneous Translation with Flexible Policy via Restricted Imitation Learning	Jun 4, 2019	Imitation Learningreinforcement-learning	—Unverified
Solving Collaborative Dec-POMDPs with Deep Reinforcement Learning Heuristics	Nov 9, 2022	AllDeep Reinforcement Learning	—Unverified
Single-Agent vs. Multi-Agent Techniques for Concurrent Reinforcement Learning of Negotiation Dialogue Policies	Jun 1, 2014	Dialogue ManagementMulti-agent Reinforcement Learning	—Unverified
Single and Multi-Agent Deep Reinforcement Learning for AI-Enabled Wireless Networks: A Tutorial	Nov 6, 2020	Decision MakingDeep Reinforcement Learning	—Unverified
Single Cell Training on Architecture Search for Image Denoising	Dec 13, 2022	Computational EfficiencyDenoising	—Unverified
Single-Loop Federated Actor-Critic across Heterogeneous Environments	Dec 19, 2024	reinforcement-learningReinforcement Learning	—Unverified
Single photon in hierarchical architecture for physical reinforcement learning: Photon intelligence	Sep 1, 2016	Decision Makingreinforcement-learning	—Unverified
Single-Shot Pruning for Offline Reinforcement Learning	Dec 31, 2021	continuous-controlContinuous Control	—Unverified
Data-Incremental Continual Offline Reinforcement Learning	Apr 19, 2024	Continual LearningOffline RL	—Unverified
Single-Trajectory Distributionally Robust Reinforcement Learning	Jan 27, 2023	Decision MakingQ-Learning	—Unverified
STEEL: Singularity-aware Reinforcement Learning	Jan 30, 2023	Off-policy evaluationreinforcement-learning	—Unverified
Singular Perturbation-based Reinforcement Learning of Two-Point Boundary Optimal Control Systems	Apr 19, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
SINR-Aware Deep Reinforcement Learning for Distributed Dynamic Channel Allocation in Cognitive Interference Networks	Feb 17, 2024	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Situated GAIL: Multitask imitation using task-conditioned adversarial inverse reinforcement learning	Nov 1, 2019	Imitation Learningreinforcement-learning	—Unverified
Sketch-Based Linear Value Function Approximation	Dec 1, 2012	Atari Gamesreinforcement-learning	—Unverified
Sketch-to-Skill: Bootstrapping Robot Learning with Human Drawn Trajectory Sketches	Mar 14, 2025	Imitation Learningreinforcement-learning	—Unverified
Skill-based Meta-Reinforcement Learning	Apr 25, 2022	continuous-controlContinuous Control	—Unverified
Skill-based Model-based Reinforcement Learning	Jul 15, 2022	modelModel-based Reinforcement Learning	—Unverified
Skill-Critic: Refining Learned Skills for Hierarchical Reinforcement Learning	Jun 14, 2023	Autonomous RacingDecision Making	—Unverified
Skill Discovery in Continuous Reinforcement Learning Domains using Skill Chaining	Dec 1, 2009	reinforcement-learningReinforcement Learning	—Unverified
Skill Discovery of Coordination in Multi-agent Reinforcement Learning	Jun 7, 2020	DiversityMulti-agent Reinforcement Learning	—Unverified
Skilled Experience Catalogue: A Skill-Balancing Mechanism for Non-Player Characters using Reinforcement Learning	Jun 20, 2018	Decision Makingreinforcement-learning	—Unverified
Skill-Enhanced Reinforcement Learning Acceleration from Demonstrations	Dec 9, 2024	reinforcement-learningReinforcement Learning	—Unverified
SkillS: Adaptive Skill Sequencing for Efficient Temporally-Extended Exploration	Nov 24, 2022	Reinforcement Learning (RL)	—Unverified
Skills Regularized Task Decomposition for Multi-task Offline Reinforcement Learning	Aug 28, 2024	Drone navigationOffline RL	—Unverified

Show:10 25 50

← PrevPage 241 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified