Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 12401–12450 of 15113 papers

Title	Date	Tasks	Status
Show Us the Way: Learning to Manage Dialog from Demonstrations	Apr 17, 2020	dialog state trackingManagement	—Unverified
Shrinkage-based Bias-Variance Trade-off for Deep Reinforcement Learning	Sep 27, 2018	continuous-controlContinuous Control	—Unverified
ShrinkML: End-to-End ASR Model Compression Using Reinforcement Learning	Jul 8, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
SIBRE: Self Improvement Based REwards for Adaptive Feedback in Reinforcement Learning	Apr 21, 2020	reinforcement-learningReinforcement Learning	—Unverified
SIDE: State Inference for Partially Observable Cooperative Multi-Agent Reinforcement Learning	May 13, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Sigmoid-Weighted Linear Units for Neural Network Function Approximation in Reinforcement Learning	Feb 10, 2017	Atari GamesDeep Reinforcement Learning	—Unverified
Signal Instructed Coordination in Cooperative Multi-agent Reinforcement Learning	Sep 10, 2019	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Signal Temporal Logic Neural Predictive Control	Sep 10, 2023	Model Predictive ControlReinforcement Learning (RL)	—Unverified
Sign and Relevance Learning	Oct 14, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Sim2real for Reinforcement Learning Driven Next Generation Networks	Jun 8, 2022	Data Interactionreinforcement-learning	—Unverified
Sim-and-Real Reinforcement Learning for Manipulation: A Consensus-based Approach	Feb 26, 2023	Deep Reinforcement Learningreinforcement-learning	—Unverified
Similarities between policy gradient methods (PGM) in Reinforcement learning (RL) and supervised learning (SL)	Apr 12, 2019	Decision MakingPolicy Gradient Methods	—Unverified
SIMILE: Introducing Sequential Information towards More Effective Imitation Learning	May 1, 2019	Imitation LearningOpenAI Gym	—Unverified
Simion Zoo: A Workbench for Distributed Experimentation with Reinforcement Learning for Continuous Control Tasks	Apr 16, 2019	continuous-controlContinuous Control	—Unverified
Simoun: Synergizing Interactive Motion-appearance Understanding for Vision-based Reinforcement Learning	Jan 1, 2023	reinforcement-learningReinforcement Learning (RL)	—Unverified
Simple Agent, Complex Environment: Efficient Reinforcement Learning with Agent States	Feb 10, 2021	Q-Learningreinforcement-learning	—Unverified
Simple Augmentation Goes a Long Way: ADRL for DNN Quantization	Jan 1, 2021	Deep Reinforcement LearningQuantization	—Unverified
Simple Embodied Language Learning as a Byproduct of Meta-Reinforcement Learning	Jun 14, 2023	Meta Reinforcement LearningNavigate	—Unverified
Simplex Decomposition for Portfolio Allocation Constraints in Reinforcement Learning	Apr 16, 2024	Portfolio Optimizationreinforcement-learning	—Unverified
Simplifying Model-based RL: Learning Representations, Latent-space Models, and Policies with One Objective	Sep 18, 2022	Reinforcement Learning (RL)Value prediction	—Unverified
Sim-to-Lab-to-Real: Safe Reinforcement Learning with Shielding and Generalization Guarantees	Jan 20, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Sim-to-Real Learning for Bipedal Locomotion Under Unsensed Dynamic Loads	Apr 9, 2022	Reinforcement Learning (RL)	—Unverified
Sim-to-Real Robot Learning from Pixels with Progressive Nets	Oct 13, 2016	Deep Reinforcement Learningreinforcement-learning	—Unverified
Sim-to-Real Transfer in Deep Reinforcement Learning for Robotics: a Survey	Sep 24, 2020	Deep Reinforcement LearningDomain Adaptation	—Unverified
Sim-to-Real Transfer in Multi-agent Reinforcement Networking for Federated Edge Computing	Oct 18, 2021	Edge-computingFederated Learning	—Unverified
Sim-to-Real Transfer of Deep Reinforcement Learning Agents for Online Coverage Path Planning	Jun 7, 2024	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Simulated Autonomous Driving in a Realistic Driving Environment using Deep Reinforcement Learning and a Deterministic Finite State Machine	Nov 19, 2018	Autonomous DrivingDeep Reinforcement Learning	—Unverified
Simulated Autonomous Driving on Realistic Road Networks using Deep Reinforcement Learning	Dec 12, 2017	Autonomous DrivingDeep Reinforcement Learning	—Unverified
Simulating Battery-Powered TinyML Systems Optimised using Reinforcement Learning in Image-Based Anomaly Detection	Mar 8, 2024	Anomaly DetectionReinforcement Learning (RL)	—Unverified
Simulating Coverage Path Planning with Roomba	Oct 10, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Simulating multi-exit evacuation using deep reinforcement learning	Jul 11, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Simulation-Free Hierarchical Latent Policy Planning for Proactive Dialogues	Dec 19, 2024	Hierarchical Reinforcement LearningReinforcement Learning (RL)	—Unverified
Simulation Studies on Deep Reinforcement Learning for Building Control with Human Interaction	Mar 14, 2021	Deep Reinforcement LearningManagement	—Unverified
Simultaneous Control and Human Feedback in the Training of a Robotic Agent with Actor-Critic Reinforcement Learning	Jun 22, 2016	reinforcement-learningReinforcement Learning	—Unverified
Simultaneously Evolving Deep Reinforcement Learning Models using Multifactorial Optimization	Feb 25, 2020	Deep Reinforcement LearningQ-Learning	—Unverified
Simultaneously Updating All Persistence Values in Reinforcement Learning	Nov 21, 2022	AllAtari Games	—Unverified
Simultaneous Perturbation Algorithms for Batch Off-Policy Search	Mar 18, 2014	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Simultaneous Training of First- and Second-Order Optimizers in Population-Based Reinforcement Learning	Aug 27, 2024	MuJoCoReinforcement Learning (RL)	—Unverified
Simultaneous Translation with Flexible Policy via Restricted Imitation Learning	Jun 4, 2019	Imitation Learningreinforcement-learning	—Unverified
Solving Collaborative Dec-POMDPs with Deep Reinforcement Learning Heuristics	Nov 9, 2022	AllDeep Reinforcement Learning	—Unverified
Single-Agent vs. Multi-Agent Techniques for Concurrent Reinforcement Learning of Negotiation Dialogue Policies	Jun 1, 2014	Dialogue ManagementMulti-agent Reinforcement Learning	—Unverified
Single and Multi-Agent Deep Reinforcement Learning for AI-Enabled Wireless Networks: A Tutorial	Nov 6, 2020	Decision MakingDeep Reinforcement Learning	—Unverified
Single Cell Training on Architecture Search for Image Denoising	Dec 13, 2022	Computational EfficiencyDenoising	—Unverified
Single-Loop Federated Actor-Critic across Heterogeneous Environments	Dec 19, 2024	reinforcement-learningReinforcement Learning	—Unverified
Single photon in hierarchical architecture for physical reinforcement learning: Photon intelligence	Sep 1, 2016	Decision Makingreinforcement-learning	—Unverified
Single-Shot Pruning for Offline Reinforcement Learning	Dec 31, 2021	continuous-controlContinuous Control	—Unverified
Data-Incremental Continual Offline Reinforcement Learning	Apr 19, 2024	Continual LearningOffline RL	—Unverified
Single-Trajectory Distributionally Robust Reinforcement Learning	Jan 27, 2023	Decision MakingQ-Learning	—Unverified
STEEL: Singularity-aware Reinforcement Learning	Jan 30, 2023	Off-policy evaluationreinforcement-learning	—Unverified
Singular Perturbation-based Reinforcement Learning of Two-Point Boundary Optimal Control Systems	Apr 19, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified

Show:10 25 50

← PrevPage 249 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified