Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11651–11700 of 15113 papers

Title	Date	Tasks	Status
Reset-Free Guided Policy Search: Efficient Deep Reinforcement Learning with Stochastic Initial States	Oct 4, 2016	Deep Reinforcement Learningreinforcement-learning	—Unverified
Reset-Free Reinforcement Learning via Multi-Task Learning: Learning Dexterous Manipulation Behaviors without Human Intervention	Apr 22, 2021	Multi-Task LearningReinforcement Learning (RL)	—Unverified
Residential Demand Response Applications Using Batch Reinforcement Learning	Apr 8, 2015	reinforcement-learningReinforcement Learning	—Unverified
Residual Feedback Learning for Contact-Rich Manipulation Tasks with Uncertainty	Jun 8, 2021	Contact-rich ManipulationPosition	—Unverified
Residual Learning from Demonstration: Adapting DMPs for Contact-rich Manipulation	Aug 18, 2020	Behavioural cloningContact-rich Manipulation	—Unverified
Residual Policy Learning for Powertrain Control	Dec 15, 2022	Reinforcement Learning (RL)	—Unverified
Residual Q-Networks for Value Function Factorizing in Multi-Agent Reinforcement Learning	May 30, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Residual Reinforcement Learning for Robot Control	Dec 7, 2018	Frictionreinforcement-learning	—Unverified
Residual Reinforcement Learning from Demonstrations	Jun 15, 2021	reinforcement-learningReinforcement Learning	—Unverified
Resilient Autonomous Control of Distributed Multi-agent Systems in Contested Environments	Aug 31, 2017	reinforcement-learningReinforcement Learning	—Unverified
Resilient Computing with Reinforcement Learning on a Dynamical System: Case Study in Sorting	Sep 25, 2018	Decision Makingreinforcement-learning	—Unverified
Resilient Constrained Reinforcement Learning	Dec 28, 2023	Decision Makingreinforcement-learning	—Unverified
Resilient Control of Networked Microgrids using Vertical Federated Reinforcement Learning: Designs and Real-Time Test-Bed Validations	Nov 21, 2023	OpenAI GymReinforcement Learning (RL)	—Unverified
Resilient Legged Local Navigation: Learning to Traverse with Compromised Perception End-to-End	Oct 5, 2023	Anomaly DetectionCPU	—Unverified
Resilient robot teams: a review integrating decentralised control, change-detection, and learning	Apr 21, 2022	Change DetectionFault Detection	—Unverified
Resilient UAV Trajectory Planning via Few-Shot Meta-Offline Reinforcement Learning	Feb 3, 2025	Meta-LearningOffline RL	—Unverified
Resmax: An Alternative Soft-Greedy Operator for Reinforcement Learning	Sep 29, 2021	reinforcement-learningReinforcement Learning	—Unverified
Resolving Causal Confusion in Reinforcement Learning via Robust Exploration	Mar 9, 2021	reinforcement-learningReinforcement Learning	—Unverified
Resolving Congestions in the Air Traffic Management Domain via Multiagent Reinforcement Learning Methods	Dec 14, 2019	Managementreinforcement-learning	—Unverified
Resolving Latency and Inventory Risk in Market Making with Reinforcement Learning	May 18, 2025	Reinforcement Learning (RL)	—Unverified
Resource Abstraction for Reinforcement Learning in Multiagent Congestion Problems	Mar 13, 2019	reinforcement-learningReinforcement Learning	—Unverified
Resource Allocation for a Wireless Coexistence Management System Based on Reinforcement Learning	May 24, 2018	Managementreinforcement-learning	—Unverified
Resource Allocation in Mobility-Aware Federated Learning Networks: A Deep Reinforcement Learning Approach	Oct 21, 2019	Deep Reinforcement LearningFederated Learning	—Unverified
Resource Allocation in Multicore Elastic Optical Networks: A Deep Reinforcement Learning Approach	Jul 5, 2022	BlockingDeep Reinforcement Learning	—Unverified
The state-of-the-art review on resource allocation problem using artificial intelligence methods on various computing paradigms	Mar 23, 2022	Cloud ComputingDeep Reinforcement Learning	—Unverified
Resource Constrained Deep Reinforcement Learning	Dec 3, 2018	Deep Reinforcement LearningManagement	—Unverified
Resource-Constrained Station-Keeping for Helium Balloons using Reinforcement Learning	Mar 2, 2023	continuous-controlContinuous Control	—Unverified
Resource Governance in Networked Systems via Integrated Variational Autoencoders and Reinforcement Learning	Oct 30, 2024	Deep Reinforcement Learningreinforcement-learning	—Unverified
Resource Management for Blockchain-enabled Federated Learning: A Deep Reinforcement Learning Approach	Apr 8, 2020	CPUDeep Reinforcement Learning	—Unverified
Resource Management in Wireless Networks via Multi-Agent Deep Reinforcement Learning	Feb 14, 2020	Deep Reinforcement LearningManagement	—Unverified
Resource Optimization for Tail-Based Control in Wireless Networked Control Systems	Jun 20, 2024	GPRPrediction	—Unverified
Responding to Illegal Activities Along the Canadian Coastlines Using Reinforcement Learning	Aug 5, 2021	FADreinforcement-learning	—Unverified
Response to Comment on 'Perceptual Learning Incepted by Decoded fMRI Neurofeedback Without Stimulus Presentation'; How can a decoded neurofeedback method (DecNef) lead to successful reinforcement and visual perceptual learning?	Dec 13, 2016	Reinforcement Learning (RL)	—Unverified
Responsive Safety in Reinforcement Learning by PID Lagrangian Methods	Jul 8, 2020	reinforcement-learningReinforcement Learning	—Unverified
Responsive Safety in Reinforcement Learning	Jan 1, 2020	reinforcement-learningReinforcement Learning	—Unverified
Restarted Bayesian Online Change-point Detection for Non-Stationary Markov Decision Processes	Apr 1, 2023	Change Point DetectionReinforcement Learning (RL)	—Unverified
Restoring Chaos Using Deep Reinforcement Learning	Nov 27, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Rethink AI-based Power Grid Control: Diving Into Algorithm Design	Dec 23, 2020	Deep Reinforcement LearningImitation Learning	—Unverified
Rethinking Decision Transformer via Hierarchical Reinforcement Learning	Nov 1, 2023	Decision MakingHierarchical Reinforcement Learning	—Unverified
A Micro-Objective Perspective of Reinforcement Learning	May 24, 2019	reinforcement-learningReinforcement Learning	—Unverified
Decoupled Exploration and Exploitation Policies for Sample-Efficient Reinforcement Learning	Jan 23, 2021	continuous-controlContinuous Control	—Unverified
Rethinking Exposure Bias In Language Modeling	Oct 13, 2019	Language ModelingLanguage Modelling	—Unverified
Rethinking Modern Communication from Semantic Coding to Semantic Communication	Oct 16, 2021	Reinforcement Learning (RL)Semantic Communication	—Unverified
Rethinking Pareto Approaches in Constrained Reinforcement Learning	Sep 29, 2021	reinforcement-learningReinforcement Learning	—Unverified
Rethinking Population-assisted Off-policy Reinforcement Learning	May 4, 2023	OpenAI Gymreinforcement-learning	—Unverified
Rethinking Pruning for Backdoor Mitigation: An Optimization Perspective	May 28, 2024	backdoor defenseGraph Neural Network	—Unverified
Rethinking Reinforcement Learning based Logic Synthesis	May 16, 2022	reinforcement-learningReinforcement Learning	—Unverified
Rethinking Reinforcement Learning for Recommendation: A Prompt Perspective	Jun 15, 2022	Recommendation Systemsreinforcement-learning	—Unverified
Rethinking Robustness Assessment: Adversarial Attacks on Learning-based Quadrupedal Locomotion Controllers	May 21, 2024	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Rethinking State Disentanglement in Causal Reinforcement Learning	Aug 24, 2024	Disentanglementreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 234 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified