Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7401–7425 of 15113 papers

Title	Date	Tasks	Status
skrl: Modular and Flexible Library for Reinforcement Learning	Feb 8, 2022	Isaac Gym PreviewOmniverse Isaac Gym	—Unverified
Robust, Deep, and Reinforcement Learning for Management of Communication and Power Networks	Feb 8, 2022	Decision MakingDeep Reinforcement Learning	—Unverified
Provable Reinforcement Learning with a Short-Term Memory	Feb 8, 2022	Decision Makingreinforcement-learning	—Unverified
Reward-Respecting Subtasks for Model-Based Reinforcement Learning	Feb 7, 2022	Model-based Reinforcement Learningreinforcement-learning	—Unverified
Optimizing Warfarin Dosing using Deep Reinforcement Learning	Feb 7, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Model-Based Offline Meta-Reinforcement Learning with Regularization	Feb 7, 2022	Meta Reinforcement Learningreinforcement-learning	—Unverified
Policy Optimization for Stochastic Shortest Path	Feb 7, 2022	reinforcement-learningReinforcement Learning	—Unverified
Attacking c-MARL More Effectively: A Data Driven Approach	Feb 7, 2022	Adversarial AttackMulti-agent Reinforcement Learning	—Unverified
Exploration with Multi-Sample Target Values for Distributional Reinforcement Learning	Feb 6, 2022	continuous-controlContinuous Control	—Unverified
Stochastic Gradient Descent with Dependent Data for Offline Reinforcement Learning	Feb 6, 2022	Q-Learningreinforcement-learning	—Unverified
Reinforcement learning for multi-item retrieval in the puzzle-based storage system	Feb 5, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
ASHA: Assistive Teleoperation via Human-in-the-Loop Reinforcement Learning	Feb 5, 2022	reinforcement-learningReinforcement Learning	—Unverified
Meta-Reinforcement Learning with Self-Modifying Networks	Feb 4, 2022	Deep Reinforcement LearningMeta Reinforcement Learning	—Unverified
A Reinforcement Learning Framework for PQoS in a Teleoperated Driving Scenario	Feb 4, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Offline Reinforcement Learning for Mobile Notifications	Feb 4, 2022	AttributeRecommendation Systems	—Unverified
Model-Free Reinforcement Learning for Symbolic Automata-encoded Objectives	Feb 4, 2022	reinforcement-learningReinforcement Learning	—Unverified
Malleable Agents for Re-Configurable Robotic Manipulators	Feb 4, 2022	Deep Reinforcement LearningDomain Adaptation	—Unverified
Video Violence Recognition and Localization Using a Semi-Supervised Hard Attention Model	Feb 4, 2022	Activity RecognitionHard Attention	—Unverified
Reward is not enough: can we liberate AI from the reinforcement learning paradigm?	Feb 3, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Security-Aware Virtual Network Embedding Algorithm based on Reinforcement Learning	Feb 3, 2022	Network Embeddingreinforcement-learning	—Unverified
Network Resource Allocation Strategy Based on Deep Reinforcement Learning	Feb 3, 2022	AttributeDeep Reinforcement Learning	—Unverified
Financial Vision Based Reinforcement Learning Trading Strategy	Feb 3, 2022	reinforcement-learningReinforcement Learning	—Unverified
AI-as-a-Service Toolkit for Human-Centered Intelligence in Autonomous Driving	Feb 3, 2022	Autonomous Drivingreinforcement-learning	—Unverified
Deep Reinforcement Learning Assisted Federated Learning Algorithm for Data Management of IIoT	Feb 3, 2022	Deep Reinforcement LearningFederated Learning	—Unverified
How to Leverage Unlabeled Data in Offline Reinforcement Learning	Feb 3, 2022	Offline RLreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 297 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified