Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4001–4025 of 15113 papers

Title	Date	Tasks	Status
Do No Harm: A Counterfactual Approach to Safe Reinforcement Learning	May 19, 2024	counterfactualFriction	—Unverified
Coordinated Reinforcement Learning for Optimizing Mobile Networks	Sep 30, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Adaptive Structural Hyper-Parameter Configuration by Q-Learning	Mar 2, 2020	Evolutionary AlgorithmsQ-Learning	—Unverified
Development of A Stochastic Traffic Environment with Generative Time-Series Models for Improving Generalization Capabilities of Autonomous Driving Agents	Jun 10, 2020	Autonomous DrivingReinforcement Learning (RL)	—Unverified
Development of collective behavior in newborn artificial agents	Nov 6, 2021	Deep Reinforcement LearningObject Recognition	—Unverified
Bayesian Linear Regression on Deep Representations	Dec 14, 2019	Model-based Reinforcement Learningregression	—Unverified
Bayesian Nonparametric Reinforcement Learning in LTE and Wi-Fi Coexistence	May 25, 2021	Fairnessreinforcement-learning	—Unverified
DexPoint: Generalizable Point Cloud Reinforcement Learning for Sim-to-Real Dexterous Manipulation	Nov 17, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Dexterous Legged Locomotion in Confined 3D Spaces with Reinforcement Learning	Mar 6, 2024	Deep Reinforcement LearningNavigate	—Unverified
Dexterous Manipulation from Images: Autonomous Real-World RL via Substep Guidance	Dec 19, 2022	reinforcement-learningReinforcement Learning	—Unverified
Coordinated Random Access for Industrial IoT With Correlated Traffic By Reinforcement-Learning	Sep 17, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Dexterous Manipulation with Deep Reinforcement Learning: Efficient, General, and Low-Cost	Oct 14, 2018	Contact-rich ManipulationDeep Reinforcement Learning	—Unverified
Assessing the Impact of Distribution Shift on Reinforcement Learning Performance	Feb 5, 2024	reinforcement-learningReinforcement Learning	—Unverified
Coordinated Multi-Agent Exploration Using Shared Goals	Jan 1, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Coordinated Frequency Control through Safe Reinforcement Learning	Jan 30, 2022	AI AgentDecision Making	—Unverified
Assessing Policy, Loss and Planning Combinations in Reinforcement Learning using a New Modular Architecture	Jan 8, 2022	Deep Reinforcement LearningModel-based Reinforcement Learning	—Unverified
A Generalized Natural Actor-Critic Algorithm	Dec 1, 2009	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Bayesian Q-learning With Imperfect Expert Demonstrations	Oct 1, 2022	Atari GamesQ-Learning	—Unverified
Diagnosing Reinforcement Learning for Traffic Signal Control	May 12, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Dialog Action-Aware Transformer for Dialog Policy Learning	Sep 5, 2023	Language ModelingLanguage Modelling	—Unverified
Bayesian Reinforcement Learning in Factored POMDPs	Nov 14, 2018	reinforcement-learningReinforcement Learning	—Unverified
Dialogue Evaluation with Offline Reinforcement Learning	Sep 2, 2022	Dialogue EvaluationOffline RL	—Unverified
Coordinated Exploration in Concurrent Reinforcement Learning	Feb 5, 2018	Diversityreinforcement-learning	—Unverified
Bayesian Residual Policy Optimization: Scalable Bayesian Reinforcement Learning with Clairvoyant Experts	Feb 7, 2020	Decision MakingPolicy Gradient Methods	—Unverified
Assessing Human Interaction in Virtual Reality With Continually Learning Prediction Agents Based on Reinforcement Learning Algorithms: A Pilot Study	Dec 14, 2021	Continual LearningReinforcement Learning (RL)	—Unverified

Show:10 25 50

← PrevPage 161 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified