Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7676–7700 of 15113 papers

Title	Date	Tasks	Status
Model-based Policy Search for Partially Measurable Systems	Jan 21, 2021	Gaussian Processesmodel	—Unverified
Model-Based Regularization for Deep Reinforcement Learning with Transcoder Networks	Sep 6, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
Model-based Reinforcement Learning and the Eluder Dimension	Jun 7, 2014	modelModel-based Reinforcement Learning	—Unverified
Model-based Reinforcement Learning: A Survey	Jun 30, 2020	Decision Makingmodel	—Unverified
Model-Based Reinforcement Learning Exploiting State-Action Equivalence	Oct 9, 2019	modelModel-based Reinforcement Learning	—Unverified
Model-based reinforcement learning for biological sequence design	May 1, 2020	modelModel-based Reinforcement Learning	—Unverified
Model-based Reinforcement Learning for Predictions and Control for Limit Order Books	Oct 9, 2019	Model-based Reinforcement Learningreinforcement-learning	—Unverified
Model-Based Reinforcement Learning for Physical Systems Without Velocity and Acceleration Measurements	Feb 25, 2020	GPRModel-based Reinforcement Learning	—Unverified
Model-Based Reinforcement Learning for Approximate Optimal Control with Temporal Logic Specifications	Jan 18, 2021	Model-based Reinforcement Learningreinforcement-learning	—Unverified
Model-based Reinforcement Learning for Service Mesh Fault Resiliency in a Web Application-level	Oct 21, 2021	AttributeManagement	—Unverified
Model-Based Reinforcement Learning via Stochastic Hybrid Models	Nov 11, 2021	Imitation Learningmodel	—Unverified
Model-based reinforcement learning for protein backbone design	May 3, 2024	modelModel-based Reinforcement Learning	—Unverified
Model-Based Reinforcement Learning for Control of Strongly-Disturbed Unsteady Aerodynamic Flows	Aug 26, 2024	Deep Reinforcement LearningModel-based Reinforcement Learning	—Unverified
Model Based Reinforcement Learning for Atari	May 1, 2020	Atari Gamesmodel	—Unverified
Model-Based Reinforcement Learning for Sepsis Treatment	Nov 23, 2018	modelModel-based Reinforcement Learning	—Unverified
Model-Based Reinforcement Learning for Type 1Diabetes Blood Glucose Control	Oct 13, 2020	Model-based Reinforcement LearningQ-Learning	—Unverified
Whole-Chain Recommendations	Feb 11, 2019	Multi-agent Reinforcement LearningRecommendation Systems	—Unverified
Model-based Reinforcement Learning from Signal Temporal Logic Specifications	Nov 10, 2020	Autonomous VehiclesModel-based Reinforcement Learning	—Unverified
Model-Based Reinforcement Learning for Offline Zero-Sum Markov Games	Jun 8, 2022	Model-based Reinforcement Learningreinforcement-learning	—Unverified
Model-Based Reinforcement Learning via Imagination with Derived Memory	Dec 1, 2021	Model-based Reinforcement Learningreinforcement-learning	—Unverified
Model-Based Reinforcement Learning via Meta-Policy Optimization	Sep 14, 2018	Model-based Reinforcement Learningreinforcement-learning	—Unverified
Model-based Reinforcement Learning with Parametrized Physical Models and Optimism-Driven Exploration	Sep 23, 2015	Model-based Reinforcement LearningModel Predictive Control	—Unverified
Model-based Reinforcement Learning with Ensembled Model-value Expansion	Sep 29, 2021	modelModel-based Reinforcement Learning	—Unverified
Model-Based Reinforcement Learning with Multinomial Logistic Function Approximation	Dec 27, 2022	Model-based Reinforcement Learningreinforcement-learning	—Unverified
Model-based Reinforcement Learning with a Hamiltonian Canonical ODE Network	Nov 2, 2022	Model-based Reinforcement Learningreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 308 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified