Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7726–7750 of 15113 papers

Title	Date	Tasks	Status
Model-free Nearly Optimal Control of Constrained-Input Nonlinear Systems Based on Synchronous Reinforcement Learning	Dec 7, 2021	Reinforcement Learning (RL)	—Unverified
Model-free optimal controller for discrete-time Markovian jump linear systems: A Q-learning approach	Aug 6, 2024	Q-LearningReinforcement Learning (RL)	—Unverified
Model-free optimal control of discrete-time systems with additive and multiplicative noises	Aug 20, 2020	Reinforcement Learning (RL)	—Unverified
Model-Free Optimal Control of Linear Multi-Agent Systems via Decomposition and Hierarchical Approximation	Aug 14, 2020	ClusteringGraph Clustering	—Unverified
Model-Free Predictive Control: Introductory Algebraic Calculations, and a Comparison with HEOL and ANNs	Feb 1, 2025	Model Predictive ControlReinforcement Learning (RL)	—Unverified
Model Free Reinforcement Learning Algorithm for Stationary Mean field Equilibrium for Multiple Types of Agents	Dec 31, 2020	Reinforcement Learning (RL)	—Unverified
Model-Free Reinforcement Learning for Financial Portfolios: A Brief Survey	Apr 10, 2019	ManagementPortfolio Optimization	—Unverified
Model-free Reinforcement Learning for Stochastic Stackelberg Security Games	May 24, 2020	reinforcement-learningReinforcement Learning	—Unverified
Model-free Reinforcement Learning for Branching Markov Decision Processes	Jun 12, 2021	reinforcement-learningReinforcement Learning	—Unverified
Model-Free Reinforcement Learning for Symbolic Automata-encoded Objectives	Feb 4, 2022	reinforcement-learningReinforcement Learning	—Unverified
Model-Free Reinforcement Learning for Automated Fluid Administration in Critical Care	Jan 11, 2024	Q-Learningreinforcement-learning	—Unverified
Model-Free Reinforcement Learning for Asset Allocation	Sep 21, 2022	Managementmodel	—Unverified
Whittle Index based Q-Learning for Wireless Edge Caching with Linear Function Approximation	Feb 26, 2022	Edge-computingQ-Learning	—Unverified
Model-Free Reinforcement Learning for Optimal Control of MarkovDecision Processes Under Signal Temporal Logic Specifications	Sep 27, 2021	Motion Planningreinforcement-learning	—Unverified
Model-free Reinforcement Learning for Robust Locomotion using Demonstrations from Trajectory Optimization	Jul 14, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Model-Free Reinforcement Learning: from Clipped Pseudo-Regret to Sample Complexity	Jun 6, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Model-free Representation Learning and Exploration in Low-rank MDPs	Feb 14, 2021	Reinforcement Learning (RL)Representation Learning	—Unverified
Model-Free Risk-Sensitive Reinforcement Learning	Nov 4, 2021	Decision Makingmodel	—Unverified
Model-Free RL Agents Demonstrate System 1-Like Intentionality	Jan 30, 2025	JurisprudenceReinforcement Learning (RL)	—Unverified
Robust Reinforcement Learning using Least Squares Policy Iteration with Provable Performance Guarantees	Jun 20, 2020	OpenAI Gymreinforcement-learning	—Unverified
Model-Free Unsupervised Learning for Optimization Problems with Constraints	Jul 30, 2019	reinforcement-learningReinforcement Learning	—Unverified
Model Generation with Provable Coverability for Offline Reinforcement Learning	Jun 1, 2022	Offline RLOut-of-Distribution Generalization	—Unverified
Model Imitation for Model-Based Reinforcement Learning	Sep 25, 2019	modelModel-based Reinforcement Learning	—Unverified
Modeling Adaptive Platoon and Reservation Based Autonomous Intersection Control: A Deep Reinforcement Learning Approach	Jun 24, 2022	Autonomous VehiclesDeep Reinforcement Learning	—Unverified
Modeling and Interpreting Real-world Human Risk Decision Making with Inverse Reinforcement Learning	Jun 13, 2019	Decision Makingreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 310 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified