Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7651–7675 of 15113 papers

Title	Date	Tasks	Status
Model-Agnostic Learning to Meta-Learn	Dec 4, 2020	image-classificationImage Classification	—Unverified
Model-aided Deep Reinforcement Learning for Sample-efficient UAV Trajectory Design in IoT Networks	Apr 21, 2021	Deep Reinforcement LearningQ-Learning	—Unverified
Model-Based Actor-Critic with Chance Constraint for Stochastic System	Dec 19, 2020	Model Predictive ControlReinforcement Learning (RL)	—Unverified
Model-based adaptation for sample efficient transfer in reinforcement learning control of parameter-varying systems	May 20, 2023	Model Predictive Controlreinforcement-learning	—Unverified
Model-based Bayesian Reinforcement Learning for Dialogue Management	Apr 5, 2013	Bayesian InferenceDialogue Management	—Unverified
Model-based Chance-Constrained Reinforcement Learning via Separated Proportional-Integral Lagrangian	Aug 26, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Model-based Deep Reinforcement Learning for Dynamic Portfolio Optimization	Jan 25, 2019	Data AugmentationDeep Reinforcement Learning	—Unverified
Deep Model-Based Reinforcement Learning for High-Dimensional Problems, a Survey	Aug 11, 2020	Decision MakingDeep Reinforcement Learning	—Unverified
Model-based Dynamic Shielding for Safe and Efficient Multi-Agent Reinforcement Learning	Apr 13, 2023	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Model-Based Episodic Memory Induces Dynamic Hybrid Controls	Nov 3, 2021	modelreinforcement-learning	—Unverified
Model-based imitation learning from state trajectories	Jan 1, 2018	Imitation Learningmodel	—Unverified
Model-Based Imitation Learning Using Entropy Regularization of Model and Policy	Jun 21, 2022	counterfactualImitation Learning	—Unverified
Model-Based Inverse Reinforcement Learning from Visual Demonstrations	Oct 18, 2020	modelModel Predictive Control	—Unverified
Model-based Lookahead Reinforcement Learning	Aug 15, 2019	continuous-controlContinuous Control	—Unverified
Model-based Meta Reinforcement Learning using Graph Structured Surrogate Models	Feb 16, 2021	Decision MakingMeta Reinforcement Learning	—Unverified
Model-based Multi-Agent Reinforcement Learning with Cooperative Prioritized Sweeping	Jan 15, 2020	Model-based Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Model based Multi-agent Reinforcement Learning with Tensor Decompositions	Oct 27, 2021	Model-based Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Model-based Multi-agent Reinforcement Learning: Recent Progress and Prospects	Mar 20, 2022	Decision MakingMulti-agent Reinforcement Learning	—Unverified
Model-Based Multi-Agent RL in Zero-Sum Markov Games with Near-Optimal Sample Complexity	Jul 15, 2020	Model-based Reinforcement LearningReinforcement Learning (RL)	—Unverified
Model-Based Offline Meta-Reinforcement Learning with Regularization	Feb 7, 2022	Meta Reinforcement Learningreinforcement-learning	—Unverified
Model-Based Offline Planning	Aug 12, 2020	modelOffline RL	—Unverified
Model-based Offline Reinforcement Learning with Local Misspecification	Jan 26, 2023	D4RLmodel	—Unverified
Model-Based Offline Reinforcement Learning with Adversarial Data Augmentation	Mar 26, 2025	D4RLData Augmentation	—Unverified
Model Based Planning with Energy Based Models	Sep 15, 2019	modelReinforcement Learning	—Unverified
Model-Based Policy Gradients with Parameter-Based Exploration by Least-Squares Conditional Density Estimation	Jul 19, 2013	Density EstimationReinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 307 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified