Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9701–9750 of 15113 papers

Title	Date	Tasks	Status
MLGOPerf: An ML Guided Inliner to Optimize Performance	Jul 18, 2022	reinforcement-learningReinforcement Learning	—Unverified
MLGym: A New Framework and Benchmark for Advancing AI Research Agents	Feb 20, 2025	Reinforcement Learning (RL)	—Unverified
MMD-MIX: Value Function Factorisation with Maximum Mean Discrepancy for Cooperative Multi-Agent Reinforcement Learning	Jun 22, 2021	Distributional Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
MMedAgent-RL: Optimizing Multi-Agent Collaboration for Multimodal Medical Reasoning	May 31, 2025	DiagnosticReinforcement Learning (RL)	—Unverified
MOBA: Multi-teacher Model Based Reinforcement Learning	Sep 29, 2021	Decision MakingKnowledge Distillation	—Unverified
Mobile Cellular-Connected UAVs: Reinforcement Learning for Sky Limits	Sep 21, 2020	reinforcement-learningReinforcement Learning	—Unverified
Mobile Networks for Computer Go	Aug 23, 2020	Deep Reinforcement LearningGame of Go	—Unverified
Mobile Robot Planner with Low-cost Cameras Using Deep Reinforcement Learning	Dec 21, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Mobile Robots Autonomous Exploration with Reinforcement Learning	Dec 14, 2020	reinforcement-learningReinforcement Learning	—Unverified
Mobile Robots Exploration via Deep Reinforcement Learning	Dec 14, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Mobile-TeleVision: Predictive Motion Priors for Humanoid Whole-Body Control	Dec 10, 2024	motion retargetingReinforcement Learning (RL)	—Unverified
Mobility Management for Cellular-Connected UAVs: A Learning-Based Approach	Mar 10, 2020	ManagementReinforcement Learning (RL)	—Unverified
Modality-Buffet for Real-Time Object Detection	Nov 17, 2020	Decision MakingObject	—Unverified
Model-agnostic Counterfactual Synthesis Policy for Interactive Recommendation	Apr 1, 2022	counterfactualInteractive Recommendation	—Unverified
Model-Agnostic Learning to Meta-Learn	Dec 4, 2020	image-classificationImage Classification	—Unverified
Model-aided Deep Reinforcement Learning for Sample-efficient UAV Trajectory Design in IoT Networks	Apr 21, 2021	Deep Reinforcement LearningQ-Learning	—Unverified
Model-Based Actor-Critic with Chance Constraint for Stochastic System	Dec 19, 2020	Model Predictive ControlReinforcement Learning (RL)	—Unverified
Model-based adaptation for sample efficient transfer in reinforcement learning control of parameter-varying systems	May 20, 2023	Model Predictive Controlreinforcement-learning	—Unverified
Model-based Bayesian Reinforcement Learning for Dialogue Management	Apr 5, 2013	Bayesian InferenceDialogue Management	—Unverified
Model-based Chance-Constrained Reinforcement Learning via Separated Proportional-Integral Lagrangian	Aug 26, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Model-based Deep Reinforcement Learning for Dynamic Portfolio Optimization	Jan 25, 2019	Data AugmentationDeep Reinforcement Learning	—Unverified
Deep Model-Based Reinforcement Learning for High-Dimensional Problems, a Survey	Aug 11, 2020	Decision MakingDeep Reinforcement Learning	—Unverified
Model-based Dynamic Shielding for Safe and Efficient Multi-Agent Reinforcement Learning	Apr 13, 2023	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Model-Based Episodic Memory Induces Dynamic Hybrid Controls	Nov 3, 2021	modelreinforcement-learning	—Unverified
Model-based imitation learning from state trajectories	Jan 1, 2018	Imitation Learningmodel	—Unverified
Model-Based Imitation Learning Using Entropy Regularization of Model and Policy	Jun 21, 2022	counterfactualImitation Learning	—Unverified
Model-Based Inverse Reinforcement Learning from Visual Demonstrations	Oct 18, 2020	modelModel Predictive Control	—Unverified
Model-based Lookahead Reinforcement Learning	Aug 15, 2019	continuous-controlContinuous Control	—Unverified
Model-based Meta Reinforcement Learning using Graph Structured Surrogate Models	Feb 16, 2021	Decision MakingMeta Reinforcement Learning	—Unverified
Model-based Multi-Agent Reinforcement Learning with Cooperative Prioritized Sweeping	Jan 15, 2020	Model-based Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Model based Multi-agent Reinforcement Learning with Tensor Decompositions	Oct 27, 2021	Model-based Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Model-based Multi-agent Reinforcement Learning: Recent Progress and Prospects	Mar 20, 2022	Decision MakingMulti-agent Reinforcement Learning	—Unverified
Model-Based Multi-Agent RL in Zero-Sum Markov Games with Near-Optimal Sample Complexity	Jul 15, 2020	Model-based Reinforcement LearningReinforcement Learning (RL)	—Unverified
Model-Based Offline Meta-Reinforcement Learning with Regularization	Feb 7, 2022	Meta Reinforcement Learningreinforcement-learning	—Unverified
Model-Based Offline Planning	Aug 12, 2020	modelOffline RL	—Unverified
Model-based Offline Reinforcement Learning with Local Misspecification	Jan 26, 2023	D4RLmodel	—Unverified
Model-Based Offline Reinforcement Learning with Adversarial Data Augmentation	Mar 26, 2025	D4RLData Augmentation	—Unverified
Model Based Planning with Energy Based Models	Sep 15, 2019	modelReinforcement Learning	—Unverified
Model-Based Policy Gradients with Parameter-Based Exploration by Least-Squares Conditional Density Estimation	Jul 19, 2013	Density EstimationReinforcement Learning	—Unverified
Model-based Policy Search for Partially Measurable Systems	Jan 21, 2021	Gaussian Processesmodel	—Unverified
Model-Based Regularization for Deep Reinforcement Learning with Transcoder Networks	Sep 6, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
Model-based Reinforcement Learning and the Eluder Dimension	Jun 7, 2014	modelModel-based Reinforcement Learning	—Unverified
Model-based Reinforcement Learning: A Survey	Jun 30, 2020	Decision Makingmodel	—Unverified
Model-Based Reinforcement Learning Exploiting State-Action Equivalence	Oct 9, 2019	modelModel-based Reinforcement Learning	—Unverified
Model-based reinforcement learning for biological sequence design	May 1, 2020	modelModel-based Reinforcement Learning	—Unverified
Model-based Reinforcement Learning for Predictions and Control for Limit Order Books	Oct 9, 2019	Model-based Reinforcement Learningreinforcement-learning	—Unverified
Model-Based Reinforcement Learning for Physical Systems Without Velocity and Acceleration Measurements	Feb 25, 2020	GPRModel-based Reinforcement Learning	—Unverified
Model-Based Reinforcement Learning for Approximate Optimal Control with Temporal Logic Specifications	Jan 18, 2021	Model-based Reinforcement Learningreinforcement-learning	—Unverified
Model-based Reinforcement Learning for Service Mesh Fault Resiliency in a Web Application-level	Oct 21, 2021	AttributeManagement	—Unverified
Model-Based Reinforcement Learning via Stochastic Hybrid Models	Nov 11, 2021	Imitation Learningmodel	—Unverified

Show:10 25 50

← PrevPage 195 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified