Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9826–9850 of 15113 papers

Title	Date	Tasks	Status
Modeling the Formation of Social Conventions from Embodied Real-Time Interactions	Feb 16, 2018	Decision MakingFairness	—Unverified
Modeling the Interaction between Agents in Cooperative Multi-Agent Reinforcement Learning	Feb 10, 2021	continuous-controlContinuous Control	—Unverified
Modeling the Long Term Future in Model-Based Reinforcement Learning	May 1, 2019	Imitation LearningModel-based Reinforcement Learning	—Unverified
Modeling Unseen Environments with Language-guided Composable Causal Components in Reinforcement Learning	May 13, 2025	Meta-LearningReinforcement Learning (RL)	—Unverified
Model-Invariant State Abstractions for Model-Based Reinforcement Learning	Feb 19, 2021	continuous-controlContinuous Control	—Unverified
Model Inversion Attacks against Graph Neural Networks	Sep 16, 2022	modelReinforcement Learning (RL)	—Unverified
ModelLight: Model-Based Meta-Reinforcement Learning for Traffic Signal Control	Nov 15, 2021	Meta-LearningMeta Reinforcement Learning	—Unverified
Modelling Cooperation in Network Games with Spatio-Temporal Complexity	Feb 13, 2021	Deep Reinforcement LearningManagement	—Unverified
Modelling Generalized Forces with Reinforcement Learning for Sim-to-Real Transfer	Oct 21, 2019	reinforcement-learningReinforcement Learning	—Unverified
Modelling Human Kinetics and Kinematics during Walking using Reinforcement Learning	Mar 15, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Modelling resource allocation in uncertain system environment through deep reinforcement learning	Jun 17, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Modelling Stock-market Investors as Reinforcement Learning Agents [Correction]	Sep 20, 2016	Decision MakingQ-Learning	—Unverified
Modelling the Dynamic Joint Policy of Teammates with Attention Multi-agent DDPG	Nov 13, 2018	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Modelling Working Memory using Deep Recurrent Reinforcement Learning	Sep 11, 2019	Decision Makingreinforcement-learning	—Unverified
Model Mediated Teleoperation with a Hand-Arm Exoskeleton in Long Time Delays Using Reinforcement Learning	Jul 1, 2021	Reinforcement Learning (RL)	—Unverified
Model-predictive control and reinforcement learning in multi-energy system case studies	Apr 20, 2021	BenchmarkingModel Predictive Control	—Unverified
Model Predictive Control and Reinforcement Learning: A Unified Framework Based on Dynamic Programming	Jun 2, 2024	Model Predictive ControlReinforcement Learning (RL)	—Unverified
Model Predictive Control via On-Policy Imitation Learning	Oct 17, 2022	Imitation Learningmodel	—Unverified
Model-Reference Reinforcement Learning Control of Autonomous Surface Vehicles with Uncertainties	Mar 30, 2020	Autonomous VehiclesDeep Reinforcement Learning	—Unverified
Model-Reference Reinforcement Learning for Collision-Free Tracking Control of Autonomous Surface Vehicles	Aug 17, 2020	Collision AvoidanceDeep Reinforcement Learning	—Unverified
Model Selection for Off-policy Evaluation: New Algorithms and Experimental Protocol	Feb 11, 2025	Model SelectionOff-policy evaluation	—Unverified
Model Selection in Reinforcement Learning with General Function Approximations	Jul 6, 2022	Model SelectionMulti-Armed Bandits	—Unverified
Model Selection for Generic Reinforcement Learning	Jul 13, 2021	modelModel Selection	—Unverified
Modified Actor-Critics	Jul 2, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Modifying RL Policies with Imagined Actions: How Predictable Policies Can Enable Users to Perform Novel Tasks	Dec 10, 2023	Reinforcement Learning (RL)	—Unverified

Show:10 25 50

← PrevPage 394 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified