Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6801–6825 of 15113 papers

Title	Date	Tasks	Status
Efficient decorrelation of features using Gramian in Reinforcement Learning	Nov 19, 2019	Atari Gamesreinforcement-learning	—Unverified
Efficient Distributed Framework for Collaborative Multi-Agent Reinforcement Learning	May 11, 2022	DiversityMulti-agent Reinforcement Learning	—Unverified
Efficient Domain Coverage for Vehicles with Second-Order Dynamics via Multi-Agent Reinforcement Learning	Nov 11, 2022	Multi-agent Reinforcement LearningReinforcement Learning (RL)	—Unverified
Efficient Drone Mobility Support Using Reinforcement Learning	Nov 21, 2019	Q-Learningreinforcement-learning	—Unverified
Efficient Duple Perturbation Robustness in Low-rank MDPs	Apr 11, 2024	Reinforcement Learning (RL)	—Unverified
Efficient Dynamics Modeling in Interactive Environments with Koopman Theory	Jun 20, 2023	Reinforcement Learning (RL)	—Unverified
Efficient Embedding of Semantic Similarity in Control Policies via Entangled Bisimulation	Jan 28, 2022	Data AugmentationReinforcement Learning (RL)	—Unverified
Efficient entity-based reinforcement learning	Jun 6, 2022	Decision MakingDeep Reinforcement Learning	—Unverified
Efficient Entropy for Policy Gradient with Multidimensional Action Space	Jun 2, 2018	Atari GamesDeep Reinforcement Learning	—Unverified
Efficient Evaluation of Natural Stochastic Policies in Offline Reinforcement Learning	Jun 6, 2020	Off-policy evaluationreinforcement-learning	—Unverified
Efficient Exploration and Value Function Generalization in Deterministic Systems	Dec 1, 2013	Efficient Explorationreinforcement-learning	—Unverified
Efficient Exploration for Model-based Reinforcement Learning with Continuous States and Actions	Sep 28, 2020	Efficient ExplorationGaussian Processes	—Unverified
Efficient Exploration in Constrained Environments with Goal-Oriented Reference Path	Mar 3, 2020	Efficient ExplorationNavigate	—Unverified
Efficient Exploration in Deep Reinforcement Learning: A Novel Bayesian Actor-Critic Algorithm	Aug 19, 2024	Deep Reinforcement LearningEfficient Exploration	—Unverified
Efficient Exploration in Resource-Restricted Reinforcement Learning	Dec 14, 2022	Efficient Explorationreinforcement-learning	—Unverified
Efficient Exploration of Reward Functions in Inverse Reinforcement Learning via Bayesian Optimization	Nov 17, 2020	Bayesian OptimizationEfficient Exploration	—Unverified
Efficient Exploration through Intrinsic Motivation Learning for Unsupervised Subgoal Discovery in Model-Free Hierarchical Reinforcement Learning	Nov 18, 2019	Efficient ExplorationHierarchical Reinforcement Learning	—Unverified
Efficient Exploration Using Extra Safety Budget in Constrained Policy Optimization	Feb 28, 2023	Efficient ExplorationReinforcement Learning (RL)	—Unverified
Efficient Exploration via Epistemic-Risk-Seeking Policy Optimization	Feb 18, 2023	Deep Reinforcement LearningEfficient Exploration	—Unverified
Efficient Implementation of Reinforcement Learning over Homomorphic Encryption	Apr 12, 2025	Privacy Preservingreinforcement-learning	—Unverified
Uncertainty Quantification and Exploration for Reinforcement Learning	Oct 12, 2019	reinforcement-learningReinforcement Learning	—Unverified
Efficient Inference and Exploration for Reinforcement Learning	Sep 24, 2019	reinforcement-learningReinforcement Learning	—Unverified
Efficient Learning of High Level Plans from Play	Mar 16, 2023	Deep Reinforcement LearningMotion Planning	—Unverified
Efficient Learning of Safe Driving Policy via Human-AI Copilot Optimization	Feb 17, 2022	Imitation Learningreinforcement-learning	—Unverified
Efficient Learning of Voltage Control Strategies via Model-based Deep Reinforcement Learning	Dec 6, 2022	Deep Reinforcement LearningImitation Learning	—Unverified

Show:10 25 50

← PrevPage 273 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified