Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10276–10300 of 15113 papers

Title	Date	Tasks	Status
Efficient and Robust Reinforcement Learning with Uncertainty-based Value Expansion	Dec 10, 2019	reinforcement-learningReinforcement Learning	—Unverified
Efficient Bayes-Adaptive Reinforcement Learning using Sample-Based Search	May 14, 2012	Model-based Reinforcement Learningreinforcement-learning	—Unverified
Efficient Bayesian Inverse Reinforcement Learning via Conditional Kernel Density Estimation	Nov 22, 2021	BIRLDensity Estimation	—Unverified
Efficient Bayesian Policy Reuse with a Scalable Observation Model in Deep Reinforcement Learning	Apr 16, 2022	Continual LearningDeep Reinforcement Learning	—Unverified
Efficient circuit implementation for coined quantum walks on binary trees and application to reinforcement learning	Oct 13, 2022	reinforcement-learningReinforcement Learning	—Unverified
Efficient collective swimming by harnessing vortices through deep reinforcement learning	Feb 7, 2018	Deep Reinforcement LearningNavigate	—Unverified
Efficient Competitive Self-Play Policy Optimization	Sep 13, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Efficient Compressed Ratio Estimation Using Online Sequential Learning for Edge Computing	Nov 8, 2022	compressed sensingData Compression	—Unverified
Efficient Policy Generation in Multi-Agent Systems via Hypergraph Neural Network	Mar 7, 2022	Decision MakingDeep Reinforcement Learning	—Unverified
Efficient decorrelation of features using Gramian in Reinforcement Learning	Nov 19, 2019	Atari Gamesreinforcement-learning	—Unverified
Efficient Distributed Framework for Collaborative Multi-Agent Reinforcement Learning	May 11, 2022	DiversityMulti-agent Reinforcement Learning	—Unverified
Efficient Domain Coverage for Vehicles with Second-Order Dynamics via Multi-Agent Reinforcement Learning	Nov 11, 2022	Multi-agent Reinforcement LearningReinforcement Learning (RL)	—Unverified
Efficient Drone Mobility Support Using Reinforcement Learning	Nov 21, 2019	Q-Learningreinforcement-learning	—Unverified
Efficient Duple Perturbation Robustness in Low-rank MDPs	Apr 11, 2024	Reinforcement Learning (RL)	—Unverified
Efficient Dynamics Modeling in Interactive Environments with Koopman Theory	Jun 20, 2023	Reinforcement Learning (RL)	—Unverified
Efficient Embedding of Semantic Similarity in Control Policies via Entangled Bisimulation	Jan 28, 2022	Data AugmentationReinforcement Learning (RL)	—Unverified
Efficient entity-based reinforcement learning	Jun 6, 2022	Decision MakingDeep Reinforcement Learning	—Unverified
Efficient Entropy for Policy Gradient with Multidimensional Action Space	Jun 2, 2018	Atari GamesDeep Reinforcement Learning	—Unverified
Efficient Evaluation of Natural Stochastic Policies in Offline Reinforcement Learning	Jun 6, 2020	Off-policy evaluationreinforcement-learning	—Unverified
Efficient Exploration and Value Function Generalization in Deterministic Systems	Dec 1, 2013	Efficient Explorationreinforcement-learning	—Unverified
Efficient Exploration for Model-based Reinforcement Learning with Continuous States and Actions	Sep 28, 2020	Efficient ExplorationGaussian Processes	—Unverified
Efficient Exploration in Constrained Environments with Goal-Oriented Reference Path	Mar 3, 2020	Efficient ExplorationNavigate	—Unverified
Efficient Exploration in Deep Reinforcement Learning: A Novel Bayesian Actor-Critic Algorithm	Aug 19, 2024	Deep Reinforcement LearningEfficient Exploration	—Unverified
Efficient Exploration in Resource-Restricted Reinforcement Learning	Dec 14, 2022	Efficient Explorationreinforcement-learning	—Unverified
Efficient Exploration of Reward Functions in Inverse Reinforcement Learning via Bayesian Optimization	Nov 17, 2020	Bayesian OptimizationEfficient Exploration	—Unverified

Show:10 25 50

← PrevPage 412 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified