Efficient Exploration

Efficient Exploration is one of the main obstacles in scaling up modern deep reinforcement learning algorithms. The main challenge in Efficient Exploration is the balance between exploiting current estimates, and gaining information about poorly understood states and actions.

Source: Randomized Value Functions via Multiplicative Normalizing Flows

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 326–350 of 514 papers

Title	Date	Tasks	Status
Exploring More When It Needs in Deep Reinforcement Learning	Sep 28, 2021	continuous-controlContinuous Control	—Unverified
Multi-Agent Embodied Visual Semantic Navigation with Scene Prior Knowledge	Sep 20, 2021	Efficient Exploration	—Unverified
Differentially Evolving Memory Ensembles: Pareto Optimization based on Computational Intelligence for Embedded Memories on a System Level	Sep 20, 2021	Efficient Exploration	—Unverified
Exploration in Deep Reinforcement Learning: From Single-Agent to Multiagent Domain	Sep 14, 2021	Autonomous VehiclesDeep Reinforcement Learning	—Unverified
Bootstrapped Meta-Learning	Sep 9, 2021	Efficient ExplorationFew-Shot Learning	CodeCode Available
A Gradient Sampling Algorithm for Stratified Maps with Applications to Topological Data Analysis	Sep 1, 2021	Efficient ExplorationTopological Data Analysis	CodeCode Available
Learn2Hop: Learned Optimization on Rough Landscapes	Jul 20, 2021	Efficient ExplorationMeta-Learning	—Unverified
Multimodal Reward Shaping for Efficient Exploration in Reinforcement Learning	Jul 19, 2021	Deep Reinforcement LearningEfficient Exploration	—Unverified
Data-Efficient Exploration with Self Play for Atari	Jun 13, 2021	Efficient ExplorationReinforcement Learning (RL)	—Unverified
Impact of detecting clinical trial elements in exploration of COVID-19 literature	May 25, 2021	Efficient ExplorationPICO	—Unverified
Non-decreasing Quantile Function Network with Efficient Exploration for Distributional Reinforcement Learning	May 14, 2021	Atari GamesDistributional Reinforcement Learning	—Unverified
Principled Exploration via Optimistic Bootstrapping and Backward Induction	May 13, 2021	Deep Reinforcement LearningEfficient Exploration	CodeCode Available
MAGMA: An Optimization Framework for Mapping Multiple DNNs on Multiple Accelerator Cores	Apr 28, 2021	Efficient Exploration	—Unverified
Behavior-Guided Actor-Critic: Improving Exploration via Learning Policy Behavior Representation for Deep Reinforcement Learning	Apr 9, 2021	Deep Reinforcement LearningEfficient Exploration	CodeCode Available
Nonlinear model reduction for slow-fast stochastic systems near unknown invariant manifolds	Apr 5, 2021	Efficient Exploration	CodeCode Available
Efficient Optimal Selection for Composited Advertising Creatives with Tree Structure	Mar 2, 2021	Efficient ExplorationThompson Sampling	CodeCode Available
Learning Memory-Dependent Continuous Control from Demonstrations	Feb 18, 2021	continuous-controlContinuous Control	—Unverified
Meta-Thompson Sampling	Feb 11, 2021	Efficient ExplorationMeta-Learning	—Unverified
Online Limited Memory Neural-Linear Bandits with Likelihood Matching	Feb 7, 2021	Efficient ExplorationMulti-Armed Bandits	CodeCode Available
Sparse Reward Exploration via Novelty Search and Emitters	Feb 5, 2021	Efficient Exploration	CodeCode Available
The MineRL 2020 Competition on Sample Efficient Reinforcement Learning using Human Priors	Jan 26, 2021	Decision MakingDeep Reinforcement Learning	—Unverified
Autonomous synthesis of metastable materials	Jan 19, 2021	Active LearningEfficient Exploration	—Unverified
Optimistic Exploration with Backward Bootstrapped Bonus for Deep Reinforcement Learning	Jan 1, 2021	Atari GamesDeep Reinforcement Learning	—Unverified
Entropic Risk-Sensitive Reinforcement Learning: A Meta Regret Framework with Function Approximation	Jan 1, 2021	Efficient Explorationreinforcement-learning	—Unverified
MQES: Max-Q Entropy Search for Efficient Exploration in Continuous Reinforcement Learning	Jan 1, 2021	Efficient ExplorationMuJoCo	—Unverified

Show:10 25 50

← PrevPage 14 of 21Next →

No leaderboard results yet.