Efficient Exploration

Efficient Exploration is one of the main obstacles in scaling up modern deep reinforcement learning algorithms. The main challenge in Efficient Exploration is the balance between exploiting current estimates, and gaining information about poorly understood states and actions.

Source: Randomized Value Functions via Multiplicative Normalizing Flows

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 301–325 of 514 papers

Title	Date	Tasks	Status	Hype
Distributional Perturbation for Efficient Exploration in Distributional Reinforcement Learning	Sep 29, 2021	Atari GamesDescriptive	—Unverified	0
Exploratory State Representation Learning	Sep 28, 2021	DiversityEfficient Exploration	CodeCode Available	0
Exploring More When It Needs in Deep Reinforcement Learning	Sep 28, 2021	continuous-controlContinuous Control	—Unverified	0
Differentially Evolving Memory Ensembles: Pareto Optimization based on Computational Intelligence for Embedded Memories on a System Level	Sep 20, 2021	Efficient Exploration	—Unverified	0
Multi-Agent Embodied Visual Semantic Navigation with Scene Prior Knowledge	Sep 20, 2021	Efficient Exploration	—Unverified	0
Exploration in Deep Reinforcement Learning: From Single-Agent to Multiagent Domain	Sep 14, 2021	Autonomous VehiclesDeep Reinforcement Learning	—Unverified	0
Bootstrapped Meta-Learning	Sep 9, 2021	Efficient ExplorationFew-Shot Learning	CodeCode Available	0
A Gradient Sampling Algorithm for Stratified Maps with Applications to Topological Data Analysis	Sep 1, 2021	Efficient ExplorationTopological Data Analysis	CodeCode Available	0
Strategically Efficient Exploration in Competitive Multi-agent Reinforcement Learning	Jul 30, 2021	Efficient ExplorationMulti-agent Reinforcement Learning	CodeCode Available	1
Learn2Hop: Learned Optimization on Rough Landscapes	Jul 20, 2021	Efficient ExplorationMeta-Learning	—Unverified	0
Multimodal Reward Shaping for Efficient Exploration in Reinforcement Learning	Jul 19, 2021	Deep Reinforcement LearningEfficient Exploration	—Unverified	0
MADE: Exploration via Maximizing Deviation from Explored Regions	Jun 18, 2021	Efficient ExplorationReinforcement Learning (RL)	CodeCode Available	1
Data-Efficient Exploration with Self Play for Atari	Jun 13, 2021	Efficient ExplorationReinforcement Learning (RL)	—Unverified	0
Impact of detecting clinical trial elements in exploration of COVID-19 literature	May 25, 2021	Efficient ExplorationPICO	—Unverified	0
Non-decreasing Quantile Function Network with Efficient Exploration for Distributional Reinforcement Learning	May 14, 2021	Atari GamesDistributional Reinforcement Learning	—Unverified	0
Principled Exploration via Optimistic Bootstrapping and Backward Induction	May 13, 2021	Deep Reinforcement LearningEfficient Exploration	CodeCode Available	0
Deep Bandits Show-Off: Simple and Efficient Exploration with Deep Networks	May 10, 2021	Efficient ExplorationMulti-Armed Bandits	CodeCode Available	1
Paradiseo: From a Modular Framework for Evolutionary Computation to the Automated Design of Metaheuristics ---22 Years of Paradiseo---	May 2, 2021	Efficient ExplorationMetaheuristic Optimization	CodeCode Available	1
MAGMA: An Optimization Framework for Mapping Multiple DNNs on Multiple Accelerator Cores	Apr 28, 2021	Efficient Exploration	—Unverified	0
Behavior-Guided Actor-Critic: Improving Exploration via Learning Policy Behavior Representation for Deep Reinforcement Learning	Apr 9, 2021	Deep Reinforcement LearningEfficient Exploration	CodeCode Available	0
Nonlinear model reduction for slow-fast stochastic systems near unknown invariant manifolds	Apr 5, 2021	Efficient Exploration	CodeCode Available	0
Efficient Optimal Selection for Composited Advertising Creatives with Tree Structure	Mar 2, 2021	Efficient ExplorationThompson Sampling	CodeCode Available	0
State Entropy Maximization with Random Encoders for Efficient Exploration	Feb 18, 2021	Deep Reinforcement LearningEfficient Exploration	CodeCode Available	1
Learning Memory-Dependent Continuous Control from Demonstrations	Feb 18, 2021	continuous-controlContinuous Control	—Unverified	0
Meta-Thompson Sampling	Feb 11, 2021	Efficient ExplorationMeta-Learning	—Unverified	0

Show:10 25 50

← PrevPage 13 of 21Next →

No leaderboard results yet.