Efficient Exploration

Efficient Exploration is one of the main obstacles in scaling up modern deep reinforcement learning algorithms. The main challenge in Efficient Exploration is the balance between exploiting current estimates, and gaining information about poorly understood states and actions.

Source: Randomized Value Functions via Multiplicative Normalizing Flows

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–150 of 514 papers

Title	Date	Tasks	Status	Score
Batch Bayesian Optimization via Local Penalization	May 29, 2015	Bayesian OptimisationBayesian Optimization	CodeCode Available	5
Curiosity Driven Exploration of Learned Disentangled Goal Spaces	Jul 4, 2018	DiversityEfficient Exploration	CodeCode Available	5
Learning Dynamic Cognitive Map with Autonomous Navigation	Nov 13, 2024	Autonomous NavigationDecision Making	CodeCode Available	5
Curiosity as a Self-Supervised Method to Improve Exploration in De novo Drug Design	Sep 24, 2023	DiversityDrug Design	CodeCode Available	5
Balancing Value Underestimation and Overestimation with Realistic Actor-Critic	Oct 19, 2021	continuous-controlContinuous Control	CodeCode Available	5
Count-Based Exploration with the Successor Representation	Jul 31, 2018	Atari GamesEfficient Exploration	CodeCode Available	5
Count-Based Exploration in Feature Space for Reinforcement Learning	Jun 25, 2017	Atari GamesEfficient Exploration	CodeCode Available	5
Learning-Driven Exploration for Reinforcement Learning	Jun 17, 2019	Efficient ExplorationFPS Games	CodeCode Available	5
Behavior-Guided Actor-Critic: Improving Exploration via Learning Policy Behavior Representation for Deep Reinforcement Learning	Apr 9, 2021	Deep Reinforcement LearningEfficient Exploration	CodeCode Available	5
Multi-Objective Hyperparameter Selection via Hypothesis Testing on Reliability Graphs	Jan 22, 2025	Efficient Exploration	CodeCode Available	5
Learning to Act with Affordance-Aware Multimodal Neural SLAM	Jan 24, 2022	Efficient ExplorationTest unseen	CodeCode Available	5
A New Bandit Setting Balancing Information from State Evolution and Corrupted Context	Nov 16, 2020	Decision MakingEfficient Exploration	CodeCode Available	5
Better Exploration with Optimistic Actor Critic	Dec 1, 2019	continuous-controlContinuous Control	CodeCode Available	5
Large-Batch, Iteration-Efficient Neural Bayesian Design Optimization	Jun 1, 2023	Bayesian OptimizationEfficient Exploration	CodeCode Available	5
Lagrangian Manifold Monte Carlo on Monge Patches	Feb 1, 2022	Efficient Exploration	CodeCode Available	5
IN-RIL: Interleaved Reinforcement and Imitation Learning for Policy Fine-Tuning	May 15, 2025	Efficient ExplorationImitation Learning	CodeCode Available	5
A Variational Approach to Bayesian Phylogenetic Inference	Apr 16, 2022	Efficient ExplorationVariational Inference	CodeCode Available	5
Instance Temperature Knowledge Distillation	Jun 27, 2024	Decision MakingEfficient Exploration	CodeCode Available	5
A Gradient Sampling Algorithm for Stratified Maps with Applications to Topological Data Analysis	Sep 1, 2021	Efficient ExplorationTopological Data Analysis	CodeCode Available	5
Consensus-based adaptive sampling and approximation for high-dimensional energy landscapes	Nov 8, 2023	Efficient Exploration	CodeCode Available	5
DISCOVER: Automated Curricula for Sparse-Reward Reinforcement Learning	May 26, 2025	Efficient Explorationreinforcement-learning	CodeCode Available	5
Discovering and Exploiting Sparse Rewards in a Learned Behavior Space	Nov 2, 2021	Efficient Exploration	CodeCode Available	5
Information-Directed Exploration for Deep Reinforcement Learning	Dec 18, 2018	Atari GamesDeep Reinforcement Learning	CodeCode Available	5
Disentangling Uncertainties by Learning Compressed Data Representation	Mar 20, 2025	Efficient ExplorationGaussian Processes	CodeCode Available	5
Learning to Seek: Autonomous Source Seeking with Deep Reinforcement Learning Onboard a Nano Drone Microcontroller	Sep 25, 2019	Autonomous NavigationDeep Reinforcement Learning	CodeCode Available	5
OTO Planner: An Efficient Only Travelling Once Exploration Planner for Complex and Unknown Environments	Jun 11, 2024	Efficient Exploration	CodeCode Available	5
ConEx: Efficient Exploration of Big-Data System Configurations for Better Performance	Oct 17, 2019	Efficient Exploration	CodeCode Available	5
Conditionally Optimistic Exploration for Cooperative Deep Multi-Agent Reinforcement Learning	Mar 16, 2023	Efficient ExplorationMulti-agent Reinforcement Learning	CodeCode Available	5
A Fast and Scalable Polyatomic Frank-Wolfe Algorithm for the LASSO	Dec 6, 2021	compressed sensingEfficient Exploration	CodeCode Available	5
Concurrent Meta Reinforcement Learning	Mar 7, 2019	Efficient ExplorationMeta-Learning	CodeCode Available	5
Q-Star Meets Scalable Posterior Sampling: Bridging Theory and Practice via HyperAgent	Feb 5, 2024	Atari GamesAtari Games 100k	CodeCode Available	5
Hierarchically Organized Latent Modules for Exploratory Search in Morphogenetic Systems	Jul 2, 2020	DiversityEfficient Exploration	CodeCode Available	5
Heterogeneous Multi-player Multi-armed Bandits: Closing the Gap and Generalization	Oct 27, 2021	Efficient ExplorationMulti-Armed Bandits	CodeCode Available	5
Hierarchical Spatial Proximity Reasoning for Vision-and-Language Navigation	Mar 18, 2024	Common Sense ReasoningEfficient Exploration	CodeCode Available	5
GenPlan: Generative Sequence Models as Adaptive Planners	Dec 11, 2024	Decision MakingDenoising	CodeCode Available	5
GLIB: Efficient Exploration for Relational Model-Based Reinforcement Learning via Goal-Literal Babbling	Jan 22, 2020	Decision MakingEfficient Exploration	CodeCode Available	5
Collaborative Training of Heterogeneous Reinforcement Learning Agents in Environments with Sparse Rewards: What and When to Share?	Feb 24, 2022	Efficient ExplorationTransfer Learning	CodeCode Available	5
Impact Makes a Sound and Sound Makes an Impact: Sound Guides Representations and Explorations	Aug 4, 2022	Efficient ExplorationUnsupervised Reinforcement Learning	CodeCode Available	5
Efficient Exploration in Average-Reward Constrained Reinforcement Learning: Achieving Near-Optimal Regret With Posterior Sampling	May 29, 2024	Efficient Exploration	CodeCode Available	5
Model-based Reinforcement Learning for Continuous Control with Posterior Sampling	Nov 20, 2020	continuous-controlContinuous Control	CodeCode Available	5
CM3: Cooperative Multi-goal Multi-stage Multi-agent Reinforcement Learning	Sep 13, 2018	Autonomous VehiclesEfficient Exploration	CodeCode Available	5
Few-shot_LLM_Synthetic_Data_with_Distribution_Matching	Feb 9, 2025	AttributeEfficient Exploration	CodeCode Available	5
Federated Control with Hierarchical Multi-Agent Deep Reinforcement Learning	Dec 22, 2017	Deep Reinforcement LearningEfficient Exploration	CodeCode Available	5
Fire Burns, Sword Cuts: Commonsense Inductive Bias for Exploration in Text-based Games	May 1, 2022	Deep Reinforcement LearningEfficient Exploration	CodeCode Available	5
Exploring through Random Curiosity with General Value Functions	Nov 18, 2022	Efficient Exploration	CodeCode Available	5
Exploratory State Representation Learning	Sep 28, 2021	DiversityEfficient Exploration	CodeCode Available	5
Goal-Reaching Policy Learning from Non-Expert Observations via Effective Subgoal Guidance	Sep 6, 2024	Efficient Exploration	CodeCode Available	5
Go Beyond Imagination: Maximizing Episodic Reachability with World Models	Aug 25, 2023	Efficient Exploration	CodeCode Available	5
EXPODE: EXploiting POlicy Discrepancy for Efficient Exploration in Multi-agent Reinforcement Learning	May 30, 2023	Efficient ExplorationMulti-agent Reinforcement Learning	CodeCode Available	5
Dynamic Subgoal-based Exploration via Bayesian Optimization	Oct 21, 2019	Bayesian OptimizationEfficient Exploration	CodeCode Available	5

Show:10 25 50

← PrevPage 3 of 11Next →

No leaderboard results yet.