Efficient Exploration

Efficient Exploration is one of the main obstacles in scaling up modern deep reinforcement learning algorithms. The main challenge in Efficient Exploration is the balance between exploiting current estimates, and gaining information about poorly understood states and actions.

Source: Randomized Value Functions via Multiplicative Normalizing Flows

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 401–450 of 514 papers

Title	Date	Tasks	Status
Adaptive teachers for amortized samplers	Oct 2, 2024	Decision MakingEfficient Exploration	CodeCode Available
TransNAS-TSAD: Harnessing Transformers for Multi-Objective Neural Architecture Search in Time Series Anomaly Detection	Nov 29, 2023	Anomaly DetectionComputational Efficiency	CodeCode Available
ASCENT: Amplifying Power Side-Channel Resilience via Learning & Monte-Carlo Tree Search	Jun 27, 2024	Efficient Exploration	CodeCode Available
Generalization and Exploration via Randomized Value Functions	Feb 4, 2014	Efficient Explorationreinforcement-learning	CodeCode Available
Personalized Algorithmic Recourse with Preference Elicitation	May 27, 2022	Efficient Exploration	CodeCode Available
Feature Interaction Aware Automated Data Representation Transformation	Sep 29, 2023	Automated Feature EngineeringDecision Making	CodeCode Available
EXPODE: EXploiting POlicy Discrepancy for Efficient Exploration in Multi-agent Reinforcement Learning	May 30, 2023	Efficient ExplorationMulti-agent Reinforcement Learning	CodeCode Available
GenPlan: Generative Sequence Models as Adaptive Planners	Dec 11, 2024	Decision MakingDenoising	CodeCode Available
Exploring through Random Curiosity with General Value Functions	Nov 18, 2022	Efficient Exploration	CodeCode Available
Scalable Exploration via Ensemble++	Jul 18, 2024	Computational EfficiencyDecision Making	CodeCode Available
Randomized Value Functions via Multiplicative Normalizing Flows	Jun 6, 2018	Efficient ExplorationThompson Sampling	CodeCode Available
GLIB: Efficient Exploration for Relational Model-Based Reinforcement Learning via Goal-Literal Babbling	Jan 22, 2020	Decision MakingEfficient Exploration	CodeCode Available
Exploratory State Representation Learning	Sep 28, 2021	DiversityEfficient Exploration	CodeCode Available
The MineRL 2019 Competition on Sample Efficient Reinforcement Learning using Human Priors	Apr 22, 2019	Decision MakingDeep Reinforcement Learning	CodeCode Available
Goal-Reaching Policy Learning from Non-Expert Observations via Effective Subgoal Guidance	Sep 6, 2024	Efficient Exploration	CodeCode Available
Go Beyond Imagination: Maximizing Episodic Reachability with World Models	Aug 25, 2023	Efficient Exploration	CodeCode Available
Receding Horizon Curiosity	Oct 8, 2019	Efficient ExplorationExperimental Design	CodeCode Available
Sound Heuristic Search Value Iteration for Undiscounted POMDPs with Reachability Objectives	Jun 5, 2024	Decision MakingEfficient Exploration	CodeCode Available
Multi-Objective Hyperparameter Selection via Hypothesis Testing on Reliability Graphs	Jan 22, 2025	Efficient Exploration	CodeCode Available
Multi-objective Model-based Policy Search for Data-efficient Learning with Sparse Rewards	Jun 25, 2018	Continuous ControlEfficient Exploration	CodeCode Available
Umbrella Reinforcement Learning -- computationally efficient tool for hard non-linear problems	Nov 21, 2024	Computational EfficiencyEfficient Exploration	CodeCode Available
Multirobot Coverage of Modular Environments	May 5, 2020	Efficient Exploration	CodeCode Available
Sparse Reward Exploration via Novelty Search and Emitters	Feb 5, 2021	Efficient Exploration	CodeCode Available
Count-Based Exploration in Feature Space for Reinforcement Learning	Jun 25, 2017	Atari GamesEfficient Exploration	CodeCode Available
Near Optimal Exploration-Exploitation in Non-Communicating Markov Decision Processes	Jul 6, 2018	Efficient Exploration	CodeCode Available
The split Gibbs sampler revisited: improvements to its algorithmic structure and augmented target distribution	Jun 28, 2022	Data AugmentationDeblurring	CodeCode Available
Heterogeneous Multi-player Multi-armed Bandits: Closing the Gap and Generalization	Oct 27, 2021	Efficient ExplorationMulti-Armed Bandits	CodeCode Available
Hierarchically Organized Latent Modules for Exploratory Search in Morphogenetic Systems	Jul 2, 2020	DiversityEfficient Exploration	CodeCode Available
Neural Contextual Bandits with UCB-based Exploration	Nov 11, 2019	Efficient ExplorationMulti-Armed Bandits	CodeCode Available
Dynamic Subgoal-based Exploration via Bayesian Optimization	Oct 21, 2019	Bayesian OptimizationEfficient Exploration	CodeCode Available
Hierarchical Spatial Proximity Reasoning for Vision-and-Language Navigation	Mar 18, 2024	Common Sense ReasoningEfficient Exploration	CodeCode Available
Estimating Risk and Uncertainty in Deep Reinforcement Learning	May 23, 2019	Bayesian InferenceDeep Reinforcement Learning	CodeCode Available
Q-Star Meets Scalable Posterior Sampling: Bridging Theory and Practice via HyperAgent	Feb 5, 2024	Atari GamesAtari Games 100k	CodeCode Available
Neural Linear Bandits: Overcoming Catastrophic Forgetting through Likelihood Matching	Sep 25, 2019	Efficient ExplorationMulti-Armed Bandits	CodeCode Available
Efficient Optimal Selection for Composited Advertising Creatives with Tree Structure	Mar 2, 2021	Efficient ExplorationThompson Sampling	CodeCode Available
Variance Networks: When Expectation Does Not Meet Your Expectations	Mar 10, 2018	Efficient ExplorationReinforcement Learning	CodeCode Available
STAR-R1: Spacial TrAnsformation Reasoning by Reinforcing Multimodal LLMs	May 21, 2025	Efficient ExplorationReinforcement Learning (RL)	CodeCode Available
Noise-Adaptive Confidence Sets for Linear Bandits and Application to Bayesian Optimization	Feb 12, 2024	Bayesian OptimizationDecision Making	CodeCode Available
Impact Makes a Sound and Sound Makes an Impact: Sound Guides Representations and Explorations	Aug 4, 2022	Efficient ExplorationUnsupervised Reinforcement Learning	CodeCode Available
Noisy Natural Gradient as Variational Inference	Dec 6, 2017	Active LearningEfficient Exploration	CodeCode Available
Noisy Networks for Exploration	Jun 30, 2017	Atari GamesDeep Reinforcement Learning	CodeCode Available
Angrier Birds: Bayesian reinforcement learning	Jan 6, 2016	Efficient ExplorationQ-Learning	CodeCode Available
Reward-Centered ReST-MCTS: A Robust Decision-Making Framework for Robotic Manipulation in High Uncertainty Environments	Mar 7, 2025	Decision MakingEfficient Exploration	CodeCode Available
Efficient Off-Policy Meta-Reinforcement Learning via Probabilistic Context Variables	Mar 19, 2019	Deep Reinforcement LearningEfficient Exploration	CodeCode Available
Nonlinear model reduction for slow-fast stochastic systems near unknown invariant manifolds	Apr 5, 2021	Efficient Exploration	CodeCode Available
A New Bandit Setting Balancing Information from State Evolution and Corrupted Context	Nov 16, 2020	Decision MakingEfficient Exploration	CodeCode Available
Information-Directed Exploration for Deep Reinforcement Learning	Dec 18, 2018	Atari GamesDeep Reinforcement Learning	CodeCode Available
IN-RIL: Interleaved Reinforcement and Imitation Learning for Policy Fine-Tuning	May 15, 2025	Efficient ExplorationImitation Learning	CodeCode Available
Instance Temperature Knowledge Distillation	Jun 27, 2024	Decision MakingEfficient Exploration	CodeCode Available
Consensus-based adaptive sampling and approximation for high-dimensional energy landscapes	Nov 8, 2023	Efficient Exploration	CodeCode Available

Show:10 25 50

← PrevPage 9 of 11Next →

No leaderboard results yet.