Efficient Exploration

Efficient Exploration is one of the main obstacles in scaling up modern deep reinforcement learning algorithms. The main challenge in Efficient Exploration is the balance between exploiting current estimates, and gaining information about poorly understood states and actions.

Source: Randomized Value Functions via Multiplicative Normalizing Flows

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 351–400 of 514 papers

Title	Date	Tasks	Status
Bandit Algorithms for Tree Search	Aug 9, 2014	Efficient ExplorationGame of Go	—Unverified
BayesCNS: A Unified Bayesian Approach to Address Cold Start and Non-Stationarity in Search Systems at Scale	Oct 3, 2024	Efficient ExplorationInformation Retrieval	—Unverified
Bayesian optimisation of large-scale photonic reservoir computers	Apr 6, 2020	Bayesian OptimisationEfficient Exploration	—Unverified
Bayesian optimization of distributed neurodynamical controller models for spatial navigation	Oct 31, 2021	Bayesian OptimizationEfficient Exploration	—Unverified
BBQ-Networks: Efficient Exploration in Deep Reinforcement Learning for Task-Oriented Dialogue Systems	Nov 15, 2017	Deep Reinforcement LearningEfficient Exploration	—Unverified
BBQ-Networks: Efficient Exploration in Deep Reinforcement Learning for Task-Oriented Dialogue Systems	Aug 17, 2016	Deep Reinforcement LearningEfficient Exploration	—Unverified
β-DQN: Improving Deep Q-Learning By Evolving the Behavior	Jan 1, 2025	Deep Reinforcement LearningEfficient Exploration	—Unverified
Better Exploration with Optimistic Actor-Critic	Oct 28, 2019	continuous-controlContinuous Control	—Unverified
Beyond Games: Bringing Exploration to Robots in Real-world	May 1, 2019	Efficient ExplorationReinforcement Learning	—Unverified
Beyond Joint Demonstrations: Personalized Expert Guidance for Efficient Multi-Agent Reinforcement Learning	Mar 13, 2024	Efficient ExplorationMulti-agent Reinforcement Learning	—Unverified
Biased Estimates of Advantages over Path Ensembles	Sep 15, 2019	Atari Gamescontinuous-control	—Unverified
BooVI: Provably Efficient Bootstrapped Value Iteration	Dec 1, 2021	Efficient ExplorationReinforcement Learning (RL)	—Unverified
Braxlines: Fast and Interactive Toolkit for RL-driven Behavior Engineering beyond Reward Maximization	Oct 10, 2021	continuous-controlContinuous Control	—Unverified
CAE: Repurposing the Critic as an Explorer in Deep Reinforcement Learning	Mar 23, 2025	Deep Reinforcement LearningEfficient Exploration	—Unverified
Causal Information Prioritization for Efficient Reinforcement Learning	Feb 14, 2025	continuous-controlContinuous Control	—Unverified
CBOL-Tuner: Classifier-pruned Bayesian optimization to explore temporally structured latent spaces for particle accelerator tuning	Dec 2, 2024	Bayesian OptimizationEfficient Exploration	—Unverified
HelixMO: Sample-Efficient Molecular Optimization in Scene-Sensitive Latent Space	Nov 30, 2021	Drug DesignDrug Discovery	—Unverified
CIM: Constrained Intrinsic Motivation for Sparse-Reward Continuous Control	Nov 28, 2022	continuous-controlContinuous Control	—Unverified
Clustered Reinforcement Learning	Jun 6, 2019	Atari GamesClustering	—Unverified
Comprehensive decision-strategy space exploration for efficient territorial planning strategies	Nov 26, 2019	Efficient Exploration	—Unverified
Computational Discovery of Microstructured Composites with Optimal Stiffness-Toughness Trade-Offs	Feb 1, 2023	Efficient Exploration	—Unverified
Computing low-thrust transfers in the asteroid belt, a comparison between astrodynamical manipulations and a machine learning approach	May 29, 2024	Efficient Exploration	—Unverified
Co-NavGPT: Multi-Robot Cooperative Visual Semantic Navigation Using Vision Language Models	Oct 11, 2023	Common Sense ReasoningEfficient Exploration	—Unverified
Constrained Hybrid Metaheuristic Algorithm for Probabilistic Neural Networks Learning	Jan 26, 2025	Efficient Exploration	—Unverified
Context-Dependent Upper-Confidence Bounds for Directed Exploration	Nov 15, 2018	Efficient ExplorationReinforcement Learning	—Unverified
Contextual Decision Processes with Low Bellman Rank are PAC-Learnable	Oct 29, 2016	Efficient Explorationreinforcement-learning	—Unverified
Contextual Similarity Distillation: Ensemble Uncertainties with a Single Model	Mar 14, 2025	Bayesian InferenceEfficient Exploration	—Unverified
Bridging Text and Crystal Structures: Literature-driven Contrastive Learning for Materials Science	Jan 22, 2025	Contrastive LearningEfficient Exploration	—Unverified
Credit Assignment and Efficient Exploration based on Influence Scope in Multi-agent Reinforcement Learning	May 13, 2025	Efficient ExplorationMulti-agent Reinforcement Learning	—Unverified
Curiosity in exploring chemical space: Intrinsic rewards for deep molecular reinforcement learning	Dec 17, 2020	Efficient Explorationreinforcement-learning	—Unverified
Curious Exploration via Structured World Models Yields Zero-Shot Object Manipulation	Jun 22, 2022	Efficient ExplorationObject	—Unverified
CURO: Curriculum Learning for Relative Overgeneralization	Dec 6, 2022	Efficient ExplorationMulti-agent Reinforcement Learning	—Unverified
Data-Efficient Exploration with Self Play for Atari	Jun 13, 2021	Efficient ExplorationReinforcement Learning (RL)	—Unverified
Deep Active Ensemble Sampling For Image Classification	Oct 11, 2022	Active LearningClassification	—Unverified
Deep density networks and uncertainty in recommender systems	Nov 7, 2017	Collaborative FilteringEfficient Exploration	—Unverified
Deep exploration by novelty-pursuit with maximum state entropy	Sep 25, 2019	Efficient ExplorationMuJoCo	—Unverified
Deep Exploration via Randomized Value Functions	Mar 22, 2017	Efficient Explorationreinforcement-learning	—Unverified
DEEPGONET: Multi-label Prediction of GO Annotation for Protein from Sequence Using Cascaded Convolutional and Recurrent Network	Oct 31, 2018	Efficient Exploration	—Unverified
Deep Neural Linear Bandits: Overcoming Catastrophic Forgetting through Likelihood Matching	Jan 24, 2019	Decision MakingEfficient Exploration	—Unverified
Design of Convolutional Extreme Learning Machines for Vision-Based Navigation Around Small Bodies	Oct 28, 2022	Efficient Exploration	—Unverified
Deterministic Sequencing of Exploration and Exploitation for Reinforcement Learning	Sep 12, 2022	Efficient Explorationreinforcement-learning	—Unverified
Differentially Evolving Memory Ensembles: Pareto Optimization based on Computational Intelligence for Embedded Memories on a System Level	Sep 20, 2021	Efficient Exploration	—Unverified
DiffExp: Efficient Exploration in Reward Fine-tuning for Text-to-Image Diffusion Models	Feb 19, 2025	DiversityEfficient Exploration	—Unverified
Diffusion Augmented Agents: A Framework for Efficient Exploration and Transfer Learning	Jul 30, 2024	Efficient ExplorationLanguage Modeling	—Unverified
Diffusion-ES: Gradient-free Planning with Diffusion for Autonomous and Instruction-guided Driving	Jan 1, 2024	Autonomous DrivingDenoising	—Unverified
Diffusion Models Meet Contextual Bandits with Large Action Spaces	Feb 15, 2024	Efficient ExplorationMulti-Armed Bandits	—Unverified
Directed Exploration for Reinforcement Learning	Jun 18, 2019	Efficient Explorationreinforcement-learning	—Unverified
Directed Exploration in PAC Model-Free Reinforcement Learning	Aug 31, 2018	Efficient Explorationmodel	—Unverified
DISCO-10M: A Large-Scale Music Dataset	Jun 23, 2023	Efficient Exploration	—Unverified
Discovering Context Specific Causal Relationships	Aug 20, 2018	Causal InferenceDecision Making	—Unverified

Show:10 25 50

← PrevPage 8 of 11Next →

No leaderboard results yet.