Efficient Exploration

Efficient Exploration is one of the main obstacles in scaling up modern deep reinforcement learning algorithms. The main challenge in Efficient Exploration is the balance between exploiting current estimates, and gaining information about poorly understood states and actions.

Source: Randomized Value Functions via Multiplicative Normalizing Flows

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–100 of 514 papers

Title	Date	Tasks	Status	Hype
Adversarially Guided Actor-Critic	Feb 8, 2021	Deep Reinforcement LearningEfficient Exploration	CodeCode Available	1
BeBold: Exploration Beyond the Boundary of Explored Regions	Dec 15, 2020	Deep Reinforcement LearningEfficient Exploration	CodeCode Available	1
Hybrid Genetic Search for the CVRP: Open-Source Implementation and SWAP* Neighborhood	Nov 23, 2020	Combinatorial OptimizationEfficient Exploration	CodeCode Available	1
Latent World Models For Intrinsically Motivated Exploration	Oct 5, 2020	Efficient ExplorationNovelty Detection	CodeCode Available	1
Novelty Search in Representational Space for Sample Efficient Exploration	Sep 28, 2020	Efficient Exploration	CodeCode Available	1
Occupancy Anticipation for Efficient Exploration and Navigation	Aug 21, 2020	Decision MakingEfficient Exploration	CodeCode Available	1
DeepDrummer : Generating Drum Loops using Deep Learning and a Human in the Loop	Aug 10, 2020	Active LearningEfficient Exploration	CodeCode Available	1
SUNRISE: A Simple Unified Framework for Ensemble Learning in Deep Reinforcement Learning	Jul 9, 2020	Deep Reinforcement LearningDiversity	CodeCode Available	1
See, Hear, Explore: Curiosity via Audio-Visual Association	Jul 7, 2020	Efficient Exploration	CodeCode Available	1
MetaCURE: Meta Reinforcement Learning with Empowerment-Driven Exploration	Jun 15, 2020	Efficient ExplorationMeta Reinforcement Learning	CodeCode Available	1
Shared Experience Actor-Critic for Multi-Agent Reinforcement Learning	Jun 12, 2020	Efficient ExplorationMulti-agent Reinforcement Learning	CodeCode Available	1
Scaling MAP-Elites to Deep Neuroevolution	Mar 3, 2020	DiversityEfficient Exploration	CodeCode Available	1
Optimistic Exploration even with a Pessimistic Initialisation	Feb 26, 2020	Efficient ExplorationQ-Learning	CodeCode Available	1
Meta Reinforcement Learning with Autonomous Inference of Subtask Dependencies	Jan 1, 2020	Efficient ExplorationMeta Reinforcement Learning	CodeCode Available	1
Self-Supervised Exploration via Disagreement	Jun 10, 2019	Active LearningEfficient Exploration	CodeCode Available	1
Learning Exploration Policies for Navigation	Mar 5, 2019	Efficient ExplorationGeneral Reinforcement Learning	CodeCode Available	1
Model-Based Active Exploration	Oct 29, 2018	Efficient Explorationmodel	CodeCode Available	1
Automatic chemical design using a data-driven continuous representation of molecules	Oct 7, 2016	DecoderEfficient Exploration	CodeCode Available	1
MOORL: A Framework for Integrating Offline-Online Reinforcement Learning	Jun 11, 2025	D4RLDeep Reinforcement Learning	—Unverified	0
Go-Browse: Training Web Agents with Structured Exploration	Jun 4, 2025	Efficient ExplorationLanguage Modeling	—Unverified	0
DrSR: LLM based Scientific Equation Discovery with Dual Reasoning from Data and Experience	Jun 4, 2025	Efficient ExplorationEquation Discovery	—Unverified	0
WoMAP: World Models For Embodied Open-Vocabulary Object Localization	Jun 2, 2025	Active Object LocalizationEfficient Exploration	—Unverified	0
HelixDesign-Binder: A Scalable Production-Grade Platform for Binder Design Built on HelixFold3	May 28, 2025	BenchmarkingEfficient Exploration	—Unverified	0
DISCOVER: Automated Curricula for Sparse-Reward Reinforcement Learning	May 26, 2025	Efficient Explorationreinforcement-learning	CodeCode Available	0
STAR-R1: Spacial TrAnsformation Reasoning by Reinforcing Multimodal LLMs	May 21, 2025	Efficient ExplorationReinforcement Learning (RL)	CodeCode Available	0
Comparative Analysis of Black-Box Optimization Methods for Weather Intervention Design	May 16, 2025	Bayesian OptimizationEfficient Exploration	—Unverified	0
IN-RIL: Interleaved Reinforcement and Imitation Learning for Policy Fine-Tuning	May 15, 2025	Efficient ExplorationImitation Learning	CodeCode Available	0
Language Agents Mirror Human Causal Reasoning Biases. How Can We Help Them Think Like Scientists?	May 14, 2025	Efficient Exploration	—Unverified	0
Distilling Realizable Students from Unrealizable Teachers	May 14, 2025	Efficient ExplorationImitation Learning	—Unverified	0
Credit Assignment and Efficient Exploration based on Influence Scope in Multi-agent Reinforcement Learning	May 13, 2025	Efficient ExplorationMulti-agent Reinforcement Learning	—Unverified	0
Interpretable SHAP-bounded Bayesian Optimization for Underwater Acoustic Metamaterial Coating Design	May 10, 2025	Bayesian OptimizationEfficient Exploration	—Unverified	0
An Explainable Nature-Inspired Framework for Monkeypox Diagnosis: Xception Features Combined with NGBoost and African Vultures Optimization Algorithm	Apr 24, 2025	DiagnosticDimensionality Reduction	—Unverified	0
Aerial Active STAR-RIS-assisted Satellite-Terrestrial Covert Communications	Apr 22, 2025	Deep Reinforcement LearningDenoising	—Unverified	0
Lumos: Efficient Performance Modeling and Estimation for Large-scale LLM Training	Apr 12, 2025	Efficient Exploration	—Unverified	0
Memetic Search for Green Vehicle Routing Problem with Private Capacitated Refueling Stations	Apr 6, 2025	Efficient Exploration	—Unverified	0
From Automation to Autonomy in Smart Manufacturing: A Bayesian Optimization Framework for Modeling Multi-Objective Experimentation and Sequential Decision Making	Apr 5, 2025	Bayesian OptimizationData Integration	—Unverified	0
Entropy-guided sequence weighting for efficient exploration in RL-based LLM fine-tuning	Mar 28, 2025	Efficient ExplorationLanguage Modeling	—Unverified	0
Maya: Optimizing Deep Learning Training Workloads using Emulated Virtual Accelerators	Mar 26, 2025	Deep LearningEfficient Exploration	—Unverified	0
FALCONEye: Finding Answers and Localizing Content in ONE-hour-long videos with multi-modal LLMs	Mar 25, 2025	Efficient ExplorationInformation Retrieval	—Unverified	0
KEA: Keeping Exploration Alive by Proactively Coordinating Exploration Strategies	Mar 23, 2025	continuous-controlContinuous Control	—Unverified	0
CAE: Repurposing the Critic as an Explorer in Deep Reinforcement Learning	Mar 23, 2025	Deep Reinforcement LearningEfficient Exploration	—Unverified	0
Disentangling Uncertainties by Learning Compressed Data Representation	Mar 20, 2025	Efficient ExplorationGaussian Processes	CodeCode Available	0
Contextual Similarity Distillation: Ensemble Uncertainties with a Single Model	Mar 14, 2025	Bayesian InferenceEfficient Exploration	—Unverified	0
HyperArm Bandit Optimization: A Novel approach to Hyperparameter Optimization and an Analysis of Bandit Algorithms in Stochastic and Adversarial Settings	Mar 13, 2025	Bayesian OptimizationComputational Efficiency	—Unverified	0
Is a Good Foundation Necessary for Efficient Reinforcement Learning? The Computational Role of the Base Model in Exploration	Mar 10, 2025	Efficient Exploration	—Unverified	0
Reward-Centered ReST-MCTS: A Robust Decision-Making Framework for Robotic Manipulation in High Uncertainty Environments	Mar 7, 2025	Decision MakingEfficient Exploration	CodeCode Available	0
Probabilistic Insights for Efficient Exploration Strategies in Reinforcement Learning	Mar 5, 2025	DiversityEfficient Exploration	—Unverified	0
A Transformer Model for Predicting Chemical Reaction Products from Generic Templates	Mar 4, 2025	Computational chemistryEfficient Exploration	—Unverified	0
On Space-Filling Input Design for Nonlinear Dynamic Model Learning: A Gaussian Process Approach	Feb 24, 2025	Efficient Exploration	—Unverified	0
Synergistic Fusion of Multi-Source Knowledge via Evidence Theory for High-Entropy Alloy Discovery	Feb 20, 2025	Efficient ExplorationTransfer Learning	—Unverified	0

Show:10 25 50

← PrevPage 2 of 11Next →

No leaderboard results yet.