Efficient Exploration

Efficient Exploration is one of the main obstacles in scaling up modern deep reinforcement learning algorithms. The main challenge in Efficient Exploration is the balance between exploiting current estimates, and gaining information about poorly understood states and actions.

Source: Randomized Value Functions via Multiplicative Normalizing Flows

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–50 of 514 papers

Title	Date	Tasks	Status	Hype
MOORL: A Framework for Integrating Offline-Online Reinforcement Learning	Jun 11, 2025	D4RLDeep Reinforcement Learning	—Unverified	0
Go-Browse: Training Web Agents with Structured Exploration	Jun 4, 2025	Efficient ExplorationLanguage Modeling	—Unverified	0
DrSR: LLM based Scientific Equation Discovery with Dual Reasoning from Data and Experience	Jun 4, 2025	Efficient ExplorationEquation Discovery	—Unverified	0
WoMAP: World Models For Embodied Open-Vocabulary Object Localization	Jun 2, 2025	Active Object LocalizationEfficient Exploration	—Unverified	0
MermaidFlow: Redefining Agentic Workflow Generation via Safety-Constrained Evolutionary Programming	May 29, 2025	DiversityEfficient Exploration	CodeCode Available	2
HelixDesign-Binder: A Scalable Production-Grade Platform for Binder Design Built on HelixFold3	May 28, 2025	BenchmarkingEfficient Exploration	—Unverified	0
DISCOVER: Automated Curricula for Sparse-Reward Reinforcement Learning	May 26, 2025	Efficient Explorationreinforcement-learning	CodeCode Available	0
STAR-R1: Spacial TrAnsformation Reasoning by Reinforcing Multimodal LLMs	May 21, 2025	Efficient ExplorationReinforcement Learning (RL)	CodeCode Available	0
Comparative Analysis of Black-Box Optimization Methods for Weather Intervention Design	May 16, 2025	Bayesian OptimizationEfficient Exploration	—Unverified	0
IN-RIL: Interleaved Reinforcement and Imitation Learning for Policy Fine-Tuning	May 15, 2025	Efficient ExplorationImitation Learning	CodeCode Available	0
Language Agents Mirror Human Causal Reasoning Biases. How Can We Help Them Think Like Scientists?	May 14, 2025	Efficient Exploration	—Unverified	0
Distilling Realizable Students from Unrealizable Teachers	May 14, 2025	Efficient ExplorationImitation Learning	—Unverified	0
Credit Assignment and Efficient Exploration based on Influence Scope in Multi-agent Reinforcement Learning	May 13, 2025	Efficient ExplorationMulti-agent Reinforcement Learning	—Unverified	0
Interpretable SHAP-bounded Bayesian Optimization for Underwater Acoustic Metamaterial Coating Design	May 10, 2025	Bayesian OptimizationEfficient Exploration	—Unverified	0
An Explainable Nature-Inspired Framework for Monkeypox Diagnosis: Xception Features Combined with NGBoost and African Vultures Optimization Algorithm	Apr 24, 2025	DiagnosticDimensionality Reduction	—Unverified	0
ForesightNav: Learning Scene Imagination for Efficient Exploration	Apr 22, 2025	Efficient ExplorationNavigate	CodeCode Available	2
Aerial Active STAR-RIS-assisted Satellite-Terrestrial Covert Communications	Apr 22, 2025	Deep Reinforcement LearningDenoising	—Unverified	0
Lumos: Efficient Performance Modeling and Estimation for Large-scale LLM Training	Apr 12, 2025	Efficient Exploration	—Unverified	0
Memetic Search for Green Vehicle Routing Problem with Private Capacitated Refueling Stations	Apr 6, 2025	Efficient Exploration	—Unverified	0
From Automation to Autonomy in Smart Manufacturing: A Bayesian Optimization Framework for Modeling Multi-Objective Experimentation and Sequential Decision Making	Apr 5, 2025	Bayesian OptimizationData Integration	—Unverified	0
Entropy-guided sequence weighting for efficient exploration in RL-based LLM fine-tuning	Mar 28, 2025	Efficient ExplorationLanguage Modeling	—Unverified	0
Maya: Optimizing Deep Learning Training Workloads using Emulated Virtual Accelerators	Mar 26, 2025	Deep LearningEfficient Exploration	—Unverified	0
FALCONEye: Finding Answers and Localizing Content in ONE-hour-long videos with multi-modal LLMs	Mar 25, 2025	Efficient ExplorationInformation Retrieval	—Unverified	0
CAE: Repurposing the Critic as an Explorer in Deep Reinforcement Learning	Mar 23, 2025	Deep Reinforcement LearningEfficient Exploration	—Unverified	0
KEA: Keeping Exploration Alive by Proactively Coordinating Exploration Strategies	Mar 23, 2025	continuous-controlContinuous Control	—Unverified	0
Disentangling Uncertainties by Learning Compressed Data Representation	Mar 20, 2025	Efficient ExplorationGaussian Processes	CodeCode Available	0
Contextual Similarity Distillation: Ensemble Uncertainties with a Single Model	Mar 14, 2025	Bayesian InferenceEfficient Exploration	—Unverified	0
HyperArm Bandit Optimization: A Novel approach to Hyperparameter Optimization and an Analysis of Bandit Algorithms in Stochastic and Adversarial Settings	Mar 13, 2025	Bayesian OptimizationComputational Efficiency	—Unverified	0
Is a Good Foundation Necessary for Efficient Reinforcement Learning? The Computational Role of the Base Model in Exploration	Mar 10, 2025	Efficient Exploration	—Unverified	0
Reward-Centered ReST-MCTS: A Robust Decision-Making Framework for Robotic Manipulation in High Uncertainty Environments	Mar 7, 2025	Decision MakingEfficient Exploration	CodeCode Available	0
Probabilistic Insights for Efficient Exploration Strategies in Reinforcement Learning	Mar 5, 2025	DiversityEfficient Exploration	—Unverified	0
A Transformer Model for Predicting Chemical Reaction Products from Generic Templates	Mar 4, 2025	Computational chemistryEfficient Exploration	—Unverified	0
Contextualizing biological perturbation experiments through language	Feb 28, 2025	Efficient Exploration	CodeCode Available	1
Training a Generally Curious Agent	Feb 24, 2025	Decision MakingEfficient Exploration	CodeCode Available	1
On Space-Filling Input Design for Nonlinear Dynamic Model Learning: A Gaussian Process Approach	Feb 24, 2025	Efficient Exploration	—Unverified	0
Synergistic Fusion of Multi-Source Knowledge via Evidence Theory for High-Entropy Alloy Discovery	Feb 20, 2025	Efficient ExplorationTransfer Learning	—Unverified	0
Mem2Ego: Empowering Vision-Language Models with Global-to-Ego Memory for Long-Horizon Embodied Navigation	Feb 20, 2025	Decision MakingEfficient Exploration	—Unverified	0
FragFM: Hierarchical Framework for Efficient Molecule Generation via Fragment-Level Discrete Flow Matching	Feb 19, 2025	DiversityDrug Discovery	—Unverified	0
DiffExp: Efficient Exploration in Reward Fine-tuning for Text-to-Image Diffusion Models	Feb 19, 2025	DiversityEfficient Exploration	—Unverified	0
Finedeep: Mitigating Sparse Activation in Dense LLMs via Multi-Layer Fine-Grained Experts	Feb 18, 2025	Efficient Exploration	—Unverified	0
Maximum Entropy Reinforcement Learning with Diffusion Policy	Feb 17, 2025	Efficient ExplorationMuJoCo	CodeCode Available	1
Massively Scaling Explicit Policy-conditioned Value Functions	Feb 17, 2025	continuous-controlContinuous Control	—Unverified	0
Causal Information Prioritization for Efficient Reinforcement Learning	Feb 14, 2025	continuous-controlContinuous Control	—Unverified	0
Exploratory Diffusion Model for Unsupervised Reinforcement Learning	Feb 11, 2025	Efficient Explorationmodel	—Unverified	0
Guided Exploration for Efficient Relational Model Learning	Feb 10, 2025	Efficient Explorationmodel	—Unverified	0
Few-shot_LLM_Synthetic_Data_with_Distribution_Matching	Feb 9, 2025	AttributeEfficient Exploration	CodeCode Available	0
Adaptive Exploration for Multi-Reward Multi-Policy Evaluation	Feb 4, 2025	Efficient Exploration	—Unverified	0
GNN-DT: Graph Neural Network Enhanced Decision Transformer for Efficient Optimization in Dynamic Environments	Feb 3, 2025	Efficient ExplorationGraph Neural Network	CodeCode Available	1
Langevin Soft Actor-Critic: Efficient Exploration through Uncertainty-Driven Critic Learning	Jan 29, 2025	continuous-controlContinuous Control	CodeCode Available	1
Constrained Hybrid Metaheuristic Algorithm for Probabilistic Neural Networks Learning	Jan 26, 2025	Efficient Exploration	—Unverified	0

Show:10 25 50

← PrevPage 1 of 11Next →

No leaderboard results yet.