Efficient Exploration

Efficient Exploration is one of the main obstacles in scaling up modern deep reinforcement learning algorithms. The main challenge in Efficient Exploration is the balance between exploiting current estimates, and gaining information about poorly understood states and actions.

Source: Randomized Value Functions via Multiplicative Normalizing Flows

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–25 of 514 papers

Title	Date	Tasks	Status	Hype
MOORL: A Framework for Integrating Offline-Online Reinforcement Learning	Jun 11, 2025	D4RLDeep Reinforcement Learning	—Unverified	0
Go-Browse: Training Web Agents with Structured Exploration	Jun 4, 2025	Efficient ExplorationLanguage Modeling	—Unverified	0
DrSR: LLM based Scientific Equation Discovery with Dual Reasoning from Data and Experience	Jun 4, 2025	Efficient ExplorationEquation Discovery	—Unverified	0
WoMAP: World Models For Embodied Open-Vocabulary Object Localization	Jun 2, 2025	Active Object LocalizationEfficient Exploration	—Unverified	0
MermaidFlow: Redefining Agentic Workflow Generation via Safety-Constrained Evolutionary Programming	May 29, 2025	DiversityEfficient Exploration	CodeCode Available	2
HelixDesign-Binder: A Scalable Production-Grade Platform for Binder Design Built on HelixFold3	May 28, 2025	BenchmarkingEfficient Exploration	—Unverified	0
DISCOVER: Automated Curricula for Sparse-Reward Reinforcement Learning	May 26, 2025	Efficient Explorationreinforcement-learning	CodeCode Available	0
STAR-R1: Spacial TrAnsformation Reasoning by Reinforcing Multimodal LLMs	May 21, 2025	Efficient ExplorationReinforcement Learning (RL)	CodeCode Available	0
Comparative Analysis of Black-Box Optimization Methods for Weather Intervention Design	May 16, 2025	Bayesian OptimizationEfficient Exploration	—Unverified	0
IN-RIL: Interleaved Reinforcement and Imitation Learning for Policy Fine-Tuning	May 15, 2025	Efficient ExplorationImitation Learning	CodeCode Available	0
Distilling Realizable Students from Unrealizable Teachers	May 14, 2025	Efficient ExplorationImitation Learning	—Unverified	0
Language Agents Mirror Human Causal Reasoning Biases. How Can We Help Them Think Like Scientists?	May 14, 2025	Efficient Exploration	—Unverified	0
Credit Assignment and Efficient Exploration based on Influence Scope in Multi-agent Reinforcement Learning	May 13, 2025	Efficient ExplorationMulti-agent Reinforcement Learning	—Unverified	0
Interpretable SHAP-bounded Bayesian Optimization for Underwater Acoustic Metamaterial Coating Design	May 10, 2025	Bayesian OptimizationEfficient Exploration	—Unverified	0
An Explainable Nature-Inspired Framework for Monkeypox Diagnosis: Xception Features Combined with NGBoost and African Vultures Optimization Algorithm	Apr 24, 2025	DiagnosticDimensionality Reduction	—Unverified	0
ForesightNav: Learning Scene Imagination for Efficient Exploration	Apr 22, 2025	Efficient ExplorationNavigate	CodeCode Available	2
Aerial Active STAR-RIS-assisted Satellite-Terrestrial Covert Communications	Apr 22, 2025	Deep Reinforcement LearningDenoising	—Unverified	0
Lumos: Efficient Performance Modeling and Estimation for Large-scale LLM Training	Apr 12, 2025	Efficient Exploration	—Unverified	0
Memetic Search for Green Vehicle Routing Problem with Private Capacitated Refueling Stations	Apr 6, 2025	Efficient Exploration	—Unverified	0
From Automation to Autonomy in Smart Manufacturing: A Bayesian Optimization Framework for Modeling Multi-Objective Experimentation and Sequential Decision Making	Apr 5, 2025	Bayesian OptimizationData Integration	—Unverified	0
Entropy-guided sequence weighting for efficient exploration in RL-based LLM fine-tuning	Mar 28, 2025	Efficient ExplorationLanguage Modeling	—Unverified	0
Maya: Optimizing Deep Learning Training Workloads using Emulated Virtual Accelerators	Mar 26, 2025	Deep LearningEfficient Exploration	—Unverified	0
FALCONEye: Finding Answers and Localizing Content in ONE-hour-long videos with multi-modal LLMs	Mar 25, 2025	Efficient ExplorationInformation Retrieval	—Unverified	0
CAE: Repurposing the Critic as an Explorer in Deep Reinforcement Learning	Mar 23, 2025	Deep Reinforcement LearningEfficient Exploration	—Unverified	0
KEA: Keeping Exploration Alive by Proactively Coordinating Exploration Strategies	Mar 23, 2025	continuous-controlContinuous Control	—Unverified	0

Show:10 25 50

← PrevPage 1 of 21Next →

No leaderboard results yet.