Efficient Exploration

Efficient Exploration is one of the main obstacles in scaling up modern deep reinforcement learning algorithms. The main challenge in Efficient Exploration is the balance between exploiting current estimates, and gaining information about poorly understood states and actions.

Source: Randomized Value Functions via Multiplicative Normalizing Flows

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 21–30 of 514 papers

Title	Date	Tasks	Status
Entropy-guided sequence weighting for efficient exploration in RL-based LLM fine-tuning	Mar 28, 2025	Efficient ExplorationLanguage Modeling	—Unverified
Maya: Optimizing Deep Learning Training Workloads using Emulated Virtual Accelerators	Mar 26, 2025	Deep LearningEfficient Exploration	—Unverified
FALCONEye: Finding Answers and Localizing Content in ONE-hour-long videos with multi-modal LLMs	Mar 25, 2025	Efficient ExplorationInformation Retrieval	—Unverified
CAE: Repurposing the Critic as an Explorer in Deep Reinforcement Learning	Mar 23, 2025	Deep Reinforcement LearningEfficient Exploration	—Unverified
KEA: Keeping Exploration Alive by Proactively Coordinating Exploration Strategies	Mar 23, 2025	continuous-controlContinuous Control	—Unverified
Disentangling Uncertainties by Learning Compressed Data Representation	Mar 20, 2025	Efficient ExplorationGaussian Processes	CodeCode Available
Contextual Similarity Distillation: Ensemble Uncertainties with a Single Model	Mar 14, 2025	Bayesian InferenceEfficient Exploration	—Unverified
HyperArm Bandit Optimization: A Novel approach to Hyperparameter Optimization and an Analysis of Bandit Algorithms in Stochastic and Adversarial Settings	Mar 13, 2025	Bayesian OptimizationComputational Efficiency	—Unverified
Is a Good Foundation Necessary for Efficient Reinforcement Learning? The Computational Role of the Base Model in Exploration	Mar 10, 2025	Efficient Exploration	—Unverified
Reward-Centered ReST-MCTS: A Robust Decision-Making Framework for Robotic Manipulation in High Uncertainty Environments	Mar 7, 2025	Decision MakingEfficient Exploration	CodeCode Available

Show:10 25 50

← PrevPage 3 of 52Next →

No leaderboard results yet.