Efficient Exploration

Efficient Exploration is one of the main obstacles in scaling up modern deep reinforcement learning algorithms. The main challenge in Efficient Exploration is the balance between exploiting current estimates, and gaining information about poorly understood states and actions.

Source: Randomized Value Functions via Multiplicative Normalizing Flows

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 126–150 of 514 papers

Title	Date	Tasks	Status	Hype
Cognitive Planning for Object Goal Navigation using Generative AI Models	Mar 30, 2024	Efficient ExplorationIn-Context Learning	—Unverified	0
VDSC: Enhancing Exploration Timing with Value Discrepancy and State Counts	Mar 26, 2024	Deep Reinforcement LearningEfficient Exploration	—Unverified	0
Explore until Confident: Efficient Exploration for Embodied Question Answering	Mar 23, 2024	Conformal PredictionEfficient Exploration	—Unverified	0
Safe Reinforcement Learning for Constrained Markov Decision Processes with Stochastic Stopping Time	Mar 23, 2024	Efficient ExplorationSafe Reinforcement Learning	—Unverified	0
A Straightforward Gradient-Based Approach for High-Tc Superconductor Design: Leveraging Domain Knowledge via Adaptive Constraints	Mar 20, 2024	Efficient ExplorationProperty Prediction	—Unverified	0
Hierarchical Spatial Proximity Reasoning for Vision-and-Language Navigation	Mar 18, 2024	Common Sense ReasoningEfficient Exploration	CodeCode Available	0
Diffusion-Reinforcement Learning Hierarchical Motion Planning in Multi-agent Adversarial Games	Mar 16, 2024	Autonomous NavigationEfficient Exploration	CodeCode Available	1
MAMBA: an Effective World Model Approach for Meta-Reinforcement Learning	Mar 14, 2024	Efficient ExplorationMamba	CodeCode Available	1
Beyond Joint Demonstrations: Personalized Expert Guidance for Efficient Multi-Agent Reinforcement Learning	Mar 13, 2024	Efficient ExplorationMulti-agent Reinforcement Learning	—Unverified	0
Scalable Online Exploration via Coverability	Mar 11, 2024	Efficient ExplorationQ-Learning	CodeCode Available	0
A Natural Extension To Online Algorithms For Hybrid RL With Limited Coverage	Mar 7, 2024	Efficient ExplorationReinforcement Learning (RL)	—Unverified	0
Vlearn: Off-Policy Learning with Efficient State-Value Function Estimation	Mar 7, 2024	Deep Reinforcement LearningEfficient Exploration	—Unverified	0
Finding Waldo: Towards Efficient Exploration of NeRF Scene Spaces	Mar 7, 2024	3D ReconstructionEfficient Exploration	—Unverified	0
Noisy Spiking Actor Network for Exploration	Mar 7, 2024	continuous-controlContinuous Control	—Unverified	0
Cradle: Empowering Foundation Agents Towards General Computer Control	Mar 5, 2024	Efficient Exploration	CodeCode Available	7
GenNBV: Generalizable Next-Best-View Policy for Active 3D Reconstruction	Feb 25, 2024	3D ReconstructionActive 3D Reconstruction	CodeCode Available	2
ACE : Off-Policy Actor-Critic with Causality-Aware Entropy Regularization	Feb 22, 2024	continuous-controlContinuous Control	—Unverified	0
Efficient Low-Rank Matrix Estimation, Experimental Design, and Arm-Set-Dependent Low-Rank Bandits	Feb 17, 2024	Computational EfficiencyEfficient Exploration	CodeCode Available	0
Diffusion Models Meet Contextual Bandits with Large Action Spaces	Feb 15, 2024	Efficient ExplorationMulti-Armed Bandits	—Unverified	0
Noise-Adaptive Confidence Sets for Linear Bandits and Application to Bayesian Optimization	Feb 12, 2024	Bayesian OptimizationDecision Making	CodeCode Available	0
Diffusion-ES: Gradient-free Planning with Diffusion for Autonomous Driving and Zero-Shot Instruction Following	Feb 9, 2024	Autonomous DrivingDenoising	CodeCode Available	2
Iterated Denoising Energy Matching for Sampling from Boltzmann Densities	Feb 9, 2024	DenoisingEfficient Exploration	CodeCode Available	2
Safe Guaranteed Exploration for Non-linear Systems	Feb 9, 2024	Efficient ExplorationModel Predictive Control	CodeCode Available	1
A Sober Look at LLMs for Material Discovery: Are They Actually Good for Bayesian Optimization Over Molecules?	Feb 7, 2024	Bayesian OptimizationEfficient Exploration	CodeCode Available	1
LtU-ILI: An All-in-One Framework for Implicit Inference in Astrophysics and Cosmology	Feb 6, 2024	AllBenchmarking	CodeCode Available	2

Show:10 25 50

← PrevPage 6 of 21Next →

No leaderboard results yet.