Efficient Exploration

Efficient Exploration is one of the main obstacles in scaling up modern deep reinforcement learning algorithms. The main challenge in Efficient Exploration is the balance between exploiting current estimates, and gaining information about poorly understood states and actions.

Source: Randomized Value Functions via Multiplicative Normalizing Flows

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–150 of 514 papers

Title	Date	Tasks	Status	Hype
Instance Temperature Knowledge Distillation	Jun 27, 2024	Decision MakingEfficient Exploration	CodeCode Available	0
ASCENT: Amplifying Power Side-Channel Resilience via Learning & Monte-Carlo Tree Search	Jun 27, 2024	Efficient Exploration	CodeCode Available	0
AutoRAG-HP: Automatic Online Hyper-Parameter Tuning for Retrieval-Augmented Generation	Jun 27, 2024	AutoMLEfficient Exploration	—Unverified	0
Efficient gPC-based quantification of probabilistic robustness for systems in neuroscience	Jun 19, 2024	Efficient ExplorationUncertainty Quantification	—Unverified	0
Exploration by Learning Diverse Skills through Successor State Measures	Jun 14, 2024	Efficient Exploration	—Unverified	0
World Models with Hints of Large Language Models for Goal Achieving	Jun 11, 2024	Decision MakingEfficient Exploration	—Unverified	0
OTO Planner: An Efficient Only Travelling Once Exploration Planner for Complex and Unknown Environments	Jun 11, 2024	Efficient Exploration	CodeCode Available	0
Robust quantum dots charge autotuning using neural network uncertainty	Jun 7, 2024	Efficient Exploration	CodeCode Available	0
Sound Heuristic Search Value Iteration for Undiscounted POMDPs with Reachability Objectives	Jun 5, 2024	Decision MakingEfficient Exploration	CodeCode Available	0
Efficient Exploration of the Rashomon Set of Rule Set Models	Jun 5, 2024	Decision MakingEfficient Exploration	CodeCode Available	0
NeoRL: Efficient Exploration for Nonepisodic RL	Jun 3, 2024	Efficient ExplorationReinforcement Learning (RL)	—Unverified	0
Computing low-thrust transfers in the asteroid belt, a comparison between astrodynamical manipulations and a machine learning approach	May 29, 2024	Efficient Exploration	—Unverified	0
Efficient Exploration in Average-Reward Constrained Reinforcement Learning: Achieving Near-Optimal Regret With Posterior Sampling	May 29, 2024	Efficient Exploration	CodeCode Available	0
Opinion-Guided Reinforcement Learning	May 27, 2024	Efficient Explorationreinforcement-learning	—Unverified	0
Evolutionary Large Language Model for Automated Feature Transformation	May 25, 2024	Efficient ExplorationEvolutionary Algorithms	CodeCode Available	1
GLaD: Synergizing Molecular Graphs and Language Descriptors for Enhanced Power Conversion Efficiency Prediction in Organic Photovoltaic Devices	May 23, 2024	Decision MakingEfficient Exploration	—Unverified	0
Intrinsic Rewards for Exploration without Harm from Observational Noise: A Simulation Study Based on the Free Energy Principle	May 13, 2024	Efficient ExplorationNavigate	—Unverified	0
Navigating Chemical Space with Latent Flows	May 7, 2024	DiversityDrug Design	CodeCode Available	1
MESA: Cooperative Meta-Exploration in Multi-Agent Learning through Exploiting State-Action Space Structure	May 1, 2024	Efficient ExplorationMuJoCo	—Unverified	0
Efficient Exploration of Image Classifier Failures with Bayesian Optimization and Text-to-Image Models	Apr 26, 2024	AttributeBayesian Optimization	—Unverified	0
Evolutionary Reinforcement Learning via Cooperative Coevolution	Apr 23, 2024	Efficient Explorationreinforcement-learning	—Unverified	0
An Offline Reinforcement Learning Algorithm Customized for Multi-Task Fusion in Large-Scale Recommender Systems	Apr 19, 2024	Efficient ExplorationMulti-Task Learning	—Unverified	0
Sampling for Model Predictive Trajectory Planning in Autonomous Driving using Normalizing Flows	Apr 15, 2024	Autonomous DrivingEfficient Exploration	—Unverified	0
Streamlining Ocean Dynamics Modeling with Fourier Neural Operators: A Multiobjective Hyperparameter and Architecture Optimization Approach	Apr 7, 2024	Efficient ExplorationHyperparameter Optimization	CodeCode Available	7
Learning Off-policy with Model-based Intrinsic Motivation For Active Online Exploration	Mar 31, 2024	continuous-controlContinuous Control	—Unverified	0
Cognitive Planning for Object Goal Navigation using Generative AI Models	Mar 30, 2024	Efficient ExplorationIn-Context Learning	—Unverified	0
VDSC: Enhancing Exploration Timing with Value Discrepancy and State Counts	Mar 26, 2024	Deep Reinforcement LearningEfficient Exploration	—Unverified	0
Explore until Confident: Efficient Exploration for Embodied Question Answering	Mar 23, 2024	Conformal PredictionEfficient Exploration	—Unverified	0
Safe Reinforcement Learning for Constrained Markov Decision Processes with Stochastic Stopping Time	Mar 23, 2024	Efficient ExplorationSafe Reinforcement Learning	—Unverified	0
A Straightforward Gradient-Based Approach for High-Tc Superconductor Design: Leveraging Domain Knowledge via Adaptive Constraints	Mar 20, 2024	Efficient ExplorationProperty Prediction	—Unverified	0
Hierarchical Spatial Proximity Reasoning for Vision-and-Language Navigation	Mar 18, 2024	Common Sense ReasoningEfficient Exploration	CodeCode Available	0
Diffusion-Reinforcement Learning Hierarchical Motion Planning in Multi-agent Adversarial Games	Mar 16, 2024	Autonomous NavigationEfficient Exploration	CodeCode Available	1
MAMBA: an Effective World Model Approach for Meta-Reinforcement Learning	Mar 14, 2024	Efficient ExplorationMamba	CodeCode Available	1
Beyond Joint Demonstrations: Personalized Expert Guidance for Efficient Multi-Agent Reinforcement Learning	Mar 13, 2024	Efficient ExplorationMulti-agent Reinforcement Learning	—Unverified	0
Scalable Online Exploration via Coverability	Mar 11, 2024	Efficient ExplorationQ-Learning	CodeCode Available	0
A Natural Extension To Online Algorithms For Hybrid RL With Limited Coverage	Mar 7, 2024	Efficient ExplorationReinforcement Learning (RL)	—Unverified	0
Vlearn: Off-Policy Learning with Efficient State-Value Function Estimation	Mar 7, 2024	Deep Reinforcement LearningEfficient Exploration	—Unverified	0
Finding Waldo: Towards Efficient Exploration of NeRF Scene Spaces	Mar 7, 2024	3D ReconstructionEfficient Exploration	—Unverified	0
Noisy Spiking Actor Network for Exploration	Mar 7, 2024	continuous-controlContinuous Control	—Unverified	0
Cradle: Empowering Foundation Agents Towards General Computer Control	Mar 5, 2024	Efficient Exploration	CodeCode Available	7
GenNBV: Generalizable Next-Best-View Policy for Active 3D Reconstruction	Feb 25, 2024	3D ReconstructionActive 3D Reconstruction	CodeCode Available	2
ACE : Off-Policy Actor-Critic with Causality-Aware Entropy Regularization	Feb 22, 2024	continuous-controlContinuous Control	—Unverified	0
Efficient Low-Rank Matrix Estimation, Experimental Design, and Arm-Set-Dependent Low-Rank Bandits	Feb 17, 2024	Computational EfficiencyEfficient Exploration	CodeCode Available	0
Diffusion Models Meet Contextual Bandits with Large Action Spaces	Feb 15, 2024	Efficient ExplorationMulti-Armed Bandits	—Unverified	0
Noise-Adaptive Confidence Sets for Linear Bandits and Application to Bayesian Optimization	Feb 12, 2024	Bayesian OptimizationDecision Making	CodeCode Available	0
Diffusion-ES: Gradient-free Planning with Diffusion for Autonomous Driving and Zero-Shot Instruction Following	Feb 9, 2024	Autonomous DrivingDenoising	CodeCode Available	2
Iterated Denoising Energy Matching for Sampling from Boltzmann Densities	Feb 9, 2024	DenoisingEfficient Exploration	CodeCode Available	2
Safe Guaranteed Exploration for Non-linear Systems	Feb 9, 2024	Efficient ExplorationModel Predictive Control	CodeCode Available	1
A Sober Look at LLMs for Material Discovery: Are They Actually Good for Bayesian Optimization Over Molecules?	Feb 7, 2024	Bayesian OptimizationEfficient Exploration	CodeCode Available	1
LtU-ILI: An All-in-One Framework for Implicit Inference in Astrophysics and Cosmology	Feb 6, 2024	AllBenchmarking	CodeCode Available	2

Show:10 25 50

← PrevPage 3 of 11Next →

No leaderboard results yet.