Efficient Exploration

Efficient Exploration is one of the main obstacles in scaling up modern deep reinforcement learning algorithms. The main challenge in Efficient Exploration is the balance between exploiting current estimates, and gaining information about poorly understood states and actions.

Source: Randomized Value Functions via Multiplicative Normalizing Flows

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 251–300 of 514 papers

Title	Date	Tasks	Status	Hype
The split Gibbs sampler revisited: improvements to its algorithmic structure and augmented target distribution	Jun 28, 2022	Data AugmentationDeblurring	CodeCode Available	0
Curious Exploration via Structured World Models Yields Zero-Shot Object Manipulation	Jun 22, 2022	Efficient ExplorationObject	—Unverified	0
A Langevin-like Sampler for Discrete Distributions	Jun 20, 2022	Efficient ExplorationText Generation	CodeCode Available	1
Scalable Exploration for Neural Online Learning to Rank with Perturbed Feedback	Jun 13, 2022	Computational EfficiencyEfficient Exploration	—Unverified	0
On Preemption and Learning in Stochastic Scheduling	May 31, 2022	Efficient ExplorationScheduling	CodeCode Available	0
Sample-Efficient, Exploration-Based Policy Optimisation for Routing Problems	May 31, 2022	Efficient Explorationreinforcement-learning	—Unverified	0
Learning Math Reasoning from Self-Sampled Correct and Partially-Correct Solutions	May 28, 2022	Arithmetic ReasoningEfficient Exploration	CodeCode Available	1
Learning to Solve Combinatorial Graph Partitioning Problems via Efficient Exploration	May 27, 2022	Efficient Explorationgraph partitioning	CodeCode Available	1
Personalized Algorithmic Recourse with Preference Elicitation	May 27, 2022	Efficient Exploration	CodeCode Available	0
SFP: State-free Priors for Exploration in Off-Policy Reinforcement Learning	May 26, 2022	continuous-controlContinuous Control	—Unverified	0
The Sufficiency of Off-Policyness and Soft Clipping: PPO is still Insufficient according to an Off-Policy Measure	May 20, 2022	Efficient ExplorationPolicy Gradient Methods	CodeCode Available	1
Feature and Instance Joint Selection: A Reinforcement Learning Perspective	May 12, 2022	Efficient Explorationfeature selection	—Unverified	0
Fire Burns, Sword Cuts: Commonsense Inductive Bias for Exploration in Text-based Games	May 1, 2022	Deep Reinforcement LearningEfficient Exploration	CodeCode Available	0
On Machine Learning-Driven Surrogates for Sound Transmission Loss Simulations	Apr 25, 2022	BIG-bench Machine LearningDecision Making	CodeCode Available	0
A Variational Approach to Bayesian Phylogenetic Inference	Apr 16, 2022	Efficient ExplorationVariational Inference	CodeCode Available	0
Efficient Exploration via First-Person Behavior Cloning Assisted Rapidly-Exploring Random Trees	Mar 23, 2022	Efficient Exploration	—Unverified	0
TANDEM: Learning Joint Exploration and Decision Making with Tactile Sensors	Mar 1, 2022	Decision MakingEfficient Exploration	—Unverified	0
Collaborative Training of Heterogeneous Reinforcement Learning Agents in Environments with Sparse Rewards: What and When to Share?	Feb 24, 2022	Efficient ExplorationTransfer Learning	CodeCode Available	0
Think Global, Act Local: Dual-scale Graph Transformer for Vision-and-Language Navigation	Feb 23, 2022	Efficient ExplorationNavigate	CodeCode Available	2
Learning Causal Overhypotheses through Exploration in Children and Computational Models	Feb 21, 2022	Causal InferenceEfficient Exploration	—Unverified	0
A Unified Perspective on Value Backup and Exploration in Monte-Carlo Tree Search	Feb 11, 2022	Atari GamesDecision Making	—Unverified	0
Online Decision Transformer	Feb 11, 2022	D4RLEfficient Exploration	CodeCode Available	2
Lagrangian Manifold Monte Carlo on Monge Patches	Feb 1, 2022	Efficient Exploration	CodeCode Available	0
Efficient Policy Space Response Oracles	Jan 28, 2022	Efficient Exploration	—Unverified	0
Learning to Act with Affordance-Aware Multimodal Neural SLAM	Jan 24, 2022	Efficient ExplorationTest unseen	CodeCode Available	0
Synthesizing explainable counterfactual policies for algorithmic recourse with program synthesis	Jan 18, 2022	counterfactualEfficient Exploration	CodeCode Available	0
Using Non-Stationary Bandits for Learning in Repeated Cournot Games with Non-Stationary Demand	Jan 3, 2022	Efficient Exploration	—Unverified	0
JueWu-MC: Playing Minecraft with Sample-efficient Hierarchical Reinforcement Learning	Dec 7, 2021	Efficient ExplorationHierarchical Reinforcement Learning	—Unverified	0
A Fast and Scalable Polyatomic Frank-Wolfe Algorithm for the LASSO	Dec 6, 2021	compressed sensingEfficient Exploration	CodeCode Available	0
BooVI: Provably Efficient Bootstrapped Value Iteration	Dec 1, 2021	Efficient ExplorationReinforcement Learning (RL)	—Unverified	0
NovelD: A Simple yet Effective Exploration Criterion	Dec 1, 2021	Atari GamesDeep Reinforcement Learning	CodeCode Available	1
HelixMO: Sample-Efficient Molecular Optimization in Scene-Sensitive Latent Space	Nov 30, 2021	Drug DesignDrug Discovery	—Unverified	0
IB-MVS: An Iterative Algorithm for Deep Multi-View Stereo based on Binary Decisions	Nov 29, 2021	3D ReconstructionEfficient Exploration	—Unverified	0
Episodic Multi-agent Reinforcement Learning with Curiosity-Driven Exploration	Nov 22, 2021	Efficient ExplorationMulti-agent Reinforcement Learning	CodeCode Available	1
Successor Feature Landmarks for Long-Horizon Goal-Conditioned Reinforcement Learning	Nov 18, 2021	Efficient Explorationreinforcement-learning	CodeCode Available	0
Discovering and Exploiting Sparse Rewards in a Learned Behavior Space	Nov 2, 2021	Efficient Exploration	CodeCode Available	0
Bayesian optimization of distributed neurodynamical controller models for spatial navigation	Oct 31, 2021	Bayesian OptimizationEfficient Exploration	—Unverified	0
Accelerating Robotic Reinforcement Learning via Parameterized Action Primitives	Oct 28, 2021	Efficient Explorationreinforcement-learning	—Unverified	0
Heterogeneous Multi-player Multi-armed Bandits: Closing the Gap and Generalization	Oct 27, 2021	Efficient ExplorationMulti-Armed Bandits	CodeCode Available	0
Landmark-Guided Subgoal Generation in Hierarchical Reinforcement Learning	Oct 26, 2021	Efficient ExplorationHierarchical Reinforcement Learning	CodeCode Available	1
Map Induction: Compositional spatial submap learning for efficient exploration in novel environments	Oct 23, 2021	Efficient ExplorationProgram induction	CodeCode Available	0
Hierarchical Skills for Efficient Exploration	Oct 20, 2021	continuous-controlContinuous Control	CodeCode Available	1
More Efficient Exploration with Symbolic Priors on Action Sequence Equivalences	Oct 20, 2021	Efficient ExplorationOpen-Ended Question Answering	—Unverified	0
Balancing Value Underestimation and Overestimation with Realistic Actor-Critic	Oct 19, 2021	continuous-controlContinuous Control	CodeCode Available	0
Efficient Exploration in Binary and Preferential Bayesian Optimization	Oct 18, 2021	Bayesian OptimizationEfficient Exploration	—Unverified	0
Braxlines: Fast and Interactive Toolkit for RL-driven Behavior Engineering beyond Reward Maximization	Oct 10, 2021	continuous-controlContinuous Control	—Unverified	0
Reinforcement Learning in Reward-Mixing MDPs	Oct 7, 2021	Efficient Explorationreinforcement-learning	—Unverified	0
Divide and Explore: Multi-Agent Separate Exploration with Shared Intrinsic Motivations	Sep 29, 2021	Distributed ComputingEfficient Exploration	—Unverified	0
Learning to Solve Combinatorial Problems via Efficient Exploration	Sep 29, 2021	Efficient ExplorationReinforcement Learning (RL)	—Unverified	0
HyperDQN: A Randomized Exploration Method for Deep Reinforcement Learning	Sep 29, 2021	Deep Reinforcement LearningEfficient Exploration	CodeCode Available	1

Show:10 25 50

← PrevPage 6 of 11Next →

No leaderboard results yet.