Efficient Exploration

Efficient Exploration is one of the main obstacles in scaling up modern deep reinforcement learning algorithms. The main challenge in Efficient Exploration is the balance between exploiting current estimates, and gaining information about poorly understood states and actions.

Source: Randomized Value Functions via Multiplicative Normalizing Flows

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 301–325 of 514 papers

Title	Date	Tasks	Status
Lagrangian Manifold Monte Carlo on Monge Patches	Feb 1, 2022	Efficient Exploration	CodeCode Available
Efficient Policy Space Response Oracles	Jan 28, 2022	Efficient Exploration	—Unverified
Learning to Act with Affordance-Aware Multimodal Neural SLAM	Jan 24, 2022	Efficient ExplorationTest unseen	CodeCode Available
Synthesizing explainable counterfactual policies for algorithmic recourse with program synthesis	Jan 18, 2022	counterfactualEfficient Exploration	CodeCode Available
Using Non-Stationary Bandits for Learning in Repeated Cournot Games with Non-Stationary Demand	Jan 3, 2022	Efficient Exploration	—Unverified
JueWu-MC: Playing Minecraft with Sample-efficient Hierarchical Reinforcement Learning	Dec 7, 2021	Efficient ExplorationHierarchical Reinforcement Learning	—Unverified
A Fast and Scalable Polyatomic Frank-Wolfe Algorithm for the LASSO	Dec 6, 2021	compressed sensingEfficient Exploration	CodeCode Available
BooVI: Provably Efficient Bootstrapped Value Iteration	Dec 1, 2021	Efficient ExplorationReinforcement Learning (RL)	—Unverified
HelixMO: Sample-Efficient Molecular Optimization in Scene-Sensitive Latent Space	Nov 30, 2021	Drug DesignDrug Discovery	—Unverified
IB-MVS: An Iterative Algorithm for Deep Multi-View Stereo based on Binary Decisions	Nov 29, 2021	3D ReconstructionEfficient Exploration	—Unverified
Successor Feature Landmarks for Long-Horizon Goal-Conditioned Reinforcement Learning	Nov 18, 2021	Efficient Explorationreinforcement-learning	CodeCode Available
Discovering and Exploiting Sparse Rewards in a Learned Behavior Space	Nov 2, 2021	Efficient Exploration	CodeCode Available
Bayesian optimization of distributed neurodynamical controller models for spatial navigation	Oct 31, 2021	Bayesian OptimizationEfficient Exploration	—Unverified
Accelerating Robotic Reinforcement Learning via Parameterized Action Primitives	Oct 28, 2021	Efficient Explorationreinforcement-learning	—Unverified
Heterogeneous Multi-player Multi-armed Bandits: Closing the Gap and Generalization	Oct 27, 2021	Efficient ExplorationMulti-Armed Bandits	CodeCode Available
Map Induction: Compositional spatial submap learning for efficient exploration in novel environments	Oct 23, 2021	Efficient ExplorationProgram induction	CodeCode Available
More Efficient Exploration with Symbolic Priors on Action Sequence Equivalences	Oct 20, 2021	Efficient ExplorationOpen-Ended Question Answering	—Unverified
Balancing Value Underestimation and Overestimation with Realistic Actor-Critic	Oct 19, 2021	continuous-controlContinuous Control	CodeCode Available
Efficient Exploration in Binary and Preferential Bayesian Optimization	Oct 18, 2021	Bayesian OptimizationEfficient Exploration	—Unverified
Braxlines: Fast and Interactive Toolkit for RL-driven Behavior Engineering beyond Reward Maximization	Oct 10, 2021	continuous-controlContinuous Control	—Unverified
Reinforcement Learning in Reward-Mixing MDPs	Oct 7, 2021	Efficient Explorationreinforcement-learning	—Unverified
Learning to Solve Combinatorial Problems via Efficient Exploration	Sep 29, 2021	Efficient ExplorationReinforcement Learning (RL)	—Unverified
Distributional Perturbation for Efficient Exploration in Distributional Reinforcement Learning	Sep 29, 2021	Atari GamesDescriptive	—Unverified
Divide and Explore: Multi-Agent Separate Exploration with Shared Intrinsic Motivations	Sep 29, 2021	Distributed ComputingEfficient Exploration	—Unverified
Exploratory State Representation Learning	Sep 28, 2021	DiversityEfficient Exploration	CodeCode Available

Show:10 25 50

← PrevPage 13 of 21Next →

No leaderboard results yet.