SOTAVerified|Agents Browse Leaderboard About Blog

NetHack

Mean in-game score over 1000 episodes with random seeds not seen during training. See https://arxiv.org/abs/2006.13760 (Section 2.4 Evaluation Protocol) for details.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11–20 of 28 papers

Title	Date	Tasks	Status	Hype	Score
Skill Set Optimization: Reinforcing Language Model Behavior via Transferable Skills	Feb 5, 2024	Decision MakingLanguage Modeling	CodeCode Available	1	5
NovelD: A Simple yet Effective Exploration Criterion	Dec 1, 2021	Atari GamesDeep Reinforcement Learning	CodeCode Available	1	5
Online Intrinsic Rewards for Decision Making Agents from Large Language Model Feedback	Oct 30, 2024	Decision MakingLanguage Modeling	CodeCode Available	1	5
Playing NetHack with LLMs: Potential & Limitations as Zero-Shot Agents	Mar 1, 2024	Decision MakingMinecraft	CodeCode Available	1	5
Katakomba: Tools and Benchmarks for Data-Driven NetHack	Jun 14, 2023	D4RLNetHack	CodeCode Available	1	5
LuckyMera: a Modular AI Framework for Building Hybrid NetHack Agents	Jul 17, 2023	NetHack	CodeCode Available	1	5
CORA: Benchmarks, Baselines, and Metrics as a Platform for Continual Reinforcement Learning Agents	Oct 19, 2021	NetHackreinforcement-learning	CodeCode Available	1	5
Motif: Intrinsic Motivation from Artificial Intelligence Feedback	Sep 29, 2023	Decision MakingLanguage Modeling	CodeCode Available	1	5
Insights From the NeurIPS 2021 NetHack Challenge	Mar 22, 2022	NetHackReinforcement Learning (RL)	CodeCode Available	0	5
Fine-tuning Reinforcement Learning Models is Secretly a Forgetting Mitigation Problem	Feb 5, 2024	Montezuma's RevengeNetHack	CodeCode Available	0	5

Show:10 25 50

← PrevPage 2 of 3Next →

No leaderboard results yet.