SOTAVerified

Long-Form Narrative Summarization

Summarizing long-form narratives, such as books, movies, and TV scripts, remains an open challenge in NLP. Unlike news or document summarization, narratives require capturing intricate plotlines, evolving character relationships, and thematic coherence over tens of thousands of tokens. The hybrid structure of narratives, which combines descriptive prose with multi-speaker dialogues, implicit inference, and dynamic topic shifts, adds further complexity, demanding an approach that preserves contextual integrity while condensing information effectively. Furthermore, the sheer length of narrative texts, typically ranging from 40K to 160K tokens, poses significant challenges for standard summarization models.

Title	Date	Tasks	Status	Hype
NexusSum: Hierarchical LLM Agents for Long-Form Narrative Summarization	May 30, 2025	DescriptiveForm	—Unverified	0
Agent-as-Judge for Factual Summarization of Long Narratives	Jan 17, 2025	Long-Form Narrative Summarization	CodeCode Available	1
End-to-End Long Document Summarization using Gradient Caching	Jan 3, 2025	DecoderDocument Summarization	—Unverified	0
MovieSum: An Abstractive Summarization Dataset for Movie Screenplays	Aug 12, 2024	Abstractive Text SummarizationDocument Summarization	CodeCode Available	1
Chain of Agents: Large Language Models Collaborating on Long-Context Tasks	Jun 4, 2024	Code CompletionLong-Form Narrative Summarization	—Unverified	0
Select and Summarize: Scene Saliency for Movie Script Summarization	Apr 4, 2024	Abstractive Text SummarizationLong-Form Narrative Summarization	CodeCode Available	0
BOOKSUM: A Collection of Datasets for Long-form Narrative Summarization	Jan 16, 2022	Abstractive Text SummarizationForm	—Unverified	0
BookSum: A Collection of Datasets for Long-form Narrative Summarization	May 18, 2021	Abstractive Text SummarizationForm	CodeCode Available	1

Title

Status

Hype

NexusSum: Hierarchical LLM Agents for Long-Form Narrative Summarization

—Unverified

Agent-as-Judge for Factual Summarization of Long Narratives

CodeCode Available

End-to-End Long Document Summarization using Gradient Caching

—Unverified

MovieSum: An Abstractive Summarization Dataset for Movie Screenplays

CodeCode Available

Chain of Agents: Large Language Models Collaborating on Long-Context Tasks