Coreference Resolution

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–50 of 880 papers

Title	Date	Tasks	Status	Hype
Labeling supervised fine-tuning data with the scaling law	May 5, 2024	coreference-resolutionCoreference Resolution	CodeCode Available	7
Pythia: A Suite for Analyzing Large Language Models Across Training and Scaling	Apr 3, 2023	Common Sense ReasoningCoreference Resolution	CodeCode Available	6
Zero-Shot Learners for Natural Language Understanding via a Unified Multiple Choice Perspective	Oct 16, 2022	Coreference ResolutionMultiple-choice	CodeCode Available	4
N-Grammer: Augmenting Transformers with latent n-grams	Jul 13, 2022	Common Sense ReasoningCoreference Resolution	CodeCode Available	4
RAKG:Document-level Retrieval Augmented Knowledge Graph Construction	Apr 14, 2025	coreference-resolutionCoreference Resolution	CodeCode Available	3
Scaling Instruction-Finetuned Language Models	Oct 20, 2022	Coreference ResolutionCross-Lingual Question Answering	CodeCode Available	3
ST-MoE: Designing Stable and Transferable Sparse Expert Models	Feb 17, 2022	ARCCommon Sense Reasoning	CodeCode Available	3
Finetuned Language Models Are Zero-Shot Learners	Sep 3, 2021	ARCCommon Sense Reasoning	CodeCode Available	3
Language Models are Few-Shot Learners	May 28, 2020	answerability predictionArticles	CodeCode Available	3
BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding	Oct 11, 2018	Citation Intent ClassificationCommon Sense Reasoning	CodeCode Available	3
Attention Is All You Need	Jun 12, 2017	Abstractive Text SummarizationAll	CodeCode Available	3
Maverick: Efficient and Accurate Coreference Resolution Defying Recent Trends	Jul 31, 2024	coreference-resolutionCoreference Resolution	CodeCode Available	2
The CoT Collection: Improving Zero-shot and Few-shot Learning of Language Models via Chain-of-Thought Fine-Tuning	May 23, 2023	Common Sense ReasoningCommon Sense Reasoning (Zero-Shot)	CodeCode Available	2
LaMini-LM: A Diverse Herd of Distilled Models from Large-Scale Instructions	Apr 27, 2023	Common Sense ReasoningCoreference Resolution	CodeCode Available	2
Hungry Hungry Hippos: Towards Language Modeling with State Space Models	Dec 28, 2022	8kCoreference Resolution	CodeCode Available	2
Crosslingual Generalization through Multitask Finetuning	Nov 3, 2022	Coreference ResolutionCross-Lingual Transfer	CodeCode Available	2
Ask Me Anything: A simple strategy for prompting language models	Oct 5, 2022	Coreference ResolutionNatural Language Inference	CodeCode Available	2
AlexaTM 20B: Few-Shot Learning Using a Large-Scale Multilingual Seq2Seq Model	Aug 2, 2022	Causal Language ModelingCommon Sense Reasoning	CodeCode Available	2
PaLM: Scaling Language Modeling with Pathways	Apr 5, 2022	Auto DebuggingCode Generation	CodeCode Available	2
DeBERTa: Decoding-enhanced BERT with Disentangled Attention	Jun 5, 2020	Common Sense ReasoningCoreference Resolution	CodeCode Available	2
Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer	Oct 23, 2019	Answer GenerationCommon Sense Reasoning	CodeCode Available	2
Synergetic Event Understanding: A Collaborative Approach to Cross-Document Event Coreference Resolution with Large Language Models	Jun 4, 2024	coreference-resolutionCoreference Resolution	CodeCode Available	1
REXEL: An End-to-end Model for Document-Level Relation Extraction and Entity Linking	Apr 19, 2024	Benchmarkingcoreference-resolution	CodeCode Available	1
Seq2seq is All You Need for Coreference Resolution	Oct 20, 2023	Allcoreference-resolution	CodeCode Available	1
2∗n is better than n^2: Decomposing Event Coreference Resolution into Two Tractable Problems	Jul 1, 2023	coreference-resolutionCoreference Resolution	CodeCode Available	1
2 * n is better than n^2: Decomposing Event Coreference Resolution into Two Tractable Problems	May 9, 2023	coreference-resolutionCoreference Resolution	CodeCode Available	1
Radar de Parité: An NLP system to measure gender representation in French news stories	Apr 19, 2023	Articlescoreference-resolution	CodeCode Available	1
Exploring the Benefits of Training Expert Language Models over Instruction Tuning	Feb 7, 2023	Common Sense ReasoningCoreference Resolution	CodeCode Available	1
A Case Study for Compliance as Code with Graphs and Language Models: Public release of the Regulatory Knowledge Graph	Feb 3, 2023	coreference-resolutionCoreference Resolution	CodeCode Available	1
Autoregressive Structured Prediction with Language Models	Oct 26, 2022	Coreference ResolutionNamed Entity Recognition	CodeCode Available	1
Cross-document Event Coreference Search: Task, Dataset and Modeling	Oct 23, 2022	Coreference ResolutionCross Document Coreference Resolution	CodeCode Available	1
Longtonotes: OntoNotes with Longer Coreference Chains	Oct 7, 2022	coreference-resolutionCoreference Resolution	CodeCode Available	1
Guess the Instruction! Flipped Learning Makes Language Models Stronger Zero-Shot Learners	Oct 6, 2022	Common Sense ReasoningCoreference Resolution	CodeCode Available	1
GRAVL-BERT: Graphical Visual-Linguistic Representations for Multimodal Coreference Resolution	Oct 1, 2022	coreference-resolutionCoreference Resolution	CodeCode Available	1
F-coref: Fast, Accurate and Easy to Use Coreference Resolution	Sep 9, 2022	coreference-resolutionCoreference Resolution	CodeCode Available	1
Knowledge Extraction From Texts Based on Wikidata	Jul 1, 2022	coreference-resolutionCoreference Resolution	CodeCode Available	1
End-to-End Chinese Speaker Identification	Jul 1, 2022	coreference-resolutionCoreference Resolution	CodeCode Available	1
Cross-document Misinformation Detection based on Event Graph Reasoning	Jul 1, 2022	Articlescoreference-resolution	CodeCode Available	1
Personal Entity, Concept, and Named Entity Linking in Conversations	Jun 15, 2022	coreference-resolutionCoreference Resolution	CodeCode Available	1
VD-PCR: Improving Visual Dialog with Pronoun Coreference Resolution	May 29, 2022	AI Agentcoreference-resolution	CodeCode Available	1
LingMess: Linguistically Informed Multi Expert Scorers for Coreference Resolution	May 25, 2022	coreference-resolutionCoreference Resolution	CodeCode Available	1
DeepStruct: Pretraining of Language Models for Structure Prediction	May 21, 2022	coreference-resolutionCoreference Resolution	CodeCode Available	1
UL2: Unifying Language Learning Paradigms	May 10, 2022	Arithmetic ReasoningCommon Sense Reasoning	CodeCode Available	1
A Structured Span Selector	May 8, 2022	coreference-resolutionCoreference Resolution	CodeCode Available	1
A sequence-to-sequence approach for document-level relation extraction	Apr 3, 2022	coreference-resolutionCoreference Resolution	CodeCode Available	1
Incorporating Constituent Syntax for Coreference Resolution	Feb 22, 2022	coreference-resolutionCoreference Resolution	CodeCode Available	1
DocAMR: Multi-Sentence AMR Representation and Evaluation	Dec 15, 2021	coreference-resolutionCoreference Resolution	CodeCode Available	1
A Hybrid Rule-Based and Neural Coreference Resolution System with an Evaluation on Dutch Literature	Nov 1, 2021	coreference-resolutionCoreference Resolution	CodeCode Available	1
On Generalization in Coreference Resolution	Sep 20, 2021	coreference-resolutionCoreference Resolution	CodeCode Available	1
Word-Level Coreference Resolution	Sep 9, 2021	coreference-resolutionCoreference Resolution	CodeCode Available	1

Show:10 25 50

← PrevPage 1 of 18Next →

All datasets Winograd Schema Challenge OntoNotes CoNLL-2012 GAP DWIE WikiCoref CoNLL12 LitBank OntoGUM PreCo STM-coref XWinograd EN

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PaLM 540B (fine-tuned)	Accuracy	100	—	Unverified
2	Vega v2 6B (KD-based prompt transfer)	Accuracy	98.6	—	Unverified
3	UL2 20B (fine-tuned)	Accuracy	98.1	—	Unverified
4	Turing NLR v5 XXL 5.4B (fine-tuned)	Accuracy	97.3	—	Unverified
5	ST-MoE-32B 269B (fine-tuned)	Accuracy	96.6	—	Unverified
6	DeBERTa-1.5B	Accuracy	95.9	—	Unverified
7	T5-XXL 11B (fine-tuned)	Accuracy	93.8	—	Unverified
8	ST-MoE-L 4.1B (fine-tuned)	Accuracy	93.3	—	Unverified
9	RoBERTa-WinoGrande 355M	Accuracy	90.1	—	Unverified
10	Flan-T5 XXL (zero -shot)	Accuracy	89.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Maverick_mes	F1	83.6	—	Unverified
2	seq2seq	F1	83.3	—	Unverified
3	ASP+T0-3B	F1	82.3	—	Unverified
4	caw-coref + RoBERTa	F1	81.6	—	Unverified
5	LingMess	F1	81.4	—	Unverified
6	wl-coref + RoBERTa	F1	81	—	Unverified
7	U-MEM + Longformer	F1	80.9	—	Unverified
8	longdoc S (OntoNotes + 60k pseudo-singletons)	F1	80.6	—	Unverified
9	G2GT SpanBERT-large reduced	F1	80.5	—	Unverified
10	G2GT SpanBERT-large overlap	F1	80.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Maverick_mes	Avg F1	83.6	—	Unverified
2	seq2seq	Avg F1	83.3	—	Unverified
3	CorefQA + SpanBERT-large	Avg F1	83.1	—	Unverified
4	ASP+T0-3B	Avg F1	82.3	—	Unverified
5	wl-coref + RoBERTa	Avg F1	81	—	Unverified
6	s2e + Longformer-Large	Avg F1	80.3	—	Unverified
7	SpanBERT + Cluster Merging	Avg F1	80.2	—	Unverified
8	c2f + SpanBERT-Large	Avg F1	80.2	—	Unverified
9	CorefQA + SpanBERT-base	Avg F1	79.9	—	Unverified
10	U-MEM* + SpanBERT-large	Avg F1	79.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Coref-MTL	Overall F1	92.72	—	Unverified
2	ProBERT	Overall F1	92.5	—	Unverified
3	Maverick_incr	Overall F1	91.2	—	Unverified
4	Full Ensemble	Overall F1	90.2	—	Unverified
5	PeTra	F1	85.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	REXEL	Avg. F1	95.12	—	Unverified
2	Joint	Avg. F1	91.6	—	Unverified
3	KB-both	Avg. F1	91.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Maverick_mes	F1	66.8	—	Unverified
2	longdoc S (ON + PreCo + LitBank + 30k pseudo-singletons)	F1	62.5	—	Unverified
3	longdoc S (OntoNotes + PreCo + LitBank)	F1	60.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DeepStruct multi-task w/ finetune	Average F1	73.1	—	Unverified
2	DeepStruct multi-task	Average F1	60.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Maverick_incr	Avg F1	78.3	—	Unverified
2	longdoc S (OntoNotes + PreCo + LitBank)	F1	78.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MTL-coref	Avg F1	68.2	—	Unverified
2	SpanBERT	Avg F1	64.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Maverick_incr	F1	88	—	Unverified
2	longdoc S (OntoNotes + PreCo + LitBank)	F1	87.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BFCR + SpanBERT + Transfer Learning	CoNLL F1	61.4	—	Unverified
2	BFCR + SpanBERT	CoNLL F1	50.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	mT0-13B	Accuracy	81.29	—	Unverified
2	BLOOMZ	Accuracy	69.08	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	mT0-13B	Accuracy	78.31	—	Unverified
2	BLOOMZ	Accuracy	68.67	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	longdoc S (OntoNotes + PreCo + LitBank)	F1	42.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	dali-full-anaphora	Avg F1	77.9	—	Unverified