Coreference Resolution

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 801–825 of 880 papers

Title	Date	Tasks	Status
COMET-M: Reasoning about Multiple Events in Complex Sentences	May 24, 2023	coreference-resolutionCoreference Resolution	CodeCode Available
A Unified Approach to Entity-Centric Context Tracking in Social Conversations	Jan 28, 2022	coreference-resolutionCoreference Resolution	CodeCode Available
A Tidy Data Model for Natural Language Processing using cleanNLP	Mar 27, 2017	coreference-resolutionCoreference Resolution	CodeCode Available
How Reasonable are Common-Sense Reasoning Tasks: A Case-Study on the Winograd Schema Challenge and SWAG	Nov 5, 2018	Common Sense ReasoningCoreference Resolution	CodeCode Available
Improving Span Representation for Domain-adapted Coreference Resolution	Sep 20, 2021	coreference-resolutionCoreference Resolution	CodeCode Available
Incorporating Centering Theory into Neural Coreference Resolution	Jul 1, 2022	coreference-resolutionCoreference Resolution	CodeCode Available
Disambiguating Reference in Visually Grounded Dialogues through Joint Modeling of Textual and Multimodal Semantic Structures	May 16, 2025	coreference-resolutionCoreference Resolution	CodeCode Available
Incorporating Context and External Knowledge for Pronoun Coreference Resolution	May 24, 2019	coreference-resolutionCoreference Resolution	CodeCode Available
Variation in Coreference Strategies across Genres and Production Media	Dec 1, 2020	coreference-resolutionCoreference Resolution	CodeCode Available
OntoGUM: Evaluating Contextualized SOTA Coreference Resolution on 12 More Genres	Jun 2, 2021	coreference-resolutionCoreference Resolution	CodeCode Available
Incorporating Singletons and Mention-based Features in Coreference Resolution via Multi-task Learning for Better Generalization	Sep 20, 2023	coreference-resolutionCoreference Resolution	CodeCode Available
OpenEL: An Annotated Corpus for Entity Linking and Discourse in Open Domain Dialogue	Jun 1, 2022	Articlescoreference-resolution	CodeCode Available
Dialogue Meaning Representation for Task-Oriented Dialogue Systems	Apr 23, 2022	coreference-resolutionCoreference Resolution	CodeCode Available
Deep Reinforcement Learning for Mention-Ranking Coreference Models	Sep 27, 2016	coreference-resolutionCoreference Resolution	CodeCode Available
SDNet: Contextualized Attention-based Deep Network for Conversational Question Answering	Dec 10, 2018	Conversational Question AnsweringCoreference Resolution	CodeCode Available
AmbiCoref: Evaluating Human and Model Sensitivity to Ambiguous Coreference	Feb 1, 2023	coreference-resolutionCoreference Resolution	CodeCode Available
A Causal Inference Method for Reducing Gender Bias in Word Embedding Relations	Nov 25, 2019	Causal Inferencecoreference-resolution	CodeCode Available
Collecting Visually-Grounded Dialogue with A Game Of Sorts	Sep 10, 2023	Coreference ResolutionImage Retrieval	CodeCode Available
Second Order WinoBias (SoWinoBias) Test Set for Latent Gender Bias Detection in Coreference Resolution	Sep 28, 2021	Bias Detectioncoreference-resolution	CodeCode Available
Challenges to Evaluating the Generalization of Coreference Resolution Models: A Measurement Modeling Perspective	Mar 16, 2023	coreference-resolutionCoreference Resolution	CodeCode Available
Investigating Multilingual Coreference Resolution by Universal Annotations	Oct 26, 2023	coreference-resolutionCoreference Resolution	CodeCode Available
Paraphrasing vs Coreferring: Two Sides of the Same Coin	Apr 30, 2020	coreference-resolutionCoreference Resolution	CodeCode Available
ParCorFull2.0: a Parallel Corpus Annotated with Full Coreference	Jun 1, 2022	coreference-resolutionCoreference Resolution	CodeCode Available
Adapting Coreference Resolution Models through Active Learning	Apr 15, 2021	Active LearningClustering	CodeCode Available
PARMA: A Predicate Argument Aligner	Aug 1, 2013	Coreference ResolutionEntity Linking	CodeCode Available

Show:10 25 50

← PrevPage 33 of 36Next →

All datasets Winograd Schema Challenge OntoNotes CoNLL-2012 GAP DWIE WikiCoref CoNLL12 LitBank OntoGUM PreCo STM-coref XWinograd EN

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PaLM 540B (fine-tuned)	Accuracy	100	—	Unverified
2	Vega v2 6B (KD-based prompt transfer)	Accuracy	98.6	—	Unverified
3	UL2 20B (fine-tuned)	Accuracy	98.1	—	Unverified
4	Turing NLR v5 XXL 5.4B (fine-tuned)	Accuracy	97.3	—	Unverified
5	ST-MoE-32B 269B (fine-tuned)	Accuracy	96.6	—	Unverified
6	DeBERTa-1.5B	Accuracy	95.9	—	Unverified
7	T5-XXL 11B (fine-tuned)	Accuracy	93.8	—	Unverified
8	ST-MoE-L 4.1B (fine-tuned)	Accuracy	93.3	—	Unverified
9	RoBERTa-WinoGrande 355M	Accuracy	90.1	—	Unverified
10	Flan-T5 XXL (zero -shot)	Accuracy	89.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Maverick_mes	F1	83.6	—	Unverified
2	seq2seq	F1	83.3	—	Unverified
3	ASP+T0-3B	F1	82.3	—	Unverified
4	caw-coref + RoBERTa	F1	81.6	—	Unverified
5	LingMess	F1	81.4	—	Unverified
6	wl-coref + RoBERTa	F1	81	—	Unverified
7	U-MEM + Longformer	F1	80.9	—	Unverified
8	longdoc S (OntoNotes + 60k pseudo-singletons)	F1	80.6	—	Unverified
9	G2GT SpanBERT-large reduced	F1	80.5	—	Unverified
10	G2GT SpanBERT-large overlap	F1	80.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Maverick_mes	Avg F1	83.6	—	Unverified
2	seq2seq	Avg F1	83.3	—	Unverified
3	CorefQA + SpanBERT-large	Avg F1	83.1	—	Unverified
4	ASP+T0-3B	Avg F1	82.3	—	Unverified
5	wl-coref + RoBERTa	Avg F1	81	—	Unverified
6	s2e + Longformer-Large	Avg F1	80.3	—	Unverified
7	SpanBERT + Cluster Merging	Avg F1	80.2	—	Unverified
8	c2f + SpanBERT-Large	Avg F1	80.2	—	Unverified
9	CorefQA + SpanBERT-base	Avg F1	79.9	—	Unverified
10	U-MEM* + SpanBERT-large	Avg F1	79.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Coref-MTL	Overall F1	92.72	—	Unverified
2	ProBERT	Overall F1	92.5	—	Unverified
3	Maverick_incr	Overall F1	91.2	—	Unverified
4	Full Ensemble	Overall F1	90.2	—	Unverified
5	PeTra	F1	85.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	REXEL	Avg. F1	95.12	—	Unverified
2	Joint	Avg. F1	91.6	—	Unverified
3	KB-both	Avg. F1	91.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Maverick_mes	F1	66.8	—	Unverified
2	longdoc S (ON + PreCo + LitBank + 30k pseudo-singletons)	F1	62.5	—	Unverified
3	longdoc S (OntoNotes + PreCo + LitBank)	F1	60.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DeepStruct multi-task w/ finetune	Average F1	73.1	—	Unverified
2	DeepStruct multi-task	Average F1	60.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Maverick_incr	Avg F1	78.3	—	Unverified
2	longdoc S (OntoNotes + PreCo + LitBank)	F1	78.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MTL-coref	Avg F1	68.2	—	Unverified
2	SpanBERT	Avg F1	64.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Maverick_incr	F1	88	—	Unverified
2	longdoc S (OntoNotes + PreCo + LitBank)	F1	87.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BFCR + SpanBERT + Transfer Learning	CoNLL F1	61.4	—	Unverified
2	BFCR + SpanBERT	CoNLL F1	50.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	mT0-13B	Accuracy	81.29	—	Unverified
2	BLOOMZ	Accuracy	69.08	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	mT0-13B	Accuracy	78.31	—	Unverified
2	BLOOMZ	Accuracy	68.67	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	longdoc S (OntoNotes + PreCo + LitBank)	F1	42.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	dali-full-anaphora	Avg F1	77.9	—	Unverified