Coreference Resolution

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 201–225 of 880 papers

Title	Date	Tasks	Status	Score
Learning Global Features for Coreference Resolution	Apr 11, 2016	Attributecoreference-resolution	CodeCode Available	5
Ellipsis Resolution as Question Answering: An Evaluation	Aug 29, 2019	coreference-resolutionCoreference Resolution	CodeCode Available	5
A Controlled Reevaluation of Coreference Resolution Models	Mar 31, 2024	coreference-resolutionCoreference Resolution	CodeCode Available	5
Light Coreference Resolution for Russian with Hierarchical Discourse Features	Jun 2, 2023	coreference-resolutionCoreference Resolution	CodeCode Available	5
Dynamic Entity Representations in Neural Language Models	Aug 2, 2017	Coreference ResolutionLanguage Modeling	CodeCode Available	5
Constrained Multi-Task Learning for Event Coreference Resolution	Jun 1, 2021	coreference-resolutionCoreference Resolution	CodeCode Available	5
WikiCREM: A Large Unsupervised Corpus for Coreference Resolution	Aug 21, 2019	coreference-resolutionCoreference Resolution	CodeCode Available	5
Major Entity Identification: A Generalizable Alternative to Coreference Resolution	Jun 20, 2024	coreference-resolutionCoreference Resolution	CodeCode Available	5
Mention Annotations Alone Enable Efficient Domain Adaptation for Coreference Resolution	Oct 14, 2022	coreference-resolutionCoreference Resolution	CodeCode Available	5
Mind the GAP: A Balanced Corpus of Gendered Ambiguous Pronouns	Oct 11, 2018	Coreference ResolutionDiversity	CodeCode Available	5
EasyECR: A Library for Easy Implementation and Evaluation of Event Coreference Resolution Models	Jun 20, 2024	coreference-resolutionCoreference Resolution	CodeCode Available	5
Multi-hop Question Answering via Reasoning Chains	Oct 7, 2019	Coreference ResolutionMulti-hop Question Answering	CodeCode Available	5
Adapting Coreference Resolution Models through Active Learning	Apr 15, 2021	Active LearningClustering	CodeCode Available	5
Multimodal Cross-Document Event Coreference Resolution Using Linear Semantic Transfer and Mixed-Modality Ensembles	Apr 13, 2024	coreference-resolutionCoreference Resolution	CodeCode Available	5
Natural Language Processing for Information Extraction	Jul 6, 2018	Articlescoreference-resolution	CodeCode Available	5
Does referent predictability affect the choice of referential form? A computational approach using masked coreference resolution	Sep 27, 2021	coreference-resolutionCoreference Resolution	CodeCode Available	5
BERT for Coreference Resolution: Baselines and Analysis	Aug 24, 2019	Coreference Resolution	CodeCode Available	5
End-to-end Neural Coreference Resolution	Jul 21, 2017	Coreference Resolution	CodeCode Available	5
BenCoref: A Multi-Domain Dataset of Nominal Phrases and Pronominal Reference Annotations	Apr 7, 2023	coreference-resolutionCoreference Resolution	CodeCode Available	5
How Reasonable are Common-Sense Reasoning Tasks: A Case-Study on the Winograd Schema Challenge and SWAG	Nov 5, 2018	Common Sense ReasoningCoreference Resolution	CodeCode Available	5
OpenEL: An Annotated Corpus for Entity Linking and Discourse in Open Domain Dialogue	Jun 1, 2022	Articlescoreference-resolution	CodeCode Available	5
Adapting Coreference Resolution to Twitter Conversations	Nov 1, 2020	coreference-resolutionCoreference Resolution	CodeCode Available	5
Dialogue Meaning Representation for Task-Oriented Dialogue Systems	Apr 23, 2022	coreference-resolutionCoreference Resolution	CodeCode Available	5
Disambiguating Reference in Visually Grounded Dialogues through Joint Modeling of Textual and Multimodal Semantic Structures	May 16, 2025	coreference-resolutionCoreference Resolution	CodeCode Available	5
Deep Reinforcement Learning for Mention-Ranking Coreference Models	Sep 27, 2016	coreference-resolutionCoreference Resolution	CodeCode Available	5

Show:10 25 50

← PrevPage 9 of 36Next →

All datasets Winograd Schema Challenge OntoNotes CoNLL-2012 GAP DWIE WikiCoref CoNLL12 LitBank OntoGUM PreCo STM-coref XWinograd EN

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PaLM 540B (fine-tuned)	Accuracy	100	—	Unverified
2	Vega v2 6B (KD-based prompt transfer)	Accuracy	98.6	—	Unverified
3	UL2 20B (fine-tuned)	Accuracy	98.1	—	Unverified
4	Turing NLR v5 XXL 5.4B (fine-tuned)	Accuracy	97.3	—	Unverified
5	ST-MoE-32B 269B (fine-tuned)	Accuracy	96.6	—	Unverified
6	DeBERTa-1.5B	Accuracy	95.9	—	Unverified
7	T5-XXL 11B (fine-tuned)	Accuracy	93.8	—	Unverified
8	ST-MoE-L 4.1B (fine-tuned)	Accuracy	93.3	—	Unverified
9	RoBERTa-WinoGrande 355M	Accuracy	90.1	—	Unverified
10	Flan-T5 XXL (zero -shot)	Accuracy	89.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Maverick_mes	F1	83.6	—	Unverified
2	seq2seq	F1	83.3	—	Unverified
3	ASP+T0-3B	F1	82.3	—	Unverified
4	caw-coref + RoBERTa	F1	81.6	—	Unverified
5	LingMess	F1	81.4	—	Unverified
6	wl-coref + RoBERTa	F1	81	—	Unverified
7	U-MEM + Longformer	F1	80.9	—	Unverified
8	longdoc S (OntoNotes + 60k pseudo-singletons)	F1	80.6	—	Unverified
9	G2GT SpanBERT-large reduced	F1	80.5	—	Unverified
10	G2GT SpanBERT-large overlap	F1	80.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Maverick_mes	Avg F1	83.6	—	Unverified
2	seq2seq	Avg F1	83.3	—	Unverified
3	CorefQA + SpanBERT-large	Avg F1	83.1	—	Unverified
4	ASP+T0-3B	Avg F1	82.3	—	Unverified
5	wl-coref + RoBERTa	Avg F1	81	—	Unverified
6	s2e + Longformer-Large	Avg F1	80.3	—	Unverified
7	SpanBERT + Cluster Merging	Avg F1	80.2	—	Unverified
8	c2f + SpanBERT-Large	Avg F1	80.2	—	Unverified
9	CorefQA + SpanBERT-base	Avg F1	79.9	—	Unverified
10	U-MEM* + SpanBERT-large	Avg F1	79.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Coref-MTL	Overall F1	92.72	—	Unverified
2	ProBERT	Overall F1	92.5	—	Unverified
3	Maverick_incr	Overall F1	91.2	—	Unverified
4	Full Ensemble	Overall F1	90.2	—	Unverified
5	PeTra	F1	85.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	REXEL	Avg. F1	95.12	—	Unverified
2	Joint	Avg. F1	91.6	—	Unverified
3	KB-both	Avg. F1	91.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Maverick_mes	F1	66.8	—	Unverified
2	longdoc S (ON + PreCo + LitBank + 30k pseudo-singletons)	F1	62.5	—	Unverified
3	longdoc S (OntoNotes + PreCo + LitBank)	F1	60.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DeepStruct multi-task w/ finetune	Average F1	73.1	—	Unverified
2	DeepStruct multi-task	Average F1	60.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Maverick_incr	Avg F1	78.3	—	Unverified
2	longdoc S (OntoNotes + PreCo + LitBank)	F1	78.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MTL-coref	Avg F1	68.2	—	Unverified
2	SpanBERT	Avg F1	64.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Maverick_incr	F1	88	—	Unverified
2	longdoc S (OntoNotes + PreCo + LitBank)	F1	87.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BFCR + SpanBERT + Transfer Learning	CoNLL F1	61.4	—	Unverified
2	BFCR + SpanBERT	CoNLL F1	50.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	mT0-13B	Accuracy	81.29	—	Unverified
2	BLOOMZ	Accuracy	69.08	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	mT0-13B	Accuracy	78.31	—	Unverified
2	BLOOMZ	Accuracy	68.67	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	longdoc S (OntoNotes + PreCo + LitBank)	F1	42.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	dali-full-anaphora	Avg F1	77.9	—	Unverified