Coreference Resolution

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–125 of 880 papers

Title	Date	Tasks	Status	Hype	Score
Structured Prediction as Translation between Augmented Natural Languages	Jan 14, 2021	coreference-resolutionCoreference Resolution	CodeCode Available	1	5
DWIE: an entity-centric dataset for multi-task document-level information extraction	Sep 26, 2020	coreference-resolutionCoreference Resolution	CodeCode Available	1	5
SciCo: Hierarchical Cross-Document Coreference for Scientific Concepts	Apr 18, 2021	coreference-resolutionCoreference Resolution	CodeCode Available	1	5
End-to-End AMR Coreference Resolution	Aug 1, 2021	Abstract Meaning Representationcoreference-resolution	CodeCode Available	1	5
AmbiCoref: Evaluating Human and Model Sensitivity to Ambiguous Coreference	Feb 1, 2023	coreference-resolutionCoreference Resolution	CodeCode Available	0	5
Focus on what matters: Applying Discourse Coherence Theory to Cross Document Coreference	Oct 11, 2021	coreference-resolutionCoreference Resolution	CodeCode Available	0	5
Findings of the Third Shared Task on Multilingual Coreference Resolution	Oct 21, 2024	coreference-resolutionCoreference Resolution	CodeCode Available	0	5
A Simple Method for Commonsense Reasoning	Jun 7, 2018	Common Sense ReasoningCoreference Resolution	CodeCode Available	0	5
Findings of the Shared Task on Multilingual Coreference Resolution	Sep 16, 2022	Clusteringcoreference-resolution	CodeCode Available	0	5
Free the Plural: Unrestricted Split-Antecedent Anaphora Resolution	Oct 31, 2020	coreference-resolutionCoreference Resolution	CodeCode Available	0	5
ezCoref: Towards Unifying Annotation Guidelines for Coreference Resolution	Oct 13, 2022	coreference-resolutionCoreference Resolution	CodeCode Available	0	5
Exploring Span Representations in Neural Coreference Resolution	Nov 1, 2020	coreference-resolutionCoreference Resolution	CodeCode Available	0	5
Are Large Language Models Robust Coreference Resolvers?	May 23, 2023	coreference-resolutionCoreference Resolution	CodeCode Available	0	5
Exploring Multiple Strategies to Improve Multilingual Coreference Resolution in CorefUD	Aug 29, 2024	coreference-resolutionCoreference Resolution	CodeCode Available	0	5
A Rationale-centric Counterfactual Data Augmentation Method for Cross-Document Event Coreference Resolution	Apr 2, 2024	coreference-resolutionCoreference Resolution	CodeCode Available	0	5
A Causal Inference Method for Reducing Gender Bias in Word Embedding Relations	Nov 25, 2019	Causal Inferencecoreference-resolution	CodeCode Available	0	5
Exploring Pre-Trained Transformers and Bilingual Transfer Learning for Arabic Coreference Resolution	Nov 1, 2021	coreference-resolutionCoreference Resolution	CodeCode Available	0	5
Fill the GAP: Exploiting BERT for Pronoun Resolution	Aug 1, 2019	Coreference ResolutionData Augmentation	CodeCode Available	0	5
From Text to Lexicon: Bridging the Gap between Word Embeddings and Lexical Resources	Aug 1, 2018	Coreference ResolutionLemmatization	CodeCode Available	0	5
Event Coreference Data (Almost) for Free: Mining Hyperlinks from Online News	Oct 1, 2021	coreference-resolutionCoreference Resolution	CodeCode Available	0	5
Evaluating Coreference Resolvers on Community-based Question Answering: From Rule-based to State of the Art	Oct 1, 2022	Answer Selectioncoreference-resolution	CodeCode Available	0	5
Asking and Answering Questions to Extract Event-Argument Structures	Apr 25, 2024	coreference-resolutionCoreference Resolution	CodeCode Available	0	5
Event Coreference Resolution for Contentious Politics Events	Mar 18, 2022	coreference-resolutionCoreference Resolution	CodeCode Available	0	5
Entity-Level Sentiment Analysis (ELSA): An exploratory task survey	Apr 27, 2023	coreference-resolutionCoreference Resolution	CodeCode Available	0	5
ENPAR:Enhancing Entity and Entity Pair Representations for Joint Entity Relation Extraction	Apr 1, 2021	coreference-resolutionCoreference Resolution	CodeCode Available	0	5

Show:10 25 50

← PrevPage 5 of 36Next →

All datasets Winograd Schema Challenge OntoNotes CoNLL-2012 GAP DWIE WikiCoref CoNLL12 LitBank OntoGUM PreCo STM-coref XWinograd EN

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PaLM 540B (fine-tuned)	Accuracy	100	—	Unverified
2	Vega v2 6B (KD-based prompt transfer)	Accuracy	98.6	—	Unverified
3	UL2 20B (fine-tuned)	Accuracy	98.1	—	Unverified
4	Turing NLR v5 XXL 5.4B (fine-tuned)	Accuracy	97.3	—	Unverified
5	ST-MoE-32B 269B (fine-tuned)	Accuracy	96.6	—	Unverified
6	DeBERTa-1.5B	Accuracy	95.9	—	Unverified
7	T5-XXL 11B (fine-tuned)	Accuracy	93.8	—	Unverified
8	ST-MoE-L 4.1B (fine-tuned)	Accuracy	93.3	—	Unverified
9	RoBERTa-WinoGrande 355M	Accuracy	90.1	—	Unverified
10	Flan-T5 XXL (zero -shot)	Accuracy	89.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Maverick_mes	F1	83.6	—	Unverified
2	seq2seq	F1	83.3	—	Unverified
3	ASP+T0-3B	F1	82.3	—	Unverified
4	caw-coref + RoBERTa	F1	81.6	—	Unverified
5	LingMess	F1	81.4	—	Unverified
6	wl-coref + RoBERTa	F1	81	—	Unverified
7	U-MEM + Longformer	F1	80.9	—	Unverified
8	longdoc S (OntoNotes + 60k pseudo-singletons)	F1	80.6	—	Unverified
9	G2GT SpanBERT-large reduced	F1	80.5	—	Unverified
10	G2GT SpanBERT-large overlap	F1	80.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Maverick_mes	Avg F1	83.6	—	Unverified
2	seq2seq	Avg F1	83.3	—	Unverified
3	CorefQA + SpanBERT-large	Avg F1	83.1	—	Unverified
4	ASP+T0-3B	Avg F1	82.3	—	Unverified
5	wl-coref + RoBERTa	Avg F1	81	—	Unverified
6	s2e + Longformer-Large	Avg F1	80.3	—	Unverified
7	SpanBERT + Cluster Merging	Avg F1	80.2	—	Unverified
8	c2f + SpanBERT-Large	Avg F1	80.2	—	Unverified
9	CorefQA + SpanBERT-base	Avg F1	79.9	—	Unverified
10	U-MEM* + SpanBERT-large	Avg F1	79.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Coref-MTL	Overall F1	92.72	—	Unverified
2	ProBERT	Overall F1	92.5	—	Unverified
3	Maverick_incr	Overall F1	91.2	—	Unverified
4	Full Ensemble	Overall F1	90.2	—	Unverified
5	PeTra	F1	85.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	REXEL	Avg. F1	95.12	—	Unverified
2	Joint	Avg. F1	91.6	—	Unverified
3	KB-both	Avg. F1	91.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Maverick_mes	F1	66.8	—	Unverified
2	longdoc S (ON + PreCo + LitBank + 30k pseudo-singletons)	F1	62.5	—	Unverified
3	longdoc S (OntoNotes + PreCo + LitBank)	F1	60.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DeepStruct multi-task w/ finetune	Average F1	73.1	—	Unverified
2	DeepStruct multi-task	Average F1	60.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Maverick_incr	Avg F1	78.3	—	Unverified
2	longdoc S (OntoNotes + PreCo + LitBank)	F1	78.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MTL-coref	Avg F1	68.2	—	Unverified
2	SpanBERT	Avg F1	64.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Maverick_incr	F1	88	—	Unverified
2	longdoc S (OntoNotes + PreCo + LitBank)	F1	87.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BFCR + SpanBERT + Transfer Learning	CoNLL F1	61.4	—	Unverified
2	BFCR + SpanBERT	CoNLL F1	50.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	mT0-13B	Accuracy	81.29	—	Unverified
2	BLOOMZ	Accuracy	69.08	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	mT0-13B	Accuracy	78.31	—	Unverified
2	BLOOMZ	Accuracy	68.67	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	longdoc S (OntoNotes + PreCo + LitBank)	F1	42.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	dali-full-anaphora	Avg F1	77.9	—	Unverified