Coreference Resolution

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 301–325 of 880 papers

Title	Date	Tasks	Status
Descending-Path Convolution Kernel for Syntactic Structures	Jun 1, 2014	Coreference ResolutionRelation Extraction	—Unverified
Different Flavors of GUM: Evaluating Genre and Sentence Type Effects on Multilayer Corpus Annotation Quality	Aug 1, 2016	Coreference ResolutionDependency Parsing	—Unverified
BART goes multilingual: The UniTN / Essex submission to the CoNLL-2012 Shared Task	Jul 1, 2012	Coreference Resolution	—Unverified
Disambiguating Entities Referred by Web Endpoints using Tree Ensembles	Dec 1, 2016	Coreference ResolutionEntity Linking	—Unverified
Dependency parsing representation effects on the accuracy of semantic applications --- an example of an inflective language	May 1, 2014	coreference-resolutionCoreference Resolution	—Unverified
Discourse as a Function of Event: Profiling Discourse Structure in News Articles around the Main Event	Jul 1, 2020	Argument MiningArticles	—Unverified
Better Call the Plumber: Orchestrating Dynamic Information Extraction Pipelines	Feb 22, 2021	coreference-resolutionCoreference Resolution	—Unverified
Discovering Implicit Discourse Relations Through Brown Cluster Pair Representation and Coreference Patterns	Apr 1, 2014	Coreference ResolutionImplicit Discourse Relation Classification	—Unverified
Distributional Semantics for Resolving Bridging Mentions	Sep 1, 2015	ClusteringCoreference Resolution	—Unverified
DIT: Summarisation and Semantic Expansion in Evaluating Semantic Similarity	Aug 1, 2014	Coreference ResolutionSemantic Similarity	—Unverified
Bacteria Biotope Detection, Ontology-based Normalization, and Relation Extraction using Syntactic Rules	Aug 1, 2013	Coreference ResolutionInformation Retrieval	—Unverified
Docforia: A Multilayer Document Model	May 1, 2017	Coreference ResolutionDependency Parsing	—Unverified
Beyond Plain Spatial Knowledge: Determining Where Entities Are and Are Not Located, and For How Long	Aug 1, 2016	Coreference ResolutionQuestion Answering	—Unverified
Domain Adaptation for Coreference Resolution: An Adaptive Ensemble Approach	Jul 1, 2012	coreference-resolutionCoreference Resolution	—Unverified
Domain Adaptation of Coreference Resolution for Radiology Reports	Jun 1, 2012	coreference-resolutionCoreference Resolution	—Unverified
Domain Adaptation with Active Learning for Coreference Resolution	Apr 1, 2014	Active Learningcoreference-resolution	—Unverified
Domain-Specific Coreference Resolution with Lexicalized Features	Aug 1, 2013	coreference-resolutionCoreference Resolution	—Unverified
Domain-specific vs. Uniform Modeling for Coreference Resolution	May 1, 2012	coreference-resolutionCoreference Resolution	—Unverified
Analysis of Coreference Relations in the Biomedical Literature	Nov 1, 2014	Coreference ResolutionInformation Retrieval	—Unverified
DramaCoref: A Hybrid Coreference Resolution System for German Theater Plays	Nov 1, 2021	coreference-resolutionCoreference Resolution	—Unverified
DR.GAP: Mitigating Bias in Large Language Models using Gender-Aware Prompting with Demonstration and Reasoning	Feb 17, 2025	coreference-resolutionCoreference Resolution	—Unverified
Deep Reinforcement Learning for NLP	Jul 1, 2018	Atari Gamescoreference-resolution	—Unverified
Anatomy of OntoGUM—Adapting GUM to the OntoNotes Scheme to Evaluate Robustness of SOTA Coreference Algorithms	Nov 1, 2021	Anatomycoreference-resolution	—Unverified
Dynamic Knowledge-Base Alignment for Coreference Resolution	Aug 1, 2013	coreference-resolutionCoreference Resolution	—Unverified
Back to Square One: Artifact Detection, Training and Commonsense Disentanglement in the Winograd Schema	Apr 16, 2021	Artifact DetectionBias Detection	—Unverified

Show:10 25 50

← PrevPage 13 of 36Next →

All datasets Winograd Schema Challenge OntoNotes CoNLL-2012 GAP DWIE WikiCoref CoNLL12 LitBank OntoGUM PreCo STM-coref XWinograd EN

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PaLM 540B (fine-tuned)	Accuracy	100	—	Unverified
2	Vega v2 6B (KD-based prompt transfer)	Accuracy	98.6	—	Unverified
3	UL2 20B (fine-tuned)	Accuracy	98.1	—	Unverified
4	Turing NLR v5 XXL 5.4B (fine-tuned)	Accuracy	97.3	—	Unverified
5	ST-MoE-32B 269B (fine-tuned)	Accuracy	96.6	—	Unverified
6	DeBERTa-1.5B	Accuracy	95.9	—	Unverified
7	T5-XXL 11B (fine-tuned)	Accuracy	93.8	—	Unverified
8	ST-MoE-L 4.1B (fine-tuned)	Accuracy	93.3	—	Unverified
9	RoBERTa-WinoGrande 355M	Accuracy	90.1	—	Unverified
10	Flan-T5 XXL (zero -shot)	Accuracy	89.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Maverick_mes	F1	83.6	—	Unverified
2	seq2seq	F1	83.3	—	Unverified
3	ASP+T0-3B	F1	82.3	—	Unverified
4	caw-coref + RoBERTa	F1	81.6	—	Unverified
5	LingMess	F1	81.4	—	Unverified
6	wl-coref + RoBERTa	F1	81	—	Unverified
7	U-MEM + Longformer	F1	80.9	—	Unverified
8	longdoc S (OntoNotes + 60k pseudo-singletons)	F1	80.6	—	Unverified
9	G2GT SpanBERT-large reduced	F1	80.5	—	Unverified
10	G2GT SpanBERT-large overlap	F1	80.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Maverick_mes	Avg F1	83.6	—	Unverified
2	seq2seq	Avg F1	83.3	—	Unverified
3	CorefQA + SpanBERT-large	Avg F1	83.1	—	Unverified
4	ASP+T0-3B	Avg F1	82.3	—	Unverified
5	wl-coref + RoBERTa	Avg F1	81	—	Unverified
6	s2e + Longformer-Large	Avg F1	80.3	—	Unverified
7	SpanBERT + Cluster Merging	Avg F1	80.2	—	Unverified
8	c2f + SpanBERT-Large	Avg F1	80.2	—	Unverified
9	CorefQA + SpanBERT-base	Avg F1	79.9	—	Unverified
10	U-MEM* + SpanBERT-large	Avg F1	79.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Coref-MTL	Overall F1	92.72	—	Unverified
2	ProBERT	Overall F1	92.5	—	Unverified
3	Maverick_incr	Overall F1	91.2	—	Unverified
4	Full Ensemble	Overall F1	90.2	—	Unverified
5	PeTra	F1	85.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	REXEL	Avg. F1	95.12	—	Unverified
2	Joint	Avg. F1	91.6	—	Unverified
3	KB-both	Avg. F1	91.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Maverick_mes	F1	66.8	—	Unverified
2	longdoc S (ON + PreCo + LitBank + 30k pseudo-singletons)	F1	62.5	—	Unverified
3	longdoc S (OntoNotes + PreCo + LitBank)	F1	60.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DeepStruct multi-task w/ finetune	Average F1	73.1	—	Unverified
2	DeepStruct multi-task	Average F1	60.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Maverick_incr	Avg F1	78.3	—	Unverified
2	longdoc S (OntoNotes + PreCo + LitBank)	F1	78.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MTL-coref	Avg F1	68.2	—	Unverified
2	SpanBERT	Avg F1	64.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Maverick_incr	F1	88	—	Unverified
2	longdoc S (OntoNotes + PreCo + LitBank)	F1	87.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BFCR + SpanBERT + Transfer Learning	CoNLL F1	61.4	—	Unverified
2	BFCR + SpanBERT	CoNLL F1	50.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	mT0-13B	Accuracy	81.29	—	Unverified
2	BLOOMZ	Accuracy	69.08	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	mT0-13B	Accuracy	78.31	—	Unverified
2	BLOOMZ	Accuracy	68.67	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	longdoc S (OntoNotes + PreCo + LitBank)	F1	42.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	dali-full-anaphora	Avg F1	77.9	—	Unverified