Coreference Resolution

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 151–200 of 880 papers

Title	Date	Tasks	Status
Releasing the CRaQAn (Coreference Resolution in Question-Answering): An open-source dataset and dataset creation methodology using instruction-following models	Nov 27, 2023	Chunkingcoreference-resolution	—Unverified
ÚFAL CorPipe at CRAC 2023: Larger Context Improves Multilingual Coreference Resolution	Nov 24, 2023	coreference-resolutionCoreference Resolution	CodeCode Available
CHAMP: Efficient Annotation and Consolidation of Cluster Hierarchies	Nov 19, 2023	coreference-resolutionCoreference Resolution	CodeCode Available
Investigating Multilingual Coreference Resolution by Universal Annotations	Oct 26, 2023	coreference-resolutionCoreference Resolution	CodeCode Available
CorefPrompt: Prompt-based Event Coreference Resolution by Measuring Event Type and Argument Compatibilities	Oct 23, 2023	coreference-resolutionCoreference Resolution	CodeCode Available
Towards Harmful Erotic Content Detection through Coreference-Driven Contextual Analysis	Oct 22, 2023	coreference-resolutionCoreference Resolution	—Unverified
Semi-supervised multimodal coreference resolution in image narrations	Oct 20, 2023	coreference-resolutionCoreference Resolution	CodeCode Available
Filling in the Gaps: Efficient Event Coreference Resolution using Graph Autoencoder Networks	Oct 18, 2023	coreference-resolutionCoreference Resolution	—Unverified
CAW-coref: Conjunction-Aware Word-level Coreference Resolution	Oct 9, 2023	coreference-resolutionCoreference Resolution	CodeCode Available
A Survey of Document-Level Information Extraction	Sep 23, 2023	coreference-resolutionCoreference Resolution	—Unverified
Incorporating Singletons and Mention-based Features in Coreference Resolution via Multi-task Learning for Better Generalization	Sep 20, 2023	coreference-resolutionCoreference Resolution	CodeCode Available
An Empirical Evaluation of Prompting Strategies for Large Language Models in Zero-Shot Clinical Natural Language Processing	Sep 14, 2023	AttributeAttribute Extraction	—Unverified
Collecting Visually-Grounded Dialogue with A Game Of Sorts	Sep 10, 2023	Coreference ResolutionImage Retrieval	CodeCode Available
RGAT: A Deeper Look into Syntactic Dependency Information for Coreference Resolution	Sep 10, 2023	coreference-resolutionCoreference Resolution	—Unverified
Gender-specific Machine Translation with Large Language Models	Sep 6, 2023	coreference-resolutionCoreference Resolution	—Unverified
Generalised Winograd Schema and its Contextuality	Aug 31, 2023	coreference-resolutionCoreference Resolution	—Unverified
PronounFlow: A Hybrid Approach for Calibrating Pronouns in Sentences	Aug 29, 2023	coreference-resolutionCoreference Resolution	—Unverified
DialogRE^C+: An Extension of DialogRE to Investigate How Much Coreference Helps Relation Extraction in Dialogs	Aug 8, 2023	coreference-resolutionCoreference Resolution	—Unverified
Athena 2.0: Discourse and User Modeling in Open Domain Dialogue	Aug 3, 2023	coreference-resolutionCoreference Resolution	—Unverified
Similarity-based Memory Enhanced Joint Entity and Relation Extraction	Jul 14, 2023	coreference-resolutionCoreference Resolution	CodeCode Available
Better Handling Coreference Resolution in Aspect Level Sentiment Classification by Fine-Tuning Language Models	Jul 11, 2023	coreference-resolutionCoreference Resolution	—Unverified
SimpleMTOD: A Simple Language Model for Multimodal Task-Oriented Dialogue with Symbolic Scene Representation	Jul 10, 2023	coreference-resolutionCoreference Resolution	—Unverified
Improving Automatic Quotation Attribution in Literary Novels	Jul 7, 2023	coreference-resolutionCoreference Resolution	—Unverified
How Good is the Model in Model-in-the-loop Event Coreference Resolution Annotation?	Jun 6, 2023	coreference-resolutionCoreference Resolution	CodeCode Available
GENTLE: A Genre-Diverse Multilayer Challenge Set for English NLP and Linguistic Evaluation	Jun 3, 2023	coreference-resolutionCoreference Resolution	CodeCode Available
Light Coreference Resolution for Russian with Hierarchical Discourse Features	Jun 2, 2023	coreference-resolutionCoreference Resolution	CodeCode Available
Examining risks of racial biases in NLP tools for child protective services	May 30, 2023	coreference-resolutionCoreference Resolution	—Unverified
Parallel Data Helps Neural Entity Coreference Resolution	May 28, 2023	coreference-resolutionCoreference Resolution	—Unverified
Sentence-Incremental Neural Coreference Resolution	May 26, 2023	coreference-resolutionCoreference Resolution	CodeCode Available
COMET-M: Reasoning about Multiple Events in Complex Sentences	May 24, 2023	coreference-resolutionCoreference Resolution	CodeCode Available
Comparing Humans and Models on a Similar Scale: Towards Cognitive Gender Bias Evaluation in Coreference Resolution	May 24, 2023	coreference-resolutionCoreference Resolution	CodeCode Available
Linear-Time Modeling of Linguistic Structure: An Order-Theoretic Perspective	May 24, 2023	coreference-resolutionCoreference Resolution	—Unverified
Are Large Language Models Robust Coreference Resolvers?	May 23, 2023	coreference-resolutionCoreference Resolution	CodeCode Available
PaLM 2 Technical Report	May 17, 2023	Code GenerationCommon Sense Reasoning	—Unverified
It Takes Two to Tango: Navigating Conceptualizations of NLP Tasks and Measurements of Performance	May 15, 2023	coreference-resolutionCoreference Resolution	—Unverified
Entity-Level Sentiment Analysis (ELSA): An exploratory task survey	Apr 27, 2023	coreference-resolutionCoreference Resolution	CodeCode Available
BenCoref: A Multi-Domain Dataset of Nominal Phrases and Pronominal Reference Annotations	Apr 7, 2023	coreference-resolutionCoreference Resolution	CodeCode Available
Challenges to Evaluating the Generalization of Coreference Resolution Models: A Measurement Modeling Perspective	Mar 16, 2023	coreference-resolutionCoreference Resolution	CodeCode Available
Variational Quantum Classifiers for Natural-Language Text	Mar 4, 2023	coreference-resolutionCoreference Resolution	—Unverified
What happens before and after: Multi-Event Commonsense in Event Coreference Resolution	Feb 20, 2023	coreference-resolutionCoreference Resolution	CodeCode Available
Evaluating and Improving the Coreference Capabilities of Machine Translation Models	Feb 16, 2023	coreference-resolutionCoreference Resolution	—Unverified
Counter-GAP: Counterfactual Bias Evaluation through Gendered Ambiguous Pronouns	Feb 11, 2023	coreference-resolutionCoreference Resolution	—Unverified
AmbiCoref: Evaluating Human and Model Sensitivity to Ambiguous Coreference	Feb 1, 2023	coreference-resolutionCoreference Resolution	CodeCode Available
SMDDH: Singleton Mention detection using Deep Learning in Hindi Text	Jan 23, 2023	coreference-resolutionCoreference Resolution	—Unverified
Ensemble Transfer Learning for Multilingual Coreference Resolution	Jan 22, 2023	coreference-resolutionCoreference Resolution	—Unverified
Hybrid Rule-Neural Coreference Resolution System based on Actor-Critic Learning	Dec 20, 2022	Allcoreference-resolution	—Unverified
Neural Coreference Resolution based on Reinforcement Learning	Dec 18, 2022	AllClustering	—Unverified
The KITMUS Test: Evaluating Knowledge Integration from Multiple Sources in Natural Language Understanding Systems	Dec 15, 2022	coreference-resolutionCoreference Resolution	CodeCode Available
Quotations, Coreference Resolution, and Sentiment Annotations in Croatian News Articles: An Exploratory Study	Dec 14, 2022	Articlescoreference-resolution	—Unverified
Toward Efficient Language Model Pretraining and Downstream Adaptation via Self-Evolution: A Case Study on SuperGLUE	Dec 4, 2022	Common Sense Reasoningcoreference-resolution	—Unverified

Show:10 25 50

← PrevPage 4 of 18Next →

All datasets Winograd Schema Challenge OntoNotes CoNLL-2012 GAP DWIE WikiCoref CoNLL12 LitBank OntoGUM PreCo STM-coref XWinograd EN

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PaLM 540B (fine-tuned)	Accuracy	100	—	Unverified
2	Vega v2 6B (KD-based prompt transfer)	Accuracy	98.6	—	Unverified
3	UL2 20B (fine-tuned)	Accuracy	98.1	—	Unverified
4	Turing NLR v5 XXL 5.4B (fine-tuned)	Accuracy	97.3	—	Unverified
5	ST-MoE-32B 269B (fine-tuned)	Accuracy	96.6	—	Unverified
6	DeBERTa-1.5B	Accuracy	95.9	—	Unverified
7	T5-XXL 11B (fine-tuned)	Accuracy	93.8	—	Unverified
8	ST-MoE-L 4.1B (fine-tuned)	Accuracy	93.3	—	Unverified
9	RoBERTa-WinoGrande 355M	Accuracy	90.1	—	Unverified
10	Flan-T5 XXL (zero -shot)	Accuracy	89.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Maverick_mes	F1	83.6	—	Unverified
2	seq2seq	F1	83.3	—	Unverified
3	ASP+T0-3B	F1	82.3	—	Unverified
4	caw-coref + RoBERTa	F1	81.6	—	Unverified
5	LingMess	F1	81.4	—	Unverified
6	wl-coref + RoBERTa	F1	81	—	Unverified
7	U-MEM + Longformer	F1	80.9	—	Unverified
8	longdoc S (OntoNotes + 60k pseudo-singletons)	F1	80.6	—	Unverified
9	G2GT SpanBERT-large reduced	F1	80.5	—	Unverified
10	G2GT SpanBERT-large overlap	F1	80.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Maverick_mes	Avg F1	83.6	—	Unverified
2	seq2seq	Avg F1	83.3	—	Unverified
3	CorefQA + SpanBERT-large	Avg F1	83.1	—	Unverified
4	ASP+T0-3B	Avg F1	82.3	—	Unverified
5	wl-coref + RoBERTa	Avg F1	81	—	Unverified
6	s2e + Longformer-Large	Avg F1	80.3	—	Unverified
7	SpanBERT + Cluster Merging	Avg F1	80.2	—	Unverified
8	c2f + SpanBERT-Large	Avg F1	80.2	—	Unverified
9	CorefQA + SpanBERT-base	Avg F1	79.9	—	Unverified
10	U-MEM* + SpanBERT-large	Avg F1	79.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Coref-MTL	Overall F1	92.72	—	Unverified
2	ProBERT	Overall F1	92.5	—	Unverified
3	Maverick_incr	Overall F1	91.2	—	Unverified
4	Full Ensemble	Overall F1	90.2	—	Unverified
5	PeTra	F1	85.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	REXEL	Avg. F1	95.12	—	Unverified
2	Joint	Avg. F1	91.6	—	Unverified
3	KB-both	Avg. F1	91.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Maverick_mes	F1	66.8	—	Unverified
2	longdoc S (ON + PreCo + LitBank + 30k pseudo-singletons)	F1	62.5	—	Unverified
3	longdoc S (OntoNotes + PreCo + LitBank)	F1	60.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DeepStruct multi-task w/ finetune	Average F1	73.1	—	Unverified
2	DeepStruct multi-task	Average F1	60.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Maverick_incr	Avg F1	78.3	—	Unverified
2	longdoc S (OntoNotes + PreCo + LitBank)	F1	78.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MTL-coref	Avg F1	68.2	—	Unverified
2	SpanBERT	Avg F1	64.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Maverick_incr	F1	88	—	Unverified
2	longdoc S (OntoNotes + PreCo + LitBank)	F1	87.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BFCR + SpanBERT + Transfer Learning	CoNLL F1	61.4	—	Unverified
2	BFCR + SpanBERT	CoNLL F1	50.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	mT0-13B	Accuracy	81.29	—	Unverified
2	BLOOMZ	Accuracy	69.08	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	mT0-13B	Accuracy	78.31	—	Unverified
2	BLOOMZ	Accuracy	68.67	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	longdoc S (OntoNotes + PreCo + LitBank)	F1	42.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	dali-full-anaphora	Avg F1	77.9	—	Unverified