Coreference Resolution

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 426–450 of 880 papers

Title	Date	Tasks	Status	Hype
Crowdsourcing and Aggregating Nested Markable Annotations	Jul 1, 2019	coreference-resolutionCoreference Resolution	CodeCode Available	0
Wikipedia as a Resource for Text Analysis and Retrieval	Jul 1, 2019	Clusteringcoreference-resolution	—Unverified	0
Model-based annotation of coreference	Jun 25, 2019	coreference-resolutionCoreference Resolution	CodeCode Available	0
Using Automatically Extracted Minimum Spans to Disentangle Coreference Evaluation from Boundary Detection	Jun 16, 2019	Boundary Detectioncoreference-resolution	CodeCode Available	0
Improving Multi-turn Dialogue Modelling with Utterance ReWriter	Jun 14, 2019	Coreference ResolutionDialogue Rewriting	CodeCode Available	0
Gendered Pronoun Resolution using BERT and an extractive question answering formulation	Jun 9, 2019	coreference-resolutionCoreference Resolution	CodeCode Available	0
Revisiting Joint Modeling of Cross-document Entity and Event Coreference Resolution	Jun 4, 2019	coreference-resolutionCoreference Resolution	CodeCode Available	0
Resolving Gendered Ambiguous Pronouns with BERT	Jun 3, 2019	coreference-resolutionCoreference Resolution	CodeCode Available	0
Gendered Ambiguous Pronouns Shared Task: Boosting Model Confidence by Evidence Pooling	Jun 3, 2019	coreference-resolutionCoreference Resolution	CodeCode Available	0
Evaluating Gender Bias in Machine Translation	Jun 3, 2019	coreference-resolutionCoreference Resolution	CodeCode Available	1
Evaluation of named entity coreference	Jun 1, 2019	coreference-resolutionCoreference Resolution	—Unverified	0
Neural Coreference Resolution with Limited Lexical Context and Explicit Mention Detection for Oral French	Jun 1, 2019	coreference-resolutionCoreference Resolution	—Unverified	0
Deep Cross-Lingual Coreference Resolution for Less-Resourced Languages: The Case of Basque	Jun 1, 2019	coreference-resolutionCoreference Resolution	—Unverified	0
Cross-lingual Incongruences in the Annotation of Coreference	Jun 1, 2019	coreference-resolutionCoreference Resolution	—Unverified	0
Improving Event Coreference Resolution by Learning Argument Compatibility from Unlabeled Data	Jun 1, 2019	coreference-resolutionCoreference Resolution	—Unverified	0
GenderQuant: Quantifying Mention-Level Genderedness	Jun 1, 2019	Articlescoreference-resolution	—Unverified	0
Attention Is (not) All You Need for Commonsense Reasoning	May 31, 2019	AllCoreference Resolution	CodeCode Available	1
Sentence Level Representation And Language Models In The Task Of Coreference Resolution For Russian	May 29, 2019	coreference-resolutionCoreference Resolution	—Unverified	0
Incorporating Context and External Knowledge for Pronoun Coreference Resolution	May 24, 2019	coreference-resolutionCoreference Resolution	CodeCode Available	0
A Surprisingly Robust Trick for Winograd Schema Challenge	May 15, 2019	Common Sense ReasoningCoreference Resolution	CodeCode Available	1
SP-10K: A Large-scale Evaluation Set for Selectional Preference Acquisition	May 14, 2019	coreference-resolutionCoreference Resolution	CodeCode Available	0
SocialIQA: Commonsense Reasoning about Social Interactions	Apr 22, 2019	Common Sense ReasoningCoreference Resolution	CodeCode Available	0
Unsupervised Deep Structured Semantic Models for Commonsense Reasoning	Apr 3, 2019	Common Sense ReasoningCoreference Resolution	—Unverified	0
CLEVR-Dialog: A Diagnostic Dataset for Multi-Round Reasoning in Visual Dialog	Mar 7, 2019	coreference-resolutionCoreference Resolution	CodeCode Available	0
Language Models are Unsupervised Multitask Learners	Feb 14, 2019	Common Sense ReasoningCoreference Resolution	CodeCode Available	1

Show:10 25 50

← PrevPage 18 of 36Next →

All datasets Winograd Schema Challenge OntoNotes CoNLL-2012 GAP DWIE WikiCoref CoNLL12 LitBank OntoGUM PreCo STM-coref XWinograd EN

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PaLM 540B (fine-tuned)	Accuracy	100	—	Unverified
2	Vega v2 6B (KD-based prompt transfer)	Accuracy	98.6	—	Unverified
3	UL2 20B (fine-tuned)	Accuracy	98.1	—	Unverified
4	Turing NLR v5 XXL 5.4B (fine-tuned)	Accuracy	97.3	—	Unverified
5	ST-MoE-32B 269B (fine-tuned)	Accuracy	96.6	—	Unverified
6	DeBERTa-1.5B	Accuracy	95.9	—	Unverified
7	T5-XXL 11B (fine-tuned)	Accuracy	93.8	—	Unverified
8	ST-MoE-L 4.1B (fine-tuned)	Accuracy	93.3	—	Unverified
9	RoBERTa-WinoGrande 355M	Accuracy	90.1	—	Unverified
10	Flan-T5 XXL (zero -shot)	Accuracy	89.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Maverick_mes	F1	83.6	—	Unverified
2	seq2seq	F1	83.3	—	Unverified
3	ASP+T0-3B	F1	82.3	—	Unverified
4	caw-coref + RoBERTa	F1	81.6	—	Unverified
5	LingMess	F1	81.4	—	Unverified
6	wl-coref + RoBERTa	F1	81	—	Unverified
7	U-MEM + Longformer	F1	80.9	—	Unverified
8	longdoc S (OntoNotes + 60k pseudo-singletons)	F1	80.6	—	Unverified
9	G2GT SpanBERT-large reduced	F1	80.5	—	Unverified
10	G2GT SpanBERT-large overlap	F1	80.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Maverick_mes	Avg F1	83.6	—	Unverified
2	seq2seq	Avg F1	83.3	—	Unverified
3	CorefQA + SpanBERT-large	Avg F1	83.1	—	Unverified
4	ASP+T0-3B	Avg F1	82.3	—	Unverified
5	wl-coref + RoBERTa	Avg F1	81	—	Unverified
6	s2e + Longformer-Large	Avg F1	80.3	—	Unverified
7	SpanBERT + Cluster Merging	Avg F1	80.2	—	Unverified
8	c2f + SpanBERT-Large	Avg F1	80.2	—	Unverified
9	CorefQA + SpanBERT-base	Avg F1	79.9	—	Unverified
10	U-MEM* + SpanBERT-large	Avg F1	79.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Coref-MTL	Overall F1	92.72	—	Unverified
2	ProBERT	Overall F1	92.5	—	Unverified
3	Maverick_incr	Overall F1	91.2	—	Unverified
4	Full Ensemble	Overall F1	90.2	—	Unverified
5	PeTra	F1	85.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	REXEL	Avg. F1	95.12	—	Unverified
2	Joint	Avg. F1	91.6	—	Unverified
3	KB-both	Avg. F1	91.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Maverick_mes	F1	66.8	—	Unverified
2	longdoc S (ON + PreCo + LitBank + 30k pseudo-singletons)	F1	62.5	—	Unverified
3	longdoc S (OntoNotes + PreCo + LitBank)	F1	60.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DeepStruct multi-task w/ finetune	Average F1	73.1	—	Unverified
2	DeepStruct multi-task	Average F1	60.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Maverick_incr	Avg F1	78.3	—	Unverified
2	longdoc S (OntoNotes + PreCo + LitBank)	F1	78.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MTL-coref	Avg F1	68.2	—	Unverified
2	SpanBERT	Avg F1	64.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Maverick_incr	F1	88	—	Unverified
2	longdoc S (OntoNotes + PreCo + LitBank)	F1	87.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BFCR + SpanBERT + Transfer Learning	CoNLL F1	61.4	—	Unverified
2	BFCR + SpanBERT	CoNLL F1	50.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	mT0-13B	Accuracy	81.29	—	Unverified
2	BLOOMZ	Accuracy	69.08	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	mT0-13B	Accuracy	78.31	—	Unverified
2	BLOOMZ	Accuracy	68.67	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	longdoc S (OntoNotes + PreCo + LitBank)	F1	42.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	dali-full-anaphora	Avg F1	77.9	—	Unverified