Paraphrase Identification

The goal of Paraphrase Identification is to determine whether a pair of sentences have the same meaning.

Source: Adversarial Examples with Difficult Common Words for Paraphrase Identification

Image source: On Paraphrase Identification Corpora

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–50 of 172 papers

Title	Date	Tasks	Status	Hype	Score
Scaling Instruction-Finetuned Language Models	Oct 20, 2022	Coreference ResolutionCross-Lingual Question Answering	CodeCode Available	3	5
BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding	Oct 11, 2018	Citation Intent ClassificationCommon Sense Reasoning	CodeCode Available	3	5
PAWS-X: A Cross-lingual Adversarial Dataset for Paraphrase Identification	Aug 30, 2019	Paraphrase IdentificationSentence	CodeCode Available	2	5
BET: A Backtranslation Approach for Easy Data Augmentation in Transformer-based Paraphrase Identification Context	Sep 25, 2020	Data AugmentationMRPC	CodeCode Available	1	5
Charformer: Fast Character Transformers via Gradient-based Subword Tokenization	Jun 23, 2021	Inductive BiasLinguistic Acceptability	CodeCode Available	1	5
RealFormer: Transformer Likes Residual Attention	Dec 21, 2020	Language ModelingLanguage Modelling	CodeCode Available	1	5
TSDAE: Using Transformer-based Sequential Denoising Auto-Encoder for Unsupervised Sentence Embedding Learning	Apr 14, 2021	DenoisingDomain Adaptation	CodeCode Available	1	5
XLNet: Generalized Autoregressive Pretraining for Language Understanding	Jun 19, 2019	Audio Question AnsweringChinese Reading Comprehension	CodeCode Available	1	5
Improving Paraphrase Detection with the Adversarial Paraphrasing Task	Jun 14, 2021	Dataset GenerationParaphrase Identification	CodeCode Available	1	5
FNet: Mixing Tokens with Fourier Transforms	May 9, 2021	Linguistic AcceptabilityMachine Translation	CodeCode Available	1	5
SMART: Robust and Efficient Fine-Tuning for Pre-trained Natural Language Models through Principled Regularized Optimization	Nov 8, 2019	Linguistic AcceptabilityNatural Language Inference	CodeCode Available	1	5
An Empirical Study on Robustness to Spurious Correlations using Pre-trained Language Models	Jul 14, 2020	DiversityMulti-Task Learning	CodeCode Available	1	5
Modelling Latent Translations for Cross-Lingual Transfer	Jul 23, 2021	Cross-Lingual TransferFew-Shot Learning	CodeCode Available	1	5
PARADE: A New Dataset for Paraphrase Identification Requiring Computer Science Domain Knowledge	Oct 8, 2020	Paraphrase Identification	CodeCode Available	1	5
Do Multilingual Language Models Think Better in English?	Aug 2, 2023	Common Sense ReasoningCross-Lingual Natural Language Inference	CodeCode Available	1	5
NMTScore: A Multilingual Analysis of Translation-based Text Similarity Measures	Apr 28, 2022	Data-to-Text GenerationMachine Translation	CodeCode Available	1	5
Trans-Encoder: Unsupervised sentence-pair modelling through self- and mutual-distillations	Sep 27, 2021	Contrastive LearningLanguage Modelling	CodeCode Available	1	5
What Do Questions Exactly Ask? MFAE: Duplicate Question Identification with Multi-Fusion Asking Emphasis	May 7, 2020	Community Question AnsweringNatural Language Inference	CodeCode Available	1	5
data2vec: A General Framework for Self-supervised Learning in Speech, Vision and Language	Feb 7, 2022	image-classificationImage Classification	CodeCode Available	1	5
Adversarial Semantic Collisions	Nov 9, 2020	Extractive SummarizationParaphrase Identification	CodeCode Available	1	5
Factorising Meaning and Form for Intent-Preserving Paraphrasing	May 31, 2021	DecoderForm	CodeCode Available	1	5
Improving word mover's distance by leveraging self-attention matrix	Nov 11, 2022	Paraphrase IdentificationSemantic Similarity	CodeCode Available	1	5
Intrinsic Dimensionality Explains the Effectiveness of Language Model Fine-Tuning	Dec 22, 2020	Generalization BoundsLanguage Modeling	CodeCode Available	1	5
Self-Explaining Structures Improve NLP Models	Dec 3, 2020	Natural Language InferenceParaphrase Identification	CodeCode Available	1	5
Entailment as Few-Shot Learner	Apr 29, 2021	Contrastive LearningData Augmentation	CodeCode Available	1	5
Modelling Sentence Pairs with Tree-structured Attentive Encoder	Oct 10, 2016	Paraphrase IdentificationQuestion Selection	CodeCode Available	0	5
Bilateral Multi-Perspective Matching for Natural Language Sentences	Feb 13, 2017	Natural Language InferenceParaphrase Identification	CodeCode Available	0	5
Adaptation of Deep Bidirectional Multilingual Transformers for Russian Language	May 17, 2019	Natural Language InferenceParaphrase Identification	CodeCode Available	0	5
Memory-efficient Stochastic methods for Memory-based Transformers	Nov 14, 2023	Language ModelingLanguage Modelling	CodeCode Available	0	5
Learning to Represent Bilingual Dictionaries	Aug 10, 2018	Multi-Task LearningParaphrase Identification	CodeCode Available	0	5
Multi-Task Deep Neural Networks for Natural Language Understanding	Jan 31, 2019	Domain AdaptationLanguage Modeling	CodeCode Available	0	5
Is Modularity Transferable? A Case Study through the Lens of Knowledge Distillation	Mar 27, 2024	Domain AdaptationKnowledge Distillation	CodeCode Available	0	5
Dice Loss for Data-imbalanced NLP Tasks	Nov 7, 2019	Chinese Named Entity RecognitionMachine Reading Comprehension	CodeCode Available	0	5
Is Prompt-Based Finetuning Always Better than Vanilla Finetuning? Insights from Cross-Lingual Language Understanding	Jul 15, 2023	Cross-Lingual TransferNatural Language Inference	CodeCode Available	0	5
Learning General Purpose Distributed Sentence Representations via Large Scale Multi-task Learning	Mar 30, 2018	Multi-Task LearningNatural Language Inference	CodeCode Available	0	5
Multiway Attention Networks for Modeling Sentence Pairs	Jul 1, 2018	Natural Language InferenceParaphrase Identification	CodeCode Available	0	5
Match-Prompt: Improving Multi-task Generalization Ability for Neural Text Matching via Prompt Learning	Apr 6, 2022	Information RetrievalParaphrase Identification	CodeCode Available	0	5
GAPX: Generalized Autoregressive Paraphrase-Identification X	Oct 5, 2022	Paraphrase Identification	CodeCode Available	0	5
Idiom Paraphrases: Seventh Heaven vs Cloud Nine	Sep 1, 2015	Natural Language InferenceParaphrase Identification	CodeCode Available	0	5
Cross-functional Analysis of Generalisation in Behavioural Learning	May 22, 2023	Paraphrase IdentificationReading Comprehension	CodeCode Available	0	5
A Study of MatchPyramid Models on Ad-hoc Retrieval	Jun 15, 2016	Machine TranslationParaphrase Identification	CodeCode Available	0	5
Convolutional Neural Network for Paraphrase Identification	May 1, 2015	ARCBinary Classification	CodeCode Available	0	5
Assessing Word Importance Using Models Trained for Semantic Tasks	May 31, 2023	Natural Language InferenceParaphrase Identification	CodeCode Available	0	5
Adversarial Self-Attention for Language Understanding	Jun 25, 2022	Machine Reading ComprehensionNamed Entity Recognition (NER)	CodeCode Available	0	5
ERNIE: Enhanced Language Representation with Informative Entities	May 17, 2019	Entity LinkingEntity Typing	CodeCode Available	0	5
TinyBERT: Distilling BERT for Natural Language Understanding	Sep 23, 2019	Knowledge DistillationLanguage Modelling	CodeCode Available	0	5
ETPC - A Paraphrase Identification Corpus Annotated with Extended Paraphrase Typology and Negation	May 1, 2018	Natural Language InferenceNegation	CodeCode Available	0	5
ABCNN: Attention-Based Convolutional Neural Network for Modeling Sentence Pairs	Dec 16, 2015	Answer SelectionNatural Language Inference	CodeCode Available	0	5
Balanced Adversarial Training: Balancing Tradeoffs between Fickleness and Obstinacy in NLP Models	Oct 20, 2022	Contrastive LearningNatural Language Inference	CodeCode Available	0	5
Sentence Embeddings for Russian NLU	Oct 29, 2019	Multiple-choiceParaphrase Identification	CodeCode Available	0	5

Show:10 25 50

← PrevPage 1 of 4Next →

All datasets Quora Question Pairs MSRP Quora Question Pairs Dev 2017_test set AP IMDb PIT Translated SNLI Dataset in Marathi TURL WikiHop Yelp

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	BERT-Base	Direct Intrinsic Dimension	9,295	—	Unverified
2	data2vec	Accuracy	92.4	—	Unverified
3	SMART-BERT	Dev Accuracy	91.5	—	Unverified
4	ALICE	F1	90.7	—	Unverified
5	MFAE	Accuracy	90.54	—	Unverified
6	RoBERTa-large 355M + Entailment as Few-shot Learner	F1	89.2	—	Unverified
7	MwAN	Accuracy	89.12	—	Unverified
8	DIIN	Accuracy	89.06	—	Unverified
9	MSEM	Accuracy	88.86	—	Unverified
10	Bi-CAS-LSTM	Accuracy	88.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	FEAT2, TFKLD, SVM, Fine-grained features	Accuracy	80.41	—	Unverified
2	NMF factorization-unigrams-TFKLD	Accuracy	72.75	—	Unverified
3	SWEM-concat	Accuracy	71.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BERT + SCH attm	Val Accuracy	91.42	—	Unverified
2	BERT + SCH attn	Val F1 Score	88.44	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CNN	10 fold Cross validation	50	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RoBETRa base	MCC	0.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SplitEE-S	Accuracy	82.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TSDAE	AP	69.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Weighted Ensemble of TF-IDF and BERT Embeddings	1:1 Accuracy	82.04	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TSDAE	AP	76.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	StructBERTRoBERTa ensemble	Accuracy	90.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SplitEE-S	Accuracy	76.7	—	Unverified