Semantic Textual Similarity

Semantic textual similarity deals with determining how similar two pieces of texts are. This can take the form of assigning a score from 1 to 5. Related tasks are paraphrase or duplicate identification.

Image source: Learning Semantic Textual Similarity from Conversations

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1251–1300 of 2381 papers

Title	Date	Tasks	Status
Logic Constrained Pointer Networks for Interpretable Textual Similarity	Jul 15, 2020	Semantic SimilaritySemantic Textual Similarity	CodeCode Available
Unsupervised Paraphrasing via Deep Reinforcement Learning	Jul 5, 2020	Deep Reinforcement LearningDiversity	—Unverified
CORD19STS: COVID-19 Semantic Textual Similarity Dataset	Jul 5, 2020	Information RetrievalLanguage Modelling	—Unverified
Estimating Mutual Information Between Dense Word Embeddings	Jul 1, 2020	Semantic Textual SimilaritySTS	—Unverified
DeSpin: a prototype system for detecting spin in biomedical publications	Jul 1, 2020	ArticlesRelation Extraction	—Unverified
Evaluating the Utility of Model Configurations and Data Augmentation on Clinical Semantic Textual Similarity	Jul 1, 2020	Data AugmentationSemantic Textual Similarity	—Unverified
Text Classification with Negative Supervision	Jul 1, 2020	ClassificationGeneral Classification	—Unverified
Unsupervised Semantic Hashing with Pairwise Reconstruction	Jul 1, 2020	DecoderSemantic Similarity	CodeCode Available
Class-Similarity Based Label Smoothing for Confidence Calibration	Jun 24, 2020	Decision MakingSemantic Similarity	—Unverified
Exploiting Non-Taxonomic Relations for Measuring Semantic Similarity and Relatedness in WordNet	Jun 22, 2020	ClusteringInformation Retrieval	—Unverified
SqueezeBERT: What can computer vision teach NLP about efficient neural networks?	Jun 19, 2020	Linguistic AcceptabilityNatural Language Inference	CodeCode Available
Canonicalizing Open Knowledge Bases with Multi-Layered Meta-Graph Neural Network	Jun 17, 2020	Graph Neural NetworkNoun Phrase Canonicalization	—Unverified
MixMOOD: A systematic approach to class distribution mismatch in semi-supervised learning using deep dataset dissimilarity measures	Jun 14, 2020	Multi-class ClassificationSemantic Similarity	CodeCode Available
Shoestring: Graph-Based Semi-Supervised Classification With Severely Limited Labeled Data	Jun 1, 2020	ClassificationClustering	—Unverified
Approche supervis\'ee de calcul de similarit\'e s\'emantique entre paires de phrases (Supervised approach to compute semantic similarity between sentence pairs)	Jun 1, 2020	Semantic SimilaritySemantic Textual Similarity	—Unverified
Multi-Modality Cross Attention Network for Image and Sentence Matching	Jun 1, 2020	Semantic SimilaritySemantic Textual Similarity	—Unverified
Boosting Few-Shot Learning With Adaptive Margin Loss	May 28, 2020	Few-Shot Image ClassificationFew-Shot Learning	—Unverified
Learning Tversky Similarity	May 27, 2020	Semantic SimilaritySemantic Textual Similarity	—Unverified
SueNes: A Weakly Supervised Approach to Evaluating Single-Document Summarization via Negative Sampling	May 13, 2020	Abstractive Text SummarizationDocument Embedding	CodeCode Available
Learning to hash with semantic similarity metrics and empirical KL divergence	May 11, 2020	Image RetrievalRetrieval	—Unverified
Autoencoding Pixies: Amortised Variational Inference with Graph Convolutions for Functional Distributional Semantics	May 6, 2020	Language ModelingLanguage Modelling	CodeCode Available
Semi-supervised lung nodule retrieval	May 4, 2020	Binary ClassificationContent-Based Image Retrieval	—Unverified
SAPPHIRE: Simple Aligner for Phrasal Paraphrase with Hierarchical Representation	May 1, 2020	Natural Language InferenceNatural Language Understanding	—Unverified
Building Semantic Grams of Human Knowledge	May 1, 2020	Semantic SimilaritySemantic Textual Similarity	—Unverified
Figure Me Out: A Gold Standard Dataset for Metaphor Interpretation	May 1, 2020	RetrievalSemantic Similarity	—Unverified
Towards a Gold Standard for Evaluating Danish Word Embeddings	May 1, 2020	Semantic SimilaritySemantic Textual Similarity	—Unverified
Multilingual Corpus Creation for Multilingual Semantic Similarity Task	May 1, 2020	Semantic SimilaritySemantic Textual Similarity	—Unverified
Towards Automatic Thesaurus Construction and Enrichment.	May 1, 2020	Semantic SimilaritySemantic Textual Similarity	—Unverified
A French Corpus for Semantic Similarity	May 1, 2020	Information RetrievalMachine Translation	—Unverified
MSD-1030: A Well-built Multi-Sense Evaluation Dataset for Sense Representation Models	May 1, 2020	Semantic SimilaritySemantic Textual Similarity	—Unverified
Spatial Multi-Arrangement for Clustering and Multi-way Similarity Dataset Construction	May 1, 2020	ClusteringSemantic Similarity	—Unverified
A Thesaurus for Biblical Hebrew	May 1, 2020	Semantic SimilaritySemantic Textual Similarity	—Unverified
Urban Dictionary Embeddings for Slang NLP Applications	May 1, 2020	ClusteringSarcasm Detection	—Unverified
Legal-ES: A Set of Large Scale Resources for Spanish Legal Text Processing	May 1, 2020	NavigateSemantic Similarity	—Unverified
Extrapolating Binder Style Word Embeddings to New Words	May 1, 2020	Semantic SimilaritySemantic Textual Similarity	—Unverified
Representing Verbs with Visual Argument Vectors	May 1, 2020	Semantic SimilaritySemantic Textual Similarity	—Unverified
Word Embedding Evaluation in Downstream Tasks and Semantic Analogies	May 1, 2020	named-entity-recognitionNamed Entity Recognition	—Unverified
Combining Word Embeddings and N-grams for Unsupervised Document Summarization	Apr 25, 2020	DiversityDocument Summarization	—Unverified
On Adversarial Examples for Biomedical NLP Tasks	Apr 23, 2020	Language ModelingLanguage Modelling	—Unverified
Evolution of Semantic Similarity -- A Survey	Apr 19, 2020	Semantic SimilaritySemantic Textual Similarity	—Unverified
Style-transfer and Paraphrase: Looking for a Sensible Semantic Similarity Metric	Apr 10, 2020	Machine TranslationSemantic Similarity	—Unverified
MobileBERT: a Compact Task-Agnostic BERT for Resource-Limited Devices	Apr 6, 2020	Natural Language InferenceQuestion Answering	CodeCode Available
Beyond Background-Aware Correlation Filters: Adaptive Context Modeling by Hand-Crafted and Deep RGB Features for Visual Tracking	Apr 6, 2020	Semantic SimilaritySemantic Textual Similarity	—Unverified
A random forest based computational model for predicting novel lncRNA-disease associations	Mar 27, 2020	feature selectionPrediction	CodeCode Available
Multi-SimLex: A Large-Scale Evaluation of Multilingual and Cross-Lingual Lexical Semantic Similarity	Mar 10, 2020	Cross-Lingual Word EmbeddingsRepresentation Learning	—Unverified
Unifying Specialist Image Embedding into Universal Image Embedding	Mar 8, 2020	Face VerificationImage Retrieval	—Unverified
Friend Recommendation based on Hashtags Analysis	Mar 7, 2020	ClusteringRecommendation Systems	—Unverified
Comment Ranking Diversification in Forum Discussions	Feb 27, 2020	Re-RankingSemantic Similarity	CodeCode Available
A Quadruplet Loss for Enforcing Semantically Coherent Embeddings in Multi-output Classification Problems	Feb 26, 2020	General ClassificationRetrieval	CodeCode Available
Language-Independent Tokenisation Rivals Language-Specific Tokenisation for Word Similarity Prediction	Feb 25, 2020	Semantic SimilaritySemantic Textual Similarity	—Unverified

Show:10 25 50

← PrevPage 26 of 48Next →

All datasets STS Benchmark MTEB MRPC SICK STS13 STS14 STS12 STS15 STS16 MRPC Dev SentEval SICK-R

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	SMARTRoBERTa	Dev Pearson Correlation	92.8	—	Unverified
2	DeBERTa (large)	Accuracy	92.5	—	Unverified
3	SMART-BERT	Dev Pearson Correlation	90	—	Unverified
4	MT-DNN-SMART	Pearson Correlation	0.93	—	Unverified
5	StructBERTRoBERTa ensemble	Pearson Correlation	0.93	—	Unverified
6	Mnet-Sim	Pearson Correlation	0.93	—	Unverified
7	XLNet (single model)	Pearson Correlation	0.93	—	Unverified
8	ALBERT	Pearson Correlation	0.93	—	Unverified
9	T5-11B	Pearson Correlation	0.93	—	Unverified
10	RoBERTa	Pearson Correlation	0.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AnglE-UAE	Spearman Correlation	84.54	—	Unverified
2	ST5-XXL	Spearman Correlation	82.63	—	Unverified
3	ST5-Large	Spearman Correlation	81.83	—	Unverified
4	ST5-XL	Spearman Correlation	81.66	—	Unverified
5	ST5-Base	Spearman Correlation	81.14	—	Unverified
6	MPNet-multilingual	Spearman Correlation	80.73	—	Unverified
7	SGPT-5.8B-nli	Spearman Correlation	80.53	—	Unverified
8	MPNet	Spearman Correlation	80.28	—	Unverified
9	MiniLM-L12	Spearman Correlation	79.8	—	Unverified
10	SimCSE-BERT-sup	Spearman Correlation	79.12	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MT-DNN-SMART	Accuracy	93.7	—	Unverified
2	ALBERT	Accuracy	93.4	—	Unverified
3	RoBERTa (ensemble)	Accuracy	92.3	—	Unverified
4	BigBird	F1	91.5	—	Unverified
5	StructBERTRoBERTa ensemble	Accuracy	91.5	—	Unverified
6	FLOATER-large	Accuracy	91.4	—	Unverified
7	SMART	Accuracy	91.3	—	Unverified
8	RoBERTa-large 355M (MLP quantized vector-wise, fine-tuned)	Accuracy	91	—	Unverified
9	RoBERTa-large 355M + Entailment as Few-shot Learner	F1	91	—	Unverified
10	SpanBERT	Accuracy	90.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromCSE-RoBERTa-large (0.355B)	Spearman Correlation	0.82	—	Unverified
2	PromptEOL+CSE+LLaMA-30B	Spearman Correlation	0.82	—	Unverified
3	PromptEOL+CSE+OPT-13B	Spearman Correlation	0.82	—	Unverified
4	SimCSE-RoBERTalarge	Spearman Correlation	0.82	—	Unverified
5	PromptEOL+CSE+OPT-2.7B	Spearman Correlation	0.81	—	Unverified
6	SentenceBERT	Spearman Correlation	0.75	—	Unverified
7	SRoBERTa-NLI-base	Spearman Correlation	0.74	—	Unverified
8	SRoBERTa-NLI-large	Spearman Correlation	0.74	—	Unverified
9	Dino (STS/̄🦕)	Spearman Correlation	0.74	—	Unverified
10	SBERT-NLI-large	Spearman Correlation	0.74	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AnglE-LLaMA-7B	Spearman Correlation	0.91	—	Unverified
2	AnglE-LLaMA-7B-v2	Spearman Correlation	0.91	—	Unverified
3	PromptEOL+CSE+LLaMA-30B	Spearman Correlation	0.9	—	Unverified
4	PromptEOL+CSE+OPT-13B	Spearman Correlation	0.9	—	Unverified
5	PromptEOL+CSE+OPT-2.7B	Spearman Correlation	0.9	—	Unverified
6	PromCSE-RoBERTa-large (0.355B)	Spearman Correlation	0.89	—	Unverified
7	Trans-Encoder-BERT-large-bi (unsup.)	Spearman Correlation	0.89	—	Unverified
8	Trans-Encoder-BERT-large-cross (unsup.)	Spearman Correlation	0.88	—	Unverified
9	Trans-Encoder-RoBERTa-large-cross (unsup.)	Spearman Correlation	0.88	—	Unverified
10	SimCSE-RoBERTa-large	Spearman Correlation	0.87	—	Unverified