Semantic Textual Similarity

Semantic textual similarity deals with determining how similar two pieces of texts are. This can take the form of assigning a score from 1 to 5. Related tasks are paraphrase or duplicate identification.

Image source: Learning Semantic Textual Similarity from Conversations

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 501–550 of 2381 papers

Title	Date	Tasks	Status
Can Translation Memories afford not to use paraphrasing?	May 1, 2015	Semantic Textual SimilarityTranslation	—Unverified
AMRITA\_CEN@SemEval-2015: Paraphrase Detection for Twitter using Unsupervised Feature Learning with Recursive Autoencoders	Jun 1, 2015	Information RetrievalMachine Translation	—Unverified
Contrastive Semantic Similarity Learning for Image Captioning Evaluation with Intrinsic Auto-encoder	Jun 29, 2021	Image CaptioningRepresentation Learning	—Unverified
Contrastive Visual Semantic Pretraining Magnifies the Semantics of Natural Language Representations	Mar 14, 2022	Image CaptioningSemantic Textual Similarity	—Unverified
Contrastive Word Embedding Learning for Neural Machine Translation	Sep 17, 2021	Machine TranslationNMT	—Unverified
Attention-based Cross-Layer Domain Alignment for Unsupervised Domain Adaptation	Feb 27, 2022	Domain AdaptationSemantic Similarity	—Unverified
Canonicalizing Open Knowledge Bases with Multi-Layered Meta-Graph Neural Network	Jun 17, 2020	Graph Neural NetworkNoun Phrase Canonicalization	—Unverified
ConvFiT: Conversational Fine-Tuning of Pretrained Language Models	Sep 21, 2021	Intent DetectionRetrieval	—Unverified
ArbEngVec : Arabic-English Cross-Lingual Word Embedding Model	Aug 1, 2019	Information RetrievalMachine Translation	—Unverified
Convolutional neural networks for structured omics: OmicsCNN and the OmicsConv layer	Oct 16, 2017	Deep LearningSemantic Similarity	—Unverified
Can LLMs Replace Human Evaluators? An Empirical Study of LLM-as-a-Judge in Software Engineering	Feb 10, 2025	Code GenerationCode Summarization	—Unverified
Can GPT models Follow Human Summarization Guidelines? Evaluating ChatGPT and GPT-4 for Dialogue Summarization	Oct 25, 2023	Semantic SimilaritySemantic Textual Similarity	—Unverified
A Rank-Based Similarity Metric for Word Embeddings	May 4, 2018	ClusteringOutlier Detection	—Unverified
A Comprehensive Framework for Semantic Similarity Analysis of Human and AI-Generated Text Using Transformer Architectures and Ensemble Techniques	Jan 24, 2025	Data AugmentationDomain Adaptation	—Unverified
A Joint Model for Answer Sentence Ranking and Answer Extraction	Jan 1, 2016	Information RetrievalQuestion Answering	—Unverified
A Quantitative Approach to Evaluating Open-Source EHR Systems for Indian Healthcare	Mar 27, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified
Calculating Semantic Similarity between Academic Articles using Topic Event and Ontology	Nov 30, 2017	Articlesdocument understanding	—Unverified
Enhancing Semantic Similarity Understanding in Arabic NLP with Nested Embedding Learning	Jul 30, 2024	Natural Language InferenceSemantic Similarity	—Unverified
DeSpin: a prototype system for detecting spin in biomedical publications	Jul 1, 2020	ArticlesRelation Extraction	—Unverified
BUT-TYPED: Using domain knowledge for computing typed similarity	Jun 1, 2013	Semantic Textual Similarity	—Unverified
Bundle Optimization for Multi-aspect Embedding	Mar 29, 2017	Clusteringimage-classification	—Unverified
A Comparison of Vector-based Representations for Semantic Composition	Jul 1, 2012	Language ModellingSemantic Composition	—Unverified
Building Static Embeddings from Contextual Ones: Is It Useful for Building Distributional Thesauri?	Jun 1, 2022	Semantic SimilaritySemantic Textual Similarity	—Unverified
Building Specialized Bilingual Lexicons Using Word Sense Disambiguation	Oct 1, 2013	Semantic Textual SimilarityWord Sense Disambiguation	—Unverified
A Preliminary Evaluation of the Impact of Syntactic Structure in Semantic Textual Similarity and Semantic Relatedness Tasks	Jun 1, 2015	Semantic Textual SimilarityWord Alignment	—Unverified
3D Compositional Zero-shot Learning with DeCompositional Consensus	Nov 29, 2021	BenchmarkingCompositional Zero-Shot Learning	—Unverified
Building Semantic Grams of Human Knowledge	May 1, 2020	Semantic SimilaritySemantic Textual Similarity	—Unverified
Building RadiologyNET: Unsupervised annotation of a large-scale multimodal medical database	Jul 27, 2023	ClusteringMedical Diagnosis	—Unverified
A practical method for occupational skills detection in Vietnamese job listings	Oct 26, 2022	named-entity-recognitionNamed Entity Recognition	—Unverified
Building Lexical Vector Representations from Concept Definitions	Apr 1, 2017	Dependency ParsingMachine Translation	—Unverified
Building Interpretable and Reliable Open Information Retriever for New Domains Overnight	Aug 9, 2023	Information RetrievalOpen-Domain Question Answering	—Unverified
Approximating Human-Like Few-shot Learning with GPT-based Compression	Aug 14, 2023	Data CompressionFew-Shot Learning	—Unverified
AI-KU: Using Co-Occurrence Modeling for Semantic Similarity	Aug 1, 2014	Information RetrievalLanguage Modelling	—Unverified
DerivBase.hr: A High-Coverage Derivational Morphology Resource for Croatian	May 1, 2014	ClusteringLemmatization	—Unverified
Detecting Backdoor Attacks via Similarity in Semantic Communication Systems	Feb 6, 2025	Semantic CommunicationSemantic Similarity	—Unverified
Building Concept Graphs from Monolingual Dictionary Entries	May 1, 2016	Semantic Textual Similarity	—Unverified
Building a Synthetic Biomedical Research Article Citation Linkage Corpus	Jun 1, 2022	Semantic SimilaritySemantic Textual Similarity	—Unverified
Approche supervis\'ee de calcul de similarit\'e s\'emantique entre paires de phrases (Supervised approach to compute semantic similarity between sentence pairs)	Jun 1, 2020	Semantic SimilaritySemantic Textual Similarity	—Unverified
Building a Semantic Transparency Dataset of Chinese Nominal Compounds: A Practice of Crowdsourcing Methodology	Aug 1, 2014	Semantic Textual Similarity	—Unverified
Building and Evaluating a Distributional Memory for Croatian	Aug 1, 2013	Semantic Textual Similarity	—Unverified
Apport des ontologies pour le calcul de la similarité sémantique au sein d'un système de recommandation	May 25, 2022	Recommendation SystemsSemantic Similarity	—Unverified
AI-based Approach for Safety Signals Detection from Social Networks: Application to the Levothyrox Scandal in 2017 on Doctissimo Forum	Feb 1, 2022	PharmacovigilanceSemantic Similarity	—Unverified
Building a Dataset of Multilingual Cognates for the Romanian Lexicon	May 1, 2014	Cross-Lingual Information RetrievalInformation Retrieval	—Unverified
BUCC 2017 Shared Task: a First Attempt Toward a Deep Learning Framework for Identifying Parallel Sentences in Comparable Corpora	Aug 1, 2017	Feature EngineeringLanguage Modeling	—Unverified
Applying Transfer Learning for Improving Domain-Specific Search Experience Using Query to Question Similarity	Jan 7, 2021	QQPQuestion Similarity	—Unverified
BUAP: Lexical and Semantic Similarity for Cross-lingual Textual Entailment	Jul 1, 2012	Natural Language InferenceSemantic Similarity	—Unverified
BUAP: Evaluating Features for Multilingual and Cross-Level Semantic Textual Similarity	Aug 1, 2014	Information RetrievalMachine Reading Comprehension	—Unverified
Applying Multi-Sense Embeddings for German Verbs to Determine Semantic Relatedness and to Detect Non-Literal Language	Apr 1, 2017	Semantic Textual SimilarityWord Embeddings	—Unverified
A Hybrid Neural Network Model for Commonsense Reasoning	Jul 27, 2019	Common Sense ReasoningCoreference Resolution	—Unverified
A Comparison of Smoothing Techniques for Bilingual Lexicon Extraction from Comparable Corpora	Aug 1, 2013	Information RetrievalLanguage Modelling	—Unverified

Show:10 25 50

← PrevPage 11 of 48Next →

All datasets STS Benchmark MTEB MRPC SICK STS13 STS14 STS12 STS15 STS16 MRPC Dev SentEval SICK-R

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	SMARTRoBERTa	Dev Pearson Correlation	92.8	—	Unverified
2	DeBERTa (large)	Accuracy	92.5	—	Unverified
3	SMART-BERT	Dev Pearson Correlation	90	—	Unverified
4	MT-DNN-SMART	Pearson Correlation	0.93	—	Unverified
5	StructBERTRoBERTa ensemble	Pearson Correlation	0.93	—	Unverified
6	Mnet-Sim	Pearson Correlation	0.93	—	Unverified
7	XLNet (single model)	Pearson Correlation	0.93	—	Unverified
8	ALBERT	Pearson Correlation	0.93	—	Unverified
9	T5-11B	Pearson Correlation	0.93	—	Unverified
10	RoBERTa	Pearson Correlation	0.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AnglE-UAE	Spearman Correlation	84.54	—	Unverified
2	ST5-XXL	Spearman Correlation	82.63	—	Unverified
3	ST5-Large	Spearman Correlation	81.83	—	Unverified
4	ST5-XL	Spearman Correlation	81.66	—	Unverified
5	ST5-Base	Spearman Correlation	81.14	—	Unverified
6	MPNet-multilingual	Spearman Correlation	80.73	—	Unverified
7	SGPT-5.8B-nli	Spearman Correlation	80.53	—	Unverified
8	MPNet	Spearman Correlation	80.28	—	Unverified
9	MiniLM-L12	Spearman Correlation	79.8	—	Unverified
10	SimCSE-BERT-sup	Spearman Correlation	79.12	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MT-DNN-SMART	Accuracy	93.7	—	Unverified
2	ALBERT	Accuracy	93.4	—	Unverified
3	RoBERTa (ensemble)	Accuracy	92.3	—	Unverified
4	BigBird	F1	91.5	—	Unverified
5	StructBERTRoBERTa ensemble	Accuracy	91.5	—	Unverified
6	FLOATER-large	Accuracy	91.4	—	Unverified
7	SMART	Accuracy	91.3	—	Unverified
8	RoBERTa-large 355M (MLP quantized vector-wise, fine-tuned)	Accuracy	91	—	Unverified
9	RoBERTa-large 355M + Entailment as Few-shot Learner	F1	91	—	Unverified
10	SpanBERT	Accuracy	90.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromCSE-RoBERTa-large (0.355B)	Spearman Correlation	0.82	—	Unverified
2	PromptEOL+CSE+LLaMA-30B	Spearman Correlation	0.82	—	Unverified
3	PromptEOL+CSE+OPT-13B	Spearman Correlation	0.82	—	Unverified
4	SimCSE-RoBERTalarge	Spearman Correlation	0.82	—	Unverified
5	PromptEOL+CSE+OPT-2.7B	Spearman Correlation	0.81	—	Unverified
6	SentenceBERT	Spearman Correlation	0.75	—	Unverified
7	SRoBERTa-NLI-base	Spearman Correlation	0.74	—	Unverified
8	SRoBERTa-NLI-large	Spearman Correlation	0.74	—	Unverified
9	Dino (STS/̄🦕)	Spearman Correlation	0.74	—	Unverified
10	SBERT-NLI-large	Spearman Correlation	0.74	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AnglE-LLaMA-7B	Spearman Correlation	0.91	—	Unverified
2	AnglE-LLaMA-7B-v2	Spearman Correlation	0.91	—	Unverified
3	PromptEOL+CSE+LLaMA-30B	Spearman Correlation	0.9	—	Unverified
4	PromptEOL+CSE+OPT-13B	Spearman Correlation	0.9	—	Unverified
5	PromptEOL+CSE+OPT-2.7B	Spearman Correlation	0.9	—	Unverified
6	PromCSE-RoBERTa-large (0.355B)	Spearman Correlation	0.89	—	Unverified
7	Trans-Encoder-BERT-large-bi (unsup.)	Spearman Correlation	0.89	—	Unverified
8	Trans-Encoder-BERT-large-cross (unsup.)	Spearman Correlation	0.88	—	Unverified
9	Trans-Encoder-RoBERTa-large-cross (unsup.)	Spearman Correlation	0.88	—	Unverified
10	SimCSE-RoBERTa-large	Spearman Correlation	0.87	—	Unverified