Semantic Textual Similarity

Semantic textual similarity deals with determining how similar two pieces of texts are. This can take the form of assigning a score from 1 to 5. Related tasks are paraphrase or duplicate identification.

Image source: Learning Semantic Textual Similarity from Conversations

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 651–675 of 2381 papers

Title	Date	Tasks	Status
Distributional Measures of Semantic Distance: A Survey	Mar 8, 2012	Semantic SimilaritySemantic Textual Similarity	—Unverified
Distributional Neural Networks for Automatic Resolution of Crossword Puzzles	Jul 1, 2015	Information RetrievalSemantic Textual Similarity	—Unverified
Distributional Semantic Concept Models for Entity Relation Discovery	Jun 1, 2015	RelationSemantic Textual Similarity	—Unverified
Distributional Semantics for Resolving Bridging Mentions	Sep 1, 2015	ClusteringCoreference Resolution	—Unverified
Discourse Relation Sense Classification Using Cross-argument Semantic Similarity Based on Word Embeddings	Aug 1, 2016	General ClassificationRelation	—Unverified
DIT: Summarisation and Semantic Expansion in Evaluating Semantic Similarity	Aug 1, 2014	Coreference ResolutionSemantic Similarity	—Unverified
Ditto: A Simple and Efficient Approach to Improve Sentence Embeddings	May 18, 2023	Language ModelingLanguage Modelling	—Unverified
Divide & Conquer for Entailment-aware Multi-hop Evidence Retrieval	Nov 5, 2023	Information RetrievalMulti-hop Question Answering	—Unverified
DKPro Similarity: An Open Source Framework for Text Similarity	Aug 1, 2013	LemmatizationSemantic Textual Similarity	—Unverified
DKPro TC: A Java-based Framework for Supervised Learning Experiments on Textual Data	Jun 1, 2014	Language IdentificationPart-Of-Speech Tagging	—Unverified
DLS@CU at SemEval-2016 Task 1: Supervised Models of Sentence Similarity	Jun 1, 2016	Machine TranslationNatural Language Inference	—Unverified
DLS@CU-CORE: A Simple Machine Learning Model of Semantic Textual Similarity	Jun 1, 2013	BIG-bench Machine LearningInformation Retrieval	—Unverified
Discourse Complements Lexical Semantics for Non-factoid Answer Reranking	Jun 1, 2014	Community Question AnsweringQuestion Answering	—Unverified
DLS@CU: Sentence Similarity from Word Alignment	Aug 1, 2014	Information RetrievalMachine Translation	—Unverified
DOCAL - Vicomtech's Participation in the WMT16 Shared Task on Bilingual Document Alignment	Aug 1, 2016	Machine TranslationSemantic Textual Similarity	—Unverified
DOCK: Detecting Objects by transferring Common-sense Knowledge	Apr 3, 2018	AttributeCommon Sense Reasoning	—Unverified
A Framework for Web Services Retrieval Using Bio Inspired Clustering	Oct 4, 2022	ClusteringRetrieval	—Unverified
Doctoral Advisor or Medical Condition: Towards Entity-specific Rankings of Knowledge Base Properties [Extended Version]	Sep 20, 2017	Semantic SimilaritySemantic Textual Similarity	—Unverified
Document Valuation in LLM Summaries: A Cluster Shapley Approach	May 28, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified
Does Free Word Order Hurt? Assessing the Practical Lexical Function Model for Croatian	Aug 1, 2017	Semantic Textual Similarity	—Unverified
ECNU: Using Traditional Similarity Measurements and Word Embedding for Semantic Textual Similarity Estimation	Jun 1, 2015	Multi-Task LearningNatural Language Inference	—Unverified
EcomScriptBench: A Multi-task Benchmark for E-commerce Script Planning via Step-wise Intention-Driven Product Association	May 21, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified
Do LLMs Exhibit Human-Like Reasoning? Evaluating Theory of Mind in LLMs for Open-Ended Responses	Jun 9, 2024	Question AnsweringSemantic Similarity	—Unverified
BIOSSES: A Semantic Sentence Similarity Estimation System for the Biomedical Domain	Jul 15, 2017	RetrievalSemantic Similarity	—Unverified
Disambiguation of Basic Action Types through Nouns' Telic Qualia	Sep 1, 2013	Semantic Textual SimilarityWord Sense Disambiguation	—Unverified

Show:10 25 50

← PrevPage 27 of 96Next →

All datasets STS Benchmark MTEB MRPC SICK STS13 STS14 STS12 STS15 STS16 MRPC Dev SentEval SICK-R

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	SMARTRoBERTa	Dev Pearson Correlation	92.8	—	Unverified
2	DeBERTa (large)	Accuracy	92.5	—	Unverified
3	SMART-BERT	Dev Pearson Correlation	90	—	Unverified
4	MT-DNN-SMART	Pearson Correlation	0.93	—	Unverified
5	StructBERTRoBERTa ensemble	Pearson Correlation	0.93	—	Unverified
6	Mnet-Sim	Pearson Correlation	0.93	—	Unverified
7	XLNet (single model)	Pearson Correlation	0.93	—	Unverified
8	ALBERT	Pearson Correlation	0.93	—	Unverified
9	T5-11B	Pearson Correlation	0.93	—	Unverified
10	RoBERTa	Pearson Correlation	0.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AnglE-UAE	Spearman Correlation	84.54	—	Unverified
2	ST5-XXL	Spearman Correlation	82.63	—	Unverified
3	ST5-Large	Spearman Correlation	81.83	—	Unverified
4	ST5-XL	Spearman Correlation	81.66	—	Unverified
5	ST5-Base	Spearman Correlation	81.14	—	Unverified
6	MPNet-multilingual	Spearman Correlation	80.73	—	Unverified
7	SGPT-5.8B-nli	Spearman Correlation	80.53	—	Unverified
8	MPNet	Spearman Correlation	80.28	—	Unverified
9	MiniLM-L12	Spearman Correlation	79.8	—	Unverified
10	SimCSE-BERT-sup	Spearman Correlation	79.12	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MT-DNN-SMART	Accuracy	93.7	—	Unverified
2	ALBERT	Accuracy	93.4	—	Unverified
3	RoBERTa (ensemble)	Accuracy	92.3	—	Unverified
4	BigBird	F1	91.5	—	Unverified
5	StructBERTRoBERTa ensemble	Accuracy	91.5	—	Unverified
6	FLOATER-large	Accuracy	91.4	—	Unverified
7	SMART	Accuracy	91.3	—	Unverified
8	RoBERTa-large 355M (MLP quantized vector-wise, fine-tuned)	Accuracy	91	—	Unverified
9	RoBERTa-large 355M + Entailment as Few-shot Learner	F1	91	—	Unverified
10	SpanBERT	Accuracy	90.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromCSE-RoBERTa-large (0.355B)	Spearman Correlation	0.82	—	Unverified
2	PromptEOL+CSE+LLaMA-30B	Spearman Correlation	0.82	—	Unverified
3	PromptEOL+CSE+OPT-13B	Spearman Correlation	0.82	—	Unverified
4	SimCSE-RoBERTalarge	Spearman Correlation	0.82	—	Unverified
5	PromptEOL+CSE+OPT-2.7B	Spearman Correlation	0.81	—	Unverified
6	SentenceBERT	Spearman Correlation	0.75	—	Unverified
7	SRoBERTa-NLI-base	Spearman Correlation	0.74	—	Unverified
8	SRoBERTa-NLI-large	Spearman Correlation	0.74	—	Unverified
9	Dino (STS/̄🦕)	Spearman Correlation	0.74	—	Unverified
10	SBERT-NLI-large	Spearman Correlation	0.74	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AnglE-LLaMA-7B	Spearman Correlation	0.91	—	Unverified
2	AnglE-LLaMA-7B-v2	Spearman Correlation	0.91	—	Unverified
3	PromptEOL+CSE+LLaMA-30B	Spearman Correlation	0.9	—	Unverified
4	PromptEOL+CSE+OPT-13B	Spearman Correlation	0.9	—	Unverified
5	PromptEOL+CSE+OPT-2.7B	Spearman Correlation	0.9	—	Unverified
6	PromCSE-RoBERTa-large (0.355B)	Spearman Correlation	0.89	—	Unverified
7	Trans-Encoder-BERT-large-bi (unsup.)	Spearman Correlation	0.89	—	Unverified
8	Trans-Encoder-BERT-large-cross (unsup.)	Spearman Correlation	0.88	—	Unverified
9	Trans-Encoder-RoBERTa-large-cross (unsup.)	Spearman Correlation	0.88	—	Unverified
10	SimCSE-RoBERTa-large	Spearman Correlation	0.87	—	Unverified