Semantic Textual Similarity

Semantic textual similarity deals with determining how similar two pieces of texts are. This can take the form of assigning a score from 1 to 5. Related tasks are paraphrase or duplicate identification.

Image source: Learning Semantic Textual Similarity from Conversations

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1001–1025 of 2381 papers

Title	Date	Tasks	Status
Homa at SemEval-2025 Task 5: Aligning Librarian Records with OntoAligner for Subject Tagging	Apr 30, 2025	RAGRetrieval	—Unverified
Homograph Disambiguation Through Selective Diacritic Restoration	Dec 10, 2019	Machine TranslationPart-Of-Speech Tagging	—Unverified
Evaluating semantic models with word-sentence relatedness	Mar 23, 2016	ImplicaturesSemantic Similarity	—Unverified
Are Multilingual Models the Best Choice for Moderately Under-resourced Languages? A Comprehensive Assessment for Catalan	Jul 16, 2021	Language ModelingLanguage Modelling	—Unverified
A Large Resource of Patterns for Verbal Paraphrases	May 1, 2018	Natural Language InferenceSemantic Textual Similarity	—Unverified
How do Humans and Language Models Reason About Creativity? A Comparative Analysis	Feb 5, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified
How to choose "Good" Samples for Text Data Augmentation	Feb 2, 2023	Data AugmentationSemantic Similarity	—Unverified
How to Evaluate Semantic Communications for Images with ViTScore Metric?	Sep 9, 2023	MS-SSIMSemantic Communication	—Unverified
How to Learn in a Noisy World? Self-Correcting the Real-World Data Noise on Machine Translation	Jul 2, 2024	Machine TranslationSemantic Similarity	—Unverified
Evaluating Retrieval Augmented Generative Models for Document Queries in Transportation Safety	Apr 9, 2025	Information RetrievalRAG	—Unverified
How Vital is the Jurisprudential Relevance: Law Article Intervened Legal Case Retrieval and Matching	Feb 25, 2025	Multi-Task LearningRetrieval	—Unverified
Causal Adversarial Perturbations for Individual Fairness and Robustness in Heterogeneous Data Spaces	Aug 17, 2023	Adversarial RobustnessFairness	—Unverified
Evaluating Multimodal Representations on Sentence Similarity: vSTS, Visual Semantic Textual Similarity Dataset	Sep 11, 2018	Semantic Textual SimilaritySentence	—Unverified
HSI: A Holistic Style Injector for Arbitrary Style Transfer	Feb 5, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified
Are Manually Prepared Affective Lexicons Really Useful for Sentiment Analysis	Nov 1, 2017	Semantic Textual SimilaritySentiment Analysis	—Unverified
HulTech: A General Purpose System for Cross-Level Semantic Similarity based on Anchor Web Counts	Aug 1, 2014	Semantic SimilaritySemantic Textual Similarity	—Unverified
Human Variability vs. Machine Consistency: A Linguistic Analysis of Texts Generated by Humans and Large Language Models	Dec 4, 2024	Semantic SimilaritySemantic Textual Similarity	—Unverified
Evaluating Lexical Similarity to build Sentiment Similarity	May 1, 2016	Information RetrievalRetrieval	—Unverified
Evaluating GenAI for Simplifying Texts for Education: Improving Accuracy and Consistency for Enhanced Readability	Jan 15, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified
Category-Adaptive Label Discovery and Noise Rejection for Multi-label Image Recognition with Partial Positive Labels	Nov 15, 2022	Multi-Label Image RecognitionSemantic Similarity	—Unverified
Evaluating distributed word representations for capturing semantics of biomedical concepts	Jul 1, 2015	ArticlesChunking	—Unverified
HyCIR: Boosting Zero-Shot Composed Image Retrieval with Synthetic Labels	Jul 8, 2024	Contrastive LearningImage Retrieval	—Unverified
Evaluating Deduplication Techniques for Economic Research Paper Titles with a Focus on Semantic Similarity using NLP and LLMs	Oct 2, 2024	Semantic SimilaritySemantic Textual Similarity	—Unverified
CAT: Cross-Attention Transformer for One-Shot Object Detection	Apr 30, 2021	Objectobject-detection	—Unverified
ALANIS at SemEval-2018 Task 3: A Feature Engineering Approach to Irony Detection in English Tweets	Jun 1, 2018	Feature Engineeringregression	—Unverified

Show:10 25 50

← PrevPage 41 of 96Next →

All datasets STS Benchmark MTEB MRPC SICK STS13 STS14 STS12 STS15 STS16 MRPC Dev SentEval SICK-R

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	SMARTRoBERTa	Dev Pearson Correlation	92.8	—	Unverified
2	DeBERTa (large)	Accuracy	92.5	—	Unverified
3	SMART-BERT	Dev Pearson Correlation	90	—	Unverified
4	MT-DNN-SMART	Pearson Correlation	0.93	—	Unverified
5	StructBERTRoBERTa ensemble	Pearson Correlation	0.93	—	Unverified
6	Mnet-Sim	Pearson Correlation	0.93	—	Unverified
7	XLNet (single model)	Pearson Correlation	0.93	—	Unverified
8	ALBERT	Pearson Correlation	0.93	—	Unverified
9	T5-11B	Pearson Correlation	0.93	—	Unverified
10	RoBERTa	Pearson Correlation	0.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AnglE-UAE	Spearman Correlation	84.54	—	Unverified
2	ST5-XXL	Spearman Correlation	82.63	—	Unverified
3	ST5-Large	Spearman Correlation	81.83	—	Unverified
4	ST5-XL	Spearman Correlation	81.66	—	Unverified
5	ST5-Base	Spearman Correlation	81.14	—	Unverified
6	MPNet-multilingual	Spearman Correlation	80.73	—	Unverified
7	SGPT-5.8B-nli	Spearman Correlation	80.53	—	Unverified
8	MPNet	Spearman Correlation	80.28	—	Unverified
9	MiniLM-L12	Spearman Correlation	79.8	—	Unverified
10	SimCSE-BERT-sup	Spearman Correlation	79.12	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MT-DNN-SMART	Accuracy	93.7	—	Unverified
2	ALBERT	Accuracy	93.4	—	Unverified
3	RoBERTa (ensemble)	Accuracy	92.3	—	Unverified
4	BigBird	F1	91.5	—	Unverified
5	StructBERTRoBERTa ensemble	Accuracy	91.5	—	Unverified
6	FLOATER-large	Accuracy	91.4	—	Unverified
7	SMART	Accuracy	91.3	—	Unverified
8	RoBERTa-large 355M (MLP quantized vector-wise, fine-tuned)	Accuracy	91	—	Unverified
9	RoBERTa-large 355M + Entailment as Few-shot Learner	F1	91	—	Unverified
10	SpanBERT	Accuracy	90.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromCSE-RoBERTa-large (0.355B)	Spearman Correlation	0.82	—	Unverified
2	PromptEOL+CSE+LLaMA-30B	Spearman Correlation	0.82	—	Unverified
3	PromptEOL+CSE+OPT-13B	Spearman Correlation	0.82	—	Unverified
4	SimCSE-RoBERTalarge	Spearman Correlation	0.82	—	Unverified
5	PromptEOL+CSE+OPT-2.7B	Spearman Correlation	0.81	—	Unverified
6	SentenceBERT	Spearman Correlation	0.75	—	Unverified
7	SRoBERTa-NLI-base	Spearman Correlation	0.74	—	Unverified
8	SRoBERTa-NLI-large	Spearman Correlation	0.74	—	Unverified
9	Dino (STS/̄🦕)	Spearman Correlation	0.74	—	Unverified
10	SBERT-NLI-large	Spearman Correlation	0.74	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AnglE-LLaMA-7B	Spearman Correlation	0.91	—	Unverified
2	AnglE-LLaMA-7B-v2	Spearman Correlation	0.91	—	Unverified
3	PromptEOL+CSE+LLaMA-30B	Spearman Correlation	0.9	—	Unverified
4	PromptEOL+CSE+OPT-13B	Spearman Correlation	0.9	—	Unverified
5	PromptEOL+CSE+OPT-2.7B	Spearman Correlation	0.9	—	Unverified
6	PromCSE-RoBERTa-large (0.355B)	Spearman Correlation	0.89	—	Unverified
7	Trans-Encoder-BERT-large-bi (unsup.)	Spearman Correlation	0.89	—	Unverified
8	Trans-Encoder-BERT-large-cross (unsup.)	Spearman Correlation	0.88	—	Unverified
9	Trans-Encoder-RoBERTa-large-cross (unsup.)	Spearman Correlation	0.88	—	Unverified
10	SimCSE-RoBERTa-large	Spearman Correlation	0.87	—	Unverified