Semantic Textual Similarity

Semantic textual similarity deals with determining how similar two pieces of texts are. This can take the form of assigning a score from 1 to 5. Related tasks are paraphrase or duplicate identification.

Image source: Learning Semantic Textual Similarity from Conversations

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 251–300 of 2381 papers

Title	Date	Tasks	Status	Hype
Why Not Simply Translate? A First Swedish Evaluation Benchmark for Semantic Similarity	Sep 7, 2020	Machine TranslationSemantic Similarity	CodeCode Available	1
Word Rotator's Distance	Apr 30, 2020	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	1
CgAT: Center-Guided Adversarial Training for Deep Hashing-Based Retrieval	Apr 18, 2022	Adversarial AttackAdversarial Defense	CodeCode Available	1
Attentive Normalization for Conditional Image Generation	Apr 8, 2020	Conditional Image GenerationImage Generation	CodeCode Available	1
Clustering-Aware Negative Sampling for Unsupervised Sentence Representation	May 17, 2023	ClusteringContrastive Learning	CodeCode Available	1
AugCSE: Contrastive Sentence Embedding with Diverse Augmentations	Oct 20, 2022	Data AugmentationDomain Adaptation	CodeCode Available	1
Audio-Visual Class-Incremental Learning	Aug 21, 2023	class-incremental learningClass Incremental Learning	CodeCode Available	1
Calibrating Higher-Order Statistics for Few-Shot Class-Incremental Learning with Pre-trained Vision Transformers	Apr 9, 2024	class-incremental learningClass Incremental Learning	CodeCode Available	1
A Deep Reinforced Model for Zero-Shot Cross-Lingual Summarization with Bilingual Semantic Similarity Rewards	Jun 27, 2020	Machine Translationreinforcement-learning	CodeCode Available	1
CDF-RAG: Causal Dynamic Feedback for Adaptive Retrieval-Augmented Generation	Apr 17, 2025	RAGRetrieval	CodeCode Available	1
Cue-CoT: Chain-of-thought Prompting for Responding to In-depth Dialogue Questions with LLMs	May 19, 2023	Question AnsweringSemantic Similarity	CodeCode Available	1
Charformer: Fast Character Transformers via Gradient-based Subword Tokenization	Jun 23, 2021	Inductive BiasLinguistic Acceptability	CodeCode Available	1
Attributable Visual Similarity Learning	Mar 28, 2022	Metric LearningSemantic Similarity	CodeCode Available	1
Compositional Evaluation on Japanese Textual Entailment and Similarity	Aug 9, 2022	Natural Language InferenceSemantic Textual Similarity	CodeCode Available	1
ConSERT: A Contrastive Framework for Self-Supervised Sentence Representation Transfer	May 25, 2021	Contrastive LearningSemantic Textual Similarity	CodeCode Available	1
Context-Aware Semantic Similarity Measurement for Unsupervised Word Sense Disambiguation	May 5, 2023	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	1
Reconstruct Your Previous Conversations! Comprehensively Investigating Privacy Leakage Risks in Conversations with GPT Models	Feb 5, 2024	Reconstruction AttackSemantic Similarity	CodeCode Available	1
Towards Better Understanding of User Satisfaction in Open-Domain Conversational Search	Apr 6, 2022	Conversational SearchSemantic Similarity	CodeCode Available	1
Crisscrossed Captions: Extended Intramodal and Intermodal Semantic Similarity Judgments for MS-COCO	Apr 30, 2020	Image CaptioningRepresentation Learning	CodeCode Available	1
Cross-lingual Text Classification with Heterogeneous Graph Neural Network	May 24, 2021	ClassificationGraph Neural Network	CodeCode Available	1
CALM : A Multi-task Benchmark for Comprehensive Assessment of Language Model Bias	Aug 24, 2023	DiversityLanguage Modeling	CodeCode Available	1
CmdCaliper: A Semantic-Aware Command-Line Embedding Model and Dataset for Security Research	Nov 2, 2024	Line DetectionSemantic Similarity	CodeCode Available	1
AutoKG: Efficient Automated Knowledge Graph Generation for Language Models	Nov 22, 2023	Graph GenerationRetrieval	CodeCode Available	1
Improved Universal Sentence Embeddings with Prompt-based Contrastive Learning and Energy-based Learning	Mar 14, 2022	AttributeContrastive Learning	CodeCode Available	1
Deep Representational Re-tuning using Contrastive Tension	Jan 1, 2021	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	1
DeepSim: Semantic similarity metrics for learned image registration	Nov 11, 2020	Image RegistrationSemantic Similarity	CodeCode Available	1
DenoSent: A Denoising Objective for Self-Supervised Sentence Representation Learning	Jan 24, 2024	Contrastive LearningDenoising	CodeCode Available	1
Automated radiology report generation using conditioned transformers	Mar 26, 2021	Medical Report GenerationSemantic Similarity	CodeCode Available	1
DiffSim: Taming Diffusion Models for Evaluating Visual Similarity	Dec 19, 2024	Contrastive LearningDenoising	CodeCode Available	1
Debiased Contrastive Learning of Unsupervised Sentence Representations	May 2, 2022	Contrastive LearningSemantic Textual Similarity	CodeCode Available	1
DistilCSE: Effective Knowledge Distillation For Contrastive Sentence Embeddings	Dec 10, 2021	Contrastive LearningKnowledge Distillation	CodeCode Available	1
Discrete Optimization for Unsupervised Sentence Summarization with Word-Level Extraction	May 4, 2020	Language ModelingLanguage Modelling	CodeCode Available	1
DuSSS: Dual Semantic Similarity-Supervised Vision-Language Model for Semi-Supervised Medical Image Segmentation	Dec 17, 2024	Contrastive LearningImage Segmentation	CodeCode Available	1
Distilling Coarse-to-Fine Semantic Matching Knowledge for Weakly Supervised 3D Visual Grounding	Jul 18, 2023	3D visual groundingObject	CodeCode Available	1
Automatic Generation of Topic Labels	May 29, 2020	DescriptiveInformation Retrieval	CodeCode Available	1
Distributional Formal Semantics	Mar 2, 2021	NegationSemantic Similarity	CodeCode Available	1
Improving Language Understanding by Generative Pre-Training	Jun 11, 2018	Cloze TestDocument Classification	CodeCode Available	1
EASE: Entity-Aware Contrastive Learning of Sentence Embedding	May 9, 2022	ClusteringContrastive Learning	CodeCode Available	1
Efficient Mask Correction for Click-Based Interactive Image Segmentation	Jan 1, 2023	Image SegmentationSegmentation	CodeCode Available	1
ELITE: Embedding-Less retrieval with Iterative Text Exploration	May 17, 2025	graph constructionRAG	CodeCode Available	1
An Efficient Self-Supervised Cross-View Training For Sentence Embedding	Nov 6, 2023	Contrastive LearningLanguage Modeling	CodeCode Available	1
Entailment as Few-Shot Learner	Apr 29, 2021	Contrastive LearningData Augmentation	CodeCode Available	1
On the Sentence Embeddings from Pre-trained Language Models	Nov 2, 2020	Language ModelingLanguage Modelling	CodeCode Available	1
Attention Discriminant Sampling for Point Clouds	Jan 1, 2023	object-detectionObject Detection	—Unverified	0
A Multilingual Dataset for Evaluating Parallel Sentence Extraction from Comparable Corpora	May 1, 2018	Machine TranslationSemantic Textual Similarity	—Unverified	0
Attention-based Cross-Layer Domain Alignment for Unsupervised Domain Adaptation	Feb 27, 2022	Domain AdaptationSemantic Similarity	—Unverified	0
Attention-aware semantic relevance predicting Chinese sentence reading	Mar 27, 2024	Semantic SimilaritySemantic Textual Similarity	—Unverified	0
A Multi-level Alignment Training Scheme for Video-and-Language Grounding	Apr 22, 2022	RetrievalSemantic Similarity	—Unverified	0
A Deep Decomposable Model for Disentangling Syntax and Semantics in Sentence Representation	Nov 1, 2021	DisentanglementGenerative Adversarial Network	—Unverified	0
A Thesaurus for Biblical Hebrew	May 1, 2020	Semantic SimilaritySemantic Textual Similarity	—Unverified	0

Show:10 25 50

← PrevPage 6 of 48Next →

All datasets STS Benchmark MTEB MRPC SICK STS13 STS14 STS12 STS15 STS16 MRPC Dev SentEval SICK-R

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	SMARTRoBERTa	Dev Pearson Correlation	92.8	—	Unverified
2	DeBERTa (large)	Accuracy	92.5	—	Unverified
3	SMART-BERT	Dev Pearson Correlation	90	—	Unverified
4	MT-DNN-SMART	Pearson Correlation	0.93	—	Unverified
5	StructBERTRoBERTa ensemble	Pearson Correlation	0.93	—	Unverified
6	Mnet-Sim	Pearson Correlation	0.93	—	Unverified
7	XLNet (single model)	Pearson Correlation	0.93	—	Unverified
8	ALBERT	Pearson Correlation	0.93	—	Unverified
9	T5-11B	Pearson Correlation	0.93	—	Unverified
10	RoBERTa	Pearson Correlation	0.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AnglE-UAE	Spearman Correlation	84.54	—	Unverified
2	ST5-XXL	Spearman Correlation	82.63	—	Unverified
3	ST5-Large	Spearman Correlation	81.83	—	Unverified
4	ST5-XL	Spearman Correlation	81.66	—	Unverified
5	ST5-Base	Spearman Correlation	81.14	—	Unverified
6	MPNet-multilingual	Spearman Correlation	80.73	—	Unverified
7	SGPT-5.8B-nli	Spearman Correlation	80.53	—	Unverified
8	MPNet	Spearman Correlation	80.28	—	Unverified
9	MiniLM-L12	Spearman Correlation	79.8	—	Unverified
10	SimCSE-BERT-sup	Spearman Correlation	79.12	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MT-DNN-SMART	Accuracy	93.7	—	Unverified
2	ALBERT	Accuracy	93.4	—	Unverified
3	RoBERTa (ensemble)	Accuracy	92.3	—	Unverified
4	BigBird	F1	91.5	—	Unverified
5	StructBERTRoBERTa ensemble	Accuracy	91.5	—	Unverified
6	FLOATER-large	Accuracy	91.4	—	Unverified
7	SMART	Accuracy	91.3	—	Unverified
8	RoBERTa-large 355M (MLP quantized vector-wise, fine-tuned)	Accuracy	91	—	Unverified
9	RoBERTa-large 355M + Entailment as Few-shot Learner	F1	91	—	Unverified
10	SpanBERT	Accuracy	90.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromCSE-RoBERTa-large (0.355B)	Spearman Correlation	0.82	—	Unverified
2	PromptEOL+CSE+LLaMA-30B	Spearman Correlation	0.82	—	Unverified
3	PromptEOL+CSE+OPT-13B	Spearman Correlation	0.82	—	Unverified
4	SimCSE-RoBERTalarge	Spearman Correlation	0.82	—	Unverified
5	PromptEOL+CSE+OPT-2.7B	Spearman Correlation	0.81	—	Unverified
6	SentenceBERT	Spearman Correlation	0.75	—	Unverified
7	SRoBERTa-NLI-base	Spearman Correlation	0.74	—	Unverified
8	SRoBERTa-NLI-large	Spearman Correlation	0.74	—	Unverified
9	Dino (STS/̄🦕)	Spearman Correlation	0.74	—	Unverified
10	SBERT-NLI-large	Spearman Correlation	0.74	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AnglE-LLaMA-7B	Spearman Correlation	0.91	—	Unverified
2	AnglE-LLaMA-7B-v2	Spearman Correlation	0.91	—	Unverified
3	PromptEOL+CSE+LLaMA-30B	Spearman Correlation	0.9	—	Unverified
4	PromptEOL+CSE+OPT-13B	Spearman Correlation	0.9	—	Unverified
5	PromptEOL+CSE+OPT-2.7B	Spearman Correlation	0.9	—	Unverified
6	PromCSE-RoBERTa-large (0.355B)	Spearman Correlation	0.89	—	Unverified
7	Trans-Encoder-BERT-large-bi (unsup.)	Spearman Correlation	0.89	—	Unverified
8	Trans-Encoder-BERT-large-cross (unsup.)	Spearman Correlation	0.88	—	Unverified
9	Trans-Encoder-RoBERTa-large-cross (unsup.)	Spearman Correlation	0.88	—	Unverified
10	SimCSE-RoBERTa-large	Spearman Correlation	0.87	—	Unverified