Semantic Textual Similarity

Semantic textual similarity deals with determining how similar two pieces of texts are. This can take the form of assigning a score from 1 to 5. Related tasks are paraphrase or duplicate identification.

Image source: Learning Semantic Textual Similarity from Conversations

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 126–150 of 2381 papers

Title	Date	Tasks	Status	Hype
How Vital is the Jurisprudential Relevance: Law Article Intervened Legal Case Retrieval and Matching	Feb 25, 2025	Multi-Task LearningRetrieval	—Unverified	0
CLIMB-3D: Continual Learning for Imbalanced 3D Instance Segmentation	Feb 24, 2025	3D Instance SegmentationContinual Learning	CodeCode Available	0
ATEB: Evaluating and Improving Advanced NLP Tasks for Text Embedding Models	Feb 24, 2025	Information RetrievalInstruction Following	—Unverified	0
Uncertainty Quantification of Large Language Models through Multi-Dimensional Responses	Feb 24, 2025	Decision MakingSemantic Similarity	—Unverified	0
Constructing a Norm for Children's Scientific Drawing: Distribution Features Based on Semantic Similarity of Large Language Models	Feb 21, 2025	Large Language ModelSemantic Similarity	—Unverified	0
Evolutionary Algorithms Approach For Search Based On Semantic Document Similarity	Feb 20, 2025	Cloud ComputingDistributed Computing	—Unverified	0
A Meta-Evaluation of Style and Attribute Transfer Metrics	Feb 20, 2025	AttributeSemantic Similarity	—Unverified	0
DeepRTL: Bridging Verilog Understanding and Generation with a Unified Representation Model	Feb 20, 2025	Code GenerationSemantic Similarity	—Unverified	0
Exploring RWKV for Sentence Embeddings: Layer-wise Analysis and Baseline Comparison for Semantic Similarity	Feb 20, 2025	GPULanguage Modeling	CodeCode Available	0
Event Segmentation Applications in Large Language Model Enabled Automated Recall Assessments	Feb 19, 2025	Event SegmentationLanguage Modeling	—Unverified	0
Breaking the Clusters: Uniformity-Optimization for Text-Based Sequential Recommendation	Feb 19, 2025	Recommendation SystemsSemantic Similarity	CodeCode Available	0
HopRAG: Multi-Hop Reasoning for Logic-Aware Retrieval-Augmented Generation	Feb 18, 2025	Logical ReasoningRAG	—Unverified	0
Balanced Multi-Factor In-Context Learning for Multilingual Large Language Models	Feb 17, 2025	In-Context LearningSemantic Similarity	—Unverified	0
FaMTEB: Massive Text Embedding Benchmark in Persian Language	Feb 17, 2025	ChatbotMTEB Benchmark	—Unverified	0
FinMTEB: Finance Massive Text Embedding Benchmark	Feb 16, 2025	ArticlesSemantic Textual Similarity	CodeCode Available	2
PropNet: a White-Box and Human-Like Network for Sentence Representation	Feb 15, 2025	Semantic Textual SimilaritySentence	—Unverified	0
Examining Multilingual Embedding Models Cross-Lingually Through LLM-Generated Adversarial Examples	Feb 12, 2025	Distractor GenerationInformation Retrieval	—Unverified	0
Elevating Legal LLM Responses: Harnessing Trainable Logical Structures and Semantic Knowledge with Legal Reasoning	Feb 11, 2025	HallucinationIn-Context Learning	CodeCode Available	0
Bridging LLM-Generated Code and Requirements: Reverse Generation technique and SBC Metric for Developer Insights	Feb 11, 2025	Code GenerationSemantic Similarity	CodeCode Available	0
PDV: Prompt Directional Vectors for Zero-shot Composed Image Retrieval	Feb 11, 2025	Image RetrievalRetrieval	—Unverified	0
Can LLMs Replace Human Evaluators? An Empirical Study of LLM-as-a-Judge in Software Engineering	Feb 10, 2025	Code GenerationCode Summarization	—Unverified	0
Enhancing Health Information Retrieval with RAG by Prioritizing Topical Relevance and Factual Accuracy	Feb 7, 2025	Information RetrievalMisinformation	—Unverified	0
How does a Multilingual LM Handle Multiple Languages?	Feb 6, 2025	Multilingual NLPMultilingual Word Embeddings	—Unverified	0
Detecting Backdoor Attacks via Similarity in Semantic Communication Systems	Feb 6, 2025	Semantic CommunicationSemantic Similarity	—Unverified	0
How do Humans and Language Models Reason About Creativity? A Comparative Analysis	Feb 5, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified	0

Show:10 25 50

← PrevPage 6 of 96Next →

All datasets STS Benchmark MTEB MRPC SICK STS13 STS14 STS12 STS15 STS16 MRPC Dev SentEval SICK-R

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	SMARTRoBERTa	Dev Pearson Correlation	92.8	—	Unverified
2	DeBERTa (large)	Accuracy	92.5	—	Unverified
3	SMART-BERT	Dev Pearson Correlation	90	—	Unverified
4	MT-DNN-SMART	Pearson Correlation	0.93	—	Unverified
5	StructBERTRoBERTa ensemble	Pearson Correlation	0.93	—	Unverified
6	Mnet-Sim	Pearson Correlation	0.93	—	Unverified
7	XLNet (single model)	Pearson Correlation	0.93	—	Unverified
8	ALBERT	Pearson Correlation	0.93	—	Unverified
9	T5-11B	Pearson Correlation	0.93	—	Unverified
10	RoBERTa	Pearson Correlation	0.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AnglE-UAE	Spearman Correlation	84.54	—	Unverified
2	ST5-XXL	Spearman Correlation	82.63	—	Unverified
3	ST5-Large	Spearman Correlation	81.83	—	Unverified
4	ST5-XL	Spearman Correlation	81.66	—	Unverified
5	ST5-Base	Spearman Correlation	81.14	—	Unverified
6	MPNet-multilingual	Spearman Correlation	80.73	—	Unverified
7	SGPT-5.8B-nli	Spearman Correlation	80.53	—	Unverified
8	MPNet	Spearman Correlation	80.28	—	Unverified
9	MiniLM-L12	Spearman Correlation	79.8	—	Unverified
10	SimCSE-BERT-sup	Spearman Correlation	79.12	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MT-DNN-SMART	Accuracy	93.7	—	Unverified
2	ALBERT	Accuracy	93.4	—	Unverified
3	RoBERTa (ensemble)	Accuracy	92.3	—	Unverified
4	BigBird	F1	91.5	—	Unverified
5	StructBERTRoBERTa ensemble	Accuracy	91.5	—	Unverified
6	FLOATER-large	Accuracy	91.4	—	Unverified
7	SMART	Accuracy	91.3	—	Unverified
8	RoBERTa-large 355M (MLP quantized vector-wise, fine-tuned)	Accuracy	91	—	Unverified
9	RoBERTa-large 355M + Entailment as Few-shot Learner	F1	91	—	Unverified
10	SpanBERT	Accuracy	90.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromCSE-RoBERTa-large (0.355B)	Spearman Correlation	0.82	—	Unverified
2	PromptEOL+CSE+LLaMA-30B	Spearman Correlation	0.82	—	Unverified
3	PromptEOL+CSE+OPT-13B	Spearman Correlation	0.82	—	Unverified
4	SimCSE-RoBERTalarge	Spearman Correlation	0.82	—	Unverified
5	PromptEOL+CSE+OPT-2.7B	Spearman Correlation	0.81	—	Unverified
6	SentenceBERT	Spearman Correlation	0.75	—	Unverified
7	SRoBERTa-NLI-base	Spearman Correlation	0.74	—	Unverified
8	SRoBERTa-NLI-large	Spearman Correlation	0.74	—	Unverified
9	Dino (STS/̄🦕)	Spearman Correlation	0.74	—	Unverified
10	SBERT-NLI-large	Spearman Correlation	0.74	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AnglE-LLaMA-7B	Spearman Correlation	0.91	—	Unverified
2	AnglE-LLaMA-7B-v2	Spearman Correlation	0.91	—	Unverified
3	PromptEOL+CSE+LLaMA-30B	Spearman Correlation	0.9	—	Unverified
4	PromptEOL+CSE+OPT-13B	Spearman Correlation	0.9	—	Unverified
5	PromptEOL+CSE+OPT-2.7B	Spearman Correlation	0.9	—	Unverified
6	PromCSE-RoBERTa-large (0.355B)	Spearman Correlation	0.89	—	Unverified
7	Trans-Encoder-BERT-large-bi (unsup.)	Spearman Correlation	0.89	—	Unverified
8	Trans-Encoder-BERT-large-cross (unsup.)	Spearman Correlation	0.88	—	Unverified
9	Trans-Encoder-RoBERTa-large-cross (unsup.)	Spearman Correlation	0.88	—	Unverified
10	SimCSE-RoBERTa-large	Spearman Correlation	0.87	—	Unverified