Semantic Textual Similarity

Semantic textual similarity deals with determining how similar two pieces of texts are. This can take the form of assigning a score from 1 to 5. Related tasks are paraphrase or duplicate identification.

Image source: Learning Semantic Textual Similarity from Conversations

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1501–1550 of 2381 papers

Title	Date	Tasks	Status
IRIT: Textual Similarity Combining Conceptual Similarity with an N-Gram Comparison Method	Jul 1, 2012	Semantic Textual Similarity	—Unverified
ISCAS\_NLP at SemEval-2016 Task 1: Sentence Similarity Based on Support Vector Regression using Multiple Features	Jun 1, 2016	Information RetrievalMachine Translation	—Unverified
Is Contrasting All You Need? Contrastive Learning for the Detection and Attribution of AI-generated Text	Jul 12, 2024	AllArticles	—Unverified
Is Cosine-Similarity of Embeddings Really About Similarity?	Mar 8, 2024	Semantic SimilaritySemantic Textual Similarity	—Unverified
Isolating authorship from content with semantic embeddings and contrastive learning	Nov 27, 2024	Contrastive LearningDisentanglement	—Unverified
Is this a Child, a Girl or a Car? Exploring the Contribution of Distributional Similarity to Learning Referential Word Meanings	Apr 1, 2017	Semantic SimilaritySemantic Textual Similarity	—Unverified
Is Twitter A Better Corpus for Measuring Sentiment Similarity?	Oct 1, 2013	Opinion MiningSemantic Textual Similarity	—Unverified
Iterative Relevance Feedback for Answer Passage Retrieval with Passage-level Semantic Match	Dec 20, 2018	Passage RetrievalRetrieval	—Unverified
ITNLP-AiKF at SemEval-2016 Task 3 a quesiton answering system using community QA repository	Jun 1, 2016	Answer SelectionCommunity Question Answering	—Unverified
ITNLP-AiKF at SemEval-2017 Task 1: Rich Features Based SVR for Semantic Textual Similarity Computing	Aug 1, 2017	Feature Engineeringregression	—Unverified
ITNLP-ARC at SemEval-2018 Task 12: Argument Reasoning Comprehension with Attention	Jun 1, 2018	ARCInformation Retrieval	—Unverified
It's About Time: Incorporating Temporality in Retrieval Augmented Language Models	Jan 24, 2024	Few-Shot LearningHallucination	—Unverified
iUBC at SemEval-2016 Task 2: RNNs and LSTMs for interpretable STS	Jun 1, 2016	ChunkingSemantic Textual Similarity	—Unverified
JailbreakHunter: A Visual Analytics Approach for Jailbreak Prompts Discovery from Large-Scale Human-LLM Conversational Datasets	Jul 3, 2024	Adversarial AttackSemantic Similarity	—Unverified
Jailbreaking the Text-to-Video Generative Models	May 10, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified
JAMES: Normalizing Job Titles with Multi-Aspect Graph Embeddings and Reasoning	Feb 22, 2022	Logical ReasoningSemantic Similarity	—Unverified
janardhan: Semantic Textual Similarity using Universal Networking Language graph matching	Jul 1, 2012	Graph MatchingMachine Translation	—Unverified
jina-clip-v2: Multilingual Multimodal Embeddings for Text and Images	Dec 11, 2024	Contrastive LearningCross-Modal Information Retrieval	—Unverified
Jina Embeddings: A Novel Set of High-Performance Sentence Embedding Models	Jul 20, 2023	NegationRetrieval	—Unverified
Joint Learning of Distributed Representations for Images and Texts	Apr 13, 2015	Semantic SimilaritySemantic Textual Similarity	—Unverified
JU\_CSE\_NLP: Multi-grade Classification of Semantic Similarity between Text Pairs	Jul 1, 2012	General ClassificationSemantic Similarity	—Unverified
JU-Evora: A Graph Based Cross-Level Semantic Similarity Analysis using Discourse Information	Aug 1, 2014	Graph MatchingSemantic Similarity	—Unverified
JUNITMZ at SemEval-2016 Task 1: Identifying Semantic Similarity Using Levenshtein Ratio	Jun 1, 2016	Information RetrievalMachine Translation	—Unverified
Just an Update on PMING Distance for Web-based Semantic Similarity in Artificial Intelligence and Data Mining	Jan 9, 2017	Information RetrievalRetrieval	—Unverified
Just Rewrite It Again: A Post-Processing Method for Enhanced Semantic Similarity and Privacy Preservation of Differentially Private Rewritten Text	May 30, 2024	Privacy PreservingSemantic Similarity	—Unverified
KEViN: A Knowledge Enhanced Validity and Novelty Classifier for Arguments	Oct 1, 2022	Semantic SimilaritySemantic Textual Similarity	—Unverified
KGV: Integrating Large Language Models with Knowledge Graphs for Cyber Threat Intelligence Credibility Assessment	Aug 15, 2024	Fact CheckingKnowledge Graphs	—Unverified
KIT-Multi: A Translation-Oriented Multilingual Embedding Corpus	May 1, 2018	Cross-Lingual Document ClassificationDocument Classification	—Unverified
KLUE-CORE: A regression model of semantic textual similarity	Jun 1, 2013	LemmatizationQuestion Answering	—Unverified
KnCe2013-CORE:Semantic Text Similarity by use of Knowledge Bases	Jun 1, 2013	Information RetrievalSemantic Textual Similarity	—Unverified
KNNs of Semantic Encodings for Rating Prediction	Feb 1, 2023	Collaborative FilteringPrediction	—Unverified
Knowing the Author by the Company His Words Keep	May 1, 2018	Semantic Textual SimilarityWord Embeddings	—Unverified
Knowledge-aware Alert Aggregation in Large-scale Cloud Systems: a Hybrid Approach	Mar 11, 2024	CoLALanguage Modelling	—Unverified
Enhancing Unsupervised Sentence Embeddings via Knowledge-Driven Data Augmentation and Gaussian-Decayed Contrastive Learning	Sep 19, 2024	Contrastive LearningData Augmentation	—Unverified
Knowledge Base Unification via Sense Embeddings and Disambiguation	Sep 1, 2015	Open Information ExtractionSemantic Textual Similarity	—Unverified
Knowledge Graph Construction and Its Application in Automatic Radiology Report Generation from Radiologist's Dictation	Jun 13, 2022	graph constructionSemantic Similarity	—Unverified
Knowledge Graph Fusion for Language Model Fine-tuning	Jun 21, 2022	Language ModelingLanguage Modelling	—Unverified
Knowledge Tagging System on Math Questions via LLMs with Flexible Demonstration Retriever	Jun 19, 2024	MathSemantic Similarity	—Unverified
Know When To Stop: A Study of Semantic Drift in Text Generation	Apr 8, 2024	RerankingSemantic Similarity	—Unverified
KVShare: An LLM Service System with Efficient and Effective Multi-Tenant KV Cache Reuse	Mar 17, 2025	DiversityLanguage Modeling	—Unverified
L2F/INESC-ID at SemEval-2017 Tasks 1 and 2: Lexical and semantic features in word and textual similarity	Aug 1, 2017	Abstract Meaning RepresentationSemantic Textual Similarity	—Unverified
Label-anticipated Event Disentanglement for Audio-Visual Video Parsing	Jul 11, 2024	audio-visual event localizationDisentanglement	—Unverified
Language-agnostic, automated assessment of listeners' speech recall using large language models	Mar 2, 2025	Prompt EngineeringSemantic Similarity	—Unverified
Language-Independent Tokenisation Rivals Language-Specific Tokenisation for Word Similarity Prediction	Feb 25, 2020	Semantic SimilaritySemantic Textual Similarity	—Unverified
Language-Informed Transfer Learning for Embodied Household Activities	Jan 12, 2023	Semantic SimilaritySemantic Textual Similarity	—Unverified
Language Models Explain Word Reading Times Better Than Empirical Predictability	Feb 2, 2022	Additive modelsRetrieval	—Unverified
Language Specific Knowledge: Do Models Know Better in X than in English?	May 21, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified
Language Transfer Learning for Supervised Lexical Substitution	Aug 1, 2016	Semantic Textual SimilarityText Simplification	—Unverified
LanguaShrink: Reducing Token Overhead with Psycholinguistics	Sep 1, 2024	ArticlesSemantic Similarity	—Unverified
Large Language Model Augmented Exercise Retrieval for Personalized Language Learning	Feb 8, 2024	Information RetrievalLanguage Modeling	—Unverified

Show:10 25 50

← PrevPage 31 of 48Next →

All datasets STS Benchmark MTEB MRPC SICK STS13 STS14 STS12 STS15 STS16 MRPC Dev SentEval SICK-R

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	SMARTRoBERTa	Dev Pearson Correlation	92.8	—	Unverified
2	DeBERTa (large)	Accuracy	92.5	—	Unverified
3	SMART-BERT	Dev Pearson Correlation	90	—	Unverified
4	MT-DNN-SMART	Pearson Correlation	0.93	—	Unverified
5	StructBERTRoBERTa ensemble	Pearson Correlation	0.93	—	Unverified
6	Mnet-Sim	Pearson Correlation	0.93	—	Unverified
7	XLNet (single model)	Pearson Correlation	0.93	—	Unverified
8	ALBERT	Pearson Correlation	0.93	—	Unverified
9	T5-11B	Pearson Correlation	0.93	—	Unverified
10	RoBERTa	Pearson Correlation	0.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AnglE-UAE	Spearman Correlation	84.54	—	Unverified
2	ST5-XXL	Spearman Correlation	82.63	—	Unverified
3	ST5-Large	Spearman Correlation	81.83	—	Unverified
4	ST5-XL	Spearman Correlation	81.66	—	Unverified
5	ST5-Base	Spearman Correlation	81.14	—	Unverified
6	MPNet-multilingual	Spearman Correlation	80.73	—	Unverified
7	SGPT-5.8B-nli	Spearman Correlation	80.53	—	Unverified
8	MPNet	Spearman Correlation	80.28	—	Unverified
9	MiniLM-L12	Spearman Correlation	79.8	—	Unverified
10	SimCSE-BERT-sup	Spearman Correlation	79.12	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MT-DNN-SMART	Accuracy	93.7	—	Unverified
2	ALBERT	Accuracy	93.4	—	Unverified
3	RoBERTa (ensemble)	Accuracy	92.3	—	Unverified
4	BigBird	F1	91.5	—	Unverified
5	StructBERTRoBERTa ensemble	Accuracy	91.5	—	Unverified
6	FLOATER-large	Accuracy	91.4	—	Unverified
7	SMART	Accuracy	91.3	—	Unverified
8	RoBERTa-large 355M (MLP quantized vector-wise, fine-tuned)	Accuracy	91	—	Unverified
9	RoBERTa-large 355M + Entailment as Few-shot Learner	F1	91	—	Unverified
10	SpanBERT	Accuracy	90.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromCSE-RoBERTa-large (0.355B)	Spearman Correlation	0.82	—	Unverified
2	PromptEOL+CSE+LLaMA-30B	Spearman Correlation	0.82	—	Unverified
3	PromptEOL+CSE+OPT-13B	Spearman Correlation	0.82	—	Unverified
4	SimCSE-RoBERTalarge	Spearman Correlation	0.82	—	Unverified
5	PromptEOL+CSE+OPT-2.7B	Spearman Correlation	0.81	—	Unverified
6	SentenceBERT	Spearman Correlation	0.75	—	Unverified
7	SRoBERTa-NLI-base	Spearman Correlation	0.74	—	Unverified
8	SRoBERTa-NLI-large	Spearman Correlation	0.74	—	Unverified
9	Dino (STS/̄🦕)	Spearman Correlation	0.74	—	Unverified
10	SBERT-NLI-large	Spearman Correlation	0.74	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AnglE-LLaMA-7B	Spearman Correlation	0.91	—	Unverified
2	AnglE-LLaMA-7B-v2	Spearman Correlation	0.91	—	Unverified
3	PromptEOL+CSE+LLaMA-30B	Spearman Correlation	0.9	—	Unverified
4	PromptEOL+CSE+OPT-13B	Spearman Correlation	0.9	—	Unverified
5	PromptEOL+CSE+OPT-2.7B	Spearman Correlation	0.9	—	Unverified
6	PromCSE-RoBERTa-large (0.355B)	Spearman Correlation	0.89	—	Unverified
7	Trans-Encoder-BERT-large-bi (unsup.)	Spearman Correlation	0.89	—	Unverified
8	Trans-Encoder-BERT-large-cross (unsup.)	Spearman Correlation	0.88	—	Unverified
9	Trans-Encoder-RoBERTa-large-cross (unsup.)	Spearman Correlation	0.88	—	Unverified
10	SimCSE-RoBERTa-large	Spearman Correlation	0.87	—	Unverified