Semantic Textual Similarity

Semantic textual similarity deals with determining how similar two pieces of texts are. This can take the form of assigning a score from 1 to 5. Related tasks are paraphrase or duplicate identification.

Image source: Learning Semantic Textual Similarity from Conversations

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1001–1050 of 2381 papers

Title	Date	Tasks	Status
Homa at SemEval-2025 Task 5: Aligning Librarian Records with OntoAligner for Subject Tagging	Apr 30, 2025	RAGRetrieval	—Unverified
Homograph Disambiguation Through Selective Diacritic Restoration	Dec 10, 2019	Machine TranslationPart-Of-Speech Tagging	—Unverified
A web-based tool to Analyze Semantic Similarity Networks	Dec 21, 2014	Community DetectionSemantic Similarity	—Unverified
Horizon Scans can be accelerated using novel information retrieval and artificial intelligence tools	Apr 2, 2025	Active LearningArticles	—Unverified
How does a Multilingual LM Handle Multiple Languages?	Feb 6, 2025	Multilingual NLPMultilingual Word Embeddings	—Unverified
How do Humans and Language Models Reason About Creativity? A Comparative Analysis	Feb 5, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified
How to choose "Good" Samples for Text Data Augmentation	Feb 2, 2023	Data AugmentationSemantic Similarity	—Unverified
How to Evaluate Semantic Communications for Images with ViTScore Metric?	Sep 9, 2023	MS-SSIMSemantic Communication	—Unverified
How to Learn in a Noisy World? Self-Correcting the Real-World Data Noise on Machine Translation	Jul 2, 2024	Machine TranslationSemantic Similarity	—Unverified
A Neurosymbolic Framework for Bias Correction in Convolutional Neural Networks	May 24, 2024	Decision Makingimage-classification	—Unverified
How Vital is the Jurisprudential Relevance: Law Article Intervened Legal Case Retrieval and Matching	Feb 25, 2025	Multi-Task LearningRetrieval	—Unverified
Contrastive Word Embedding Learning for Neural Machine Translation	Sep 17, 2021	Machine TranslationNMT	—Unverified
HsH: Estimating Semantic Similarity of Words and Short Phrases with Frequency Normalized Distance Measures	Jun 1, 2013	Semantic SimilaritySemantic Textual Similarity	—Unverified
HSI: A Holistic Style Injector for Arbitrary Style Transfer	Feb 5, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified
A Dynamic, Interpreted CheckList for Meaning-oriented NLG Metric Evaluation – through the Lens of Semantic Similarity Rating	Jul 1, 2022	nlg evaluationSemantic Similarity	—Unverified
HulTech: A General Purpose System for Cross-Level Semantic Similarity based on Anchor Web Counts	Aug 1, 2014	Semantic SimilaritySemantic Textual Similarity	—Unverified
Human Variability vs. Machine Consistency: A Linguistic Analysis of Texts Generated by Humans and Large Language Models	Dec 4, 2024	Semantic SimilaritySemantic Textual Similarity	—Unverified
ConvFiT: Conversational Fine-Tuning of Pretrained Language Models	Sep 21, 2021	Intent DetectionRetrieval	—Unverified
DEMO: A Statistical Perspective for Efficient Image-Text Matching	May 19, 2024	Image-text matchingModel Optimization	—Unverified
A weakly supervised adaptive triplet loss for deep metric learning	Sep 27, 2019	Metric LearningRetrieval	—Unverified
Convolutional neural networks for structured omics: OmicsCNN and the OmicsConv layer	Oct 16, 2017	Deep LearningSemantic Similarity	—Unverified
HyCIR: Boosting Zero-Shot Composed Image Retrieval with Synthetic Labels	Jul 8, 2024	Contrastive LearningImage Retrieval	—Unverified
DELTA: Pre-train a Discriminative Encoder for Legal Case Retrieval via Structural Word Alignment	Mar 27, 2024	RetrievalSemantic Similarity	—Unverified
A Walk-Based Semantically Enriched Tree Kernel Over Distributed Word Representations	Oct 1, 2013	Semantic Textual Similarity	—Unverified
A Neural Network Approach to Selectional Preference Acquisition	Oct 1, 2014	Semantic Role LabelingSemantic Textual Similarity	—Unverified
A Dynamic, Interpreted CheckList for Meaning-oriented NLG Metric Evaluation -- through the Lens of Semantic Similarity Rating	May 24, 2022	nlg evaluationSemantic Similarity	—Unverified
DeepTrax: Embedding Graphs of Financial Transactions	Jul 16, 2019	BIG-bench Machine LearningFraud Detection	—Unverified
A Vector Space for Distributional Semantics for Entailment	Jul 13, 2016	Lexical EntailmentSemantic Similarity	—Unverified
Deep Semantic Ranking Based Hashing for Multi-Label Image Retrieval	Jan 26, 2015	Image RetrievalMulti-Label Image Retrieval	—Unverified
DeepRTL: Bridging Verilog Understanding and Generation with a Unified Representation Model	Feb 20, 2025	Code GenerationSemantic Similarity	—Unverified
Avaliando a similaridade sem\^antica entre frases curtas atrav\'es de uma abordagem h\' (A hybrid approach to measure Semantic Textual Similarity between short sentences in Brazilian Portuguese)[In Portuguese]	Oct 1, 2017	Semantic Textual Similarity	—Unverified
An enhanced method to compute the similarity between concepts of ontology	Sep 26, 2017	Information RetrievalRetrieval	—Unverified
Improving Trace Link Recommendation by Using Non-Isotropic Distances and Combinations	Jul 15, 2023	Information RetrievalRetrieval	—Unverified
Improving Verb Metaphor Detection by Propagating Abstractness to Words, Phrases and Individual Senses	Apr 1, 2017	Semantic Textual SimilarityTopic Models	—Unverified
DeepPurple: Lexical, String and Affective Feature Fusion for Sentence-Level Semantic Similarity Estimation	Jun 1, 2013	Domain AdaptationMachine Translation	—Unverified
DeepPurple: Estimating Sentence Semantic Similarity using N-gram Regression Models and Web Snippets	Jul 1, 2012	Machine TranslationNatural Language Inference	—Unverified
AutoTestForge: A Multidimensional Automated Testing Framework for Natural Language Processing Models	Mar 7, 2025	FairnessSemantic Textual Similarity	—Unverified
An Empirical study of Unsupervised Neural Machine Translation: analyzing NMT output, model's behavior and sentences' contribution	Dec 19, 2023	Low Resource Neural Machine TranslationLow-Resource Neural Machine Translation	—Unverified
Automating Transfer Credit Assessment in Student Mobility -- A Natural Language Processing-based Approach	Apr 5, 2021	Decision MakingSemantic Similarity	—Unverified
Deep Lifelong Cross-modal Hashing	Apr 26, 2023	Cross-Modal RetrievalLifelong learning	—Unverified
Automating the Compilation of Potential Core-Outcomes for Clinical Trials	Jan 11, 2021	Semantic SimilaritySemantic Textual Similarity	—Unverified
Deep learning with sentence embeddings pre-trained on biomedical corpora improves the performance of finding similar sentences in electronic medical records	Sep 6, 2019	Semantic Textual SimilaritySentence	—Unverified
Deep Learning of Binary and Gradient Judgements for Semantic Paraphrase	Jan 1, 2017	Deep LearningParaphrase Identification	—Unverified
Adversarial Training with Contrastive Learning in NLP	Sep 19, 2021	Contrastive LearningLanguage Modeling	—Unverified
Improving Text Normalization via Unsupervised Model and Discriminative Reranking	Jun 1, 2014	Machine TranslationReranking	—Unverified
Automatic Visual Theme Discovery from Joint Image and Text Corpora	Sep 7, 2016	ClusteringDescriptive	—Unverified
An Efficient Approach to Learning Chinese Judgment Document Similarity Based on Knowledge Summarization	Aug 6, 2018	Semantic SimilaritySemantic Textual Similarity	—Unverified
Deep Contrastive Multi-view Clustering under Semantic Feature Guidance	Mar 9, 2024	ClusteringContrastive Learning	—Unverified
Automatic Thesaurus Construction for Modern Hebrew	May 1, 2018	Machine TranslationQuestion Answering	—Unverified
Improving Semantic Similarity Measure Within a Recommender System Based-on RDF Graphs	Jul 20, 2023	Recommendation SystemsSemantic Similarity	—Unverified

Show:10 25 50

← PrevPage 21 of 48Next →

All datasets STS Benchmark MTEB MRPC SICK STS13 STS14 STS12 STS15 STS16 MRPC Dev SentEval SICK-R

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	SMARTRoBERTa	Dev Pearson Correlation	92.8	—	Unverified
2	DeBERTa (large)	Accuracy	92.5	—	Unverified
3	SMART-BERT	Dev Pearson Correlation	90	—	Unverified
4	MT-DNN-SMART	Pearson Correlation	0.93	—	Unverified
5	StructBERTRoBERTa ensemble	Pearson Correlation	0.93	—	Unverified
6	Mnet-Sim	Pearson Correlation	0.93	—	Unverified
7	XLNet (single model)	Pearson Correlation	0.93	—	Unverified
8	ALBERT	Pearson Correlation	0.93	—	Unverified
9	T5-11B	Pearson Correlation	0.93	—	Unverified
10	RoBERTa	Pearson Correlation	0.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AnglE-UAE	Spearman Correlation	84.54	—	Unverified
2	ST5-XXL	Spearman Correlation	82.63	—	Unverified
3	ST5-Large	Spearman Correlation	81.83	—	Unverified
4	ST5-XL	Spearman Correlation	81.66	—	Unverified
5	ST5-Base	Spearman Correlation	81.14	—	Unverified
6	MPNet-multilingual	Spearman Correlation	80.73	—	Unverified
7	SGPT-5.8B-nli	Spearman Correlation	80.53	—	Unverified
8	MPNet	Spearman Correlation	80.28	—	Unverified
9	MiniLM-L12	Spearman Correlation	79.8	—	Unverified
10	SimCSE-BERT-sup	Spearman Correlation	79.12	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MT-DNN-SMART	Accuracy	93.7	—	Unverified
2	ALBERT	Accuracy	93.4	—	Unverified
3	RoBERTa (ensemble)	Accuracy	92.3	—	Unverified
4	BigBird	F1	91.5	—	Unverified
5	StructBERTRoBERTa ensemble	Accuracy	91.5	—	Unverified
6	FLOATER-large	Accuracy	91.4	—	Unverified
7	SMART	Accuracy	91.3	—	Unverified
8	RoBERTa-large 355M (MLP quantized vector-wise, fine-tuned)	Accuracy	91	—	Unverified
9	RoBERTa-large 355M + Entailment as Few-shot Learner	F1	91	—	Unverified
10	SpanBERT	Accuracy	90.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromCSE-RoBERTa-large (0.355B)	Spearman Correlation	0.82	—	Unverified
2	PromptEOL+CSE+LLaMA-30B	Spearman Correlation	0.82	—	Unverified
3	PromptEOL+CSE+OPT-13B	Spearman Correlation	0.82	—	Unverified
4	SimCSE-RoBERTalarge	Spearman Correlation	0.82	—	Unverified
5	PromptEOL+CSE+OPT-2.7B	Spearman Correlation	0.81	—	Unverified
6	SentenceBERT	Spearman Correlation	0.75	—	Unverified
7	SRoBERTa-NLI-base	Spearman Correlation	0.74	—	Unverified
8	SRoBERTa-NLI-large	Spearman Correlation	0.74	—	Unverified
9	Dino (STS/̄🦕)	Spearman Correlation	0.74	—	Unverified
10	SBERT-NLI-large	Spearman Correlation	0.74	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AnglE-LLaMA-7B	Spearman Correlation	0.91	—	Unverified
2	AnglE-LLaMA-7B-v2	Spearman Correlation	0.91	—	Unverified
3	PromptEOL+CSE+LLaMA-30B	Spearman Correlation	0.9	—	Unverified
4	PromptEOL+CSE+OPT-13B	Spearman Correlation	0.9	—	Unverified
5	PromptEOL+CSE+OPT-2.7B	Spearman Correlation	0.9	—	Unverified
6	PromCSE-RoBERTa-large (0.355B)	Spearman Correlation	0.89	—	Unverified
7	Trans-Encoder-BERT-large-bi (unsup.)	Spearman Correlation	0.89	—	Unverified
8	Trans-Encoder-BERT-large-cross (unsup.)	Spearman Correlation	0.88	—	Unverified
9	Trans-Encoder-RoBERTa-large-cross (unsup.)	Spearman Correlation	0.88	—	Unverified
10	SimCSE-RoBERTa-large	Spearman Correlation	0.87	—	Unverified