Semantic Textual Similarity

Semantic textual similarity deals with determining how similar two pieces of texts are. This can take the form of assigning a score from 1 to 5. Related tasks are paraphrase or duplicate identification.

Image source: Learning Semantic Textual Similarity from Conversations

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2001–2050 of 2381 papers

Title	Date	Tasks	Status
Modeling Adversarial Attack on Pre-trained Language Models as Sequential Decision Making	May 27, 2023	Adversarial AttackDecision Making	CodeCode Available
Reinforcement Replaces Supervision: Query focused Summarization using Deep Reinforcement Learning	Nov 29, 2023	Deep Reinforcement LearningLong Form Question Answering	CodeCode Available
Towards a Multi-Agent Vision-Language System for Zero-Shot Novel Hazardous Object Detection for Autonomous Driving Safety	Apr 18, 2025	Anomaly DetectionAutonomous Driving	CodeCode Available
Compressing Sentence Representation for Semantic Retrieval via Homomorphic Projective Distillation	Mar 15, 2022	Language ModelingLanguage Modelling	CodeCode Available
Syntactically Robust Training on Partially-Observed Data for Open Information Extraction	Jan 17, 2023	Open Information ExtractionParaphrase Generation	CodeCode Available
Identifying Cognate Sets Across Dictionaries of Related Languages	Sep 1, 2017	Semantic SimilaritySemantic Textual Similarity	CodeCode Available
An Information Minimization Based Contrastive Learning Model for Unsupervised Sentence Embeddings Learning	Sep 22, 2022	Contrastive LearningRepresentation Learning	CodeCode Available
Composition-contrastive Learning for Sentence Embeddings	Jul 14, 2023	Contrastive LearningSemantic Textual Similarity	CodeCode Available
Modelling Sentence Pairs with Tree-structured Attentive Encoder	Oct 10, 2016	Paraphrase IdentificationQuestion Selection	CodeCode Available
Identifying Semantic Divergences in Parallel Text without Annotations	Mar 29, 2018	Machine TranslationSemantic Similarity	CodeCode Available
Anchor-Aware Similarity Cohesion in Target Frames Enables Predicting Temporal Moment Boundaries in 2D	Jan 1, 2025	Moment RetrievalSemantic Similarity	CodeCode Available
Using Sentence Embeddings and Semantic Similarity for Seeking Consensus when Assessing Trustworthy AI	Aug 9, 2022	Semantic SimilaritySemantic Textual Similarity	CodeCode Available
CompiLIG at SemEval-2017 Task 1: Cross-Language Plagiarism Detection Methods for Semantic Textual Similarity	Apr 5, 2017	Semantic SimilaritySemantic Textual Similarity	CodeCode Available
Rematch: Robust and Efficient Matching of Local Knowledge Graphs to Improve Structural and Semantic Similarity	Apr 2, 2024	Abstract Meaning RepresentationFact Checking	CodeCode Available
Mono vs Multilingual Transformer-based Models: a Comparison across Several Language Tasks	Jul 19, 2020	Fake News DetectionLanguage Modeling	CodeCode Available
Representation learning for very short texts using weighted word embedding aggregation	Jul 2, 2016	Event DetectionNews Recommendation	CodeCode Available
MoralStrength: Exploiting a Moral Lexicon and Embedding Similarity for Moral Foundations Prediction	Apr 17, 2019	Decision MakingLEMMA	CodeCode Available
IISCNLP at SemEval-2016 Task 2: Interpretable STS with ILP based Multiple Chunk Aligner	May 4, 2016	Semantic Textual SimilaritySentence	CodeCode Available
Better Summarization Evaluation with Word Embeddings for ROUGE	Aug 25, 2015	Abstractive Text SummarizationSemantic Similarity	CodeCode Available
More Than Meets The Eye: Semi-supervised Learning Under Non-IID Data	Apr 20, 2021	Semantic SimilaritySemantic Textual Similarity	CodeCode Available
BattRAE: Bidimensional Attention-Based Recursive Autoencoders for Learning Bilingual Phrase Embeddings	May 25, 2016	Semantic SimilaritySemantic Textual Similarity	CodeCode Available
Repurposing Language Models into Embedding Models: Finding the Compute-Optimal Recipe	Jun 6, 2024	DecoderRetrieval	CodeCode Available
MSnet: A BERT-based Network for Gendered Pronoun Resolution	Aug 1, 2019	Semantic SimilaritySemantic Textual Similarity	CodeCode Available
Efficient Heuristics Generation for Solving Combinatorial Optimization Problems Using Large Language Models	May 19, 2025	Combinatorial OptimizationSemantic Similarity	CodeCode Available
Image Similarity using An Ensemble of Context-Sensitive Models	Jan 15, 2024	Dimensionality ReductionSemantic Similarity	CodeCode Available
MTFH: A Matrix Tri-Factorization Hashing Framework for Efficient Cross-Modal Retrieval	May 4, 2018	Cross-Modal RetrievalRetrieval	CodeCode Available
ImpliRet: Benchmarking the Implicit Fact Retrieval Challenge	Jun 17, 2025	BenchmarkingRetrieval	CodeCode Available
Improve Chinese Word Embeddings by Exploiting Internal Structure	Jun 1, 2016	Semantic Textual SimilarityText Classification	CodeCode Available
Avoiding Forgetting and Allowing Forward Transfer in Continual Learning via Sparse Networks	Oct 11, 2021	class-incremental learningClass Incremental Learning	CodeCode Available
Improving Adversarial Robustness with Self-Paced Hard-Class Pair Reweighting	Oct 26, 2022	Adversarial RobustnessModel Optimization	CodeCode Available
Sentence Embeddings using Supervised Contrastive Learning	Jun 9, 2021	Contrastive LearningSemantic Textual Similarity	CodeCode Available
WordNet Embeddings	Jul 1, 2018	Representation LearningSemantic Similarity	CodeCode Available
An Assessment of Experimental Protocols for Tracing Changes in Word Semantics Relative to Accuracy and Reliability	Aug 1, 2016	Semantic Textual Similarity	CodeCode Available
SSD: Towards Better Text-Image Consistency Metric in Text-to-Image Generation	Oct 27, 2022	Image GenerationSemantic Similarity	CodeCode Available
MultiHal: Multilingual Dataset for Knowledge-Graph Grounded Evaluation of LLM Hallucinations	May 20, 2025	Fact CheckingHallucination	CodeCode Available
HQA-Attack: Toward High Quality Black-Box Hard-Label Adversarial Attack on Text	Feb 2, 2024	Adversarial AttackHard-label Attack	CodeCode Available
Towards Better Understanding of Contrastive Sentence Representation Learning: A Unified Paradigm for Gradient	Feb 28, 2024	Representation LearningSelf-Supervised Learning	CodeCode Available
A Generalized Method for Automated Multilingual Loanword Detection	Oct 1, 2022	Semantic SimilaritySemantic Textual Similarity	CodeCode Available
Unsupervised Semantic Hashing with Pairwise Reconstruction	Jul 1, 2020	DecoderSemantic Similarity	CodeCode Available
Comparative Evaluation of Label-Agnostic Selection Bias in Multilingual Hate Speech Datasets	Nov 1, 2020	Hate Speech DetectionSelection bias	CodeCode Available
Comment Ranking Diversification in Forum Discussions	Feb 27, 2020	Re-RankingSemantic Similarity	CodeCode Available
Analyzing how BERT performs entity matching	Apr 1, 2022	Entity ResolutionSemantic Similarity	CodeCode Available
Collective Human Opinions in Semantic Textual Similarity	Aug 8, 2023	Semantic Textual SimilaritySentence	CodeCode Available
Multilingual LLMs Inherently Reward In-Language Time-Sensitive Semantic Alignment for Low-Resource Languages	Dec 11, 2024	In-Context LearningSemantic Similarity	CodeCode Available
Hierarchy-based Image Embeddings for Semantic Image Retrieval	Sep 26, 2018	Few-Shot LearningImage Retrieval	CodeCode Available
Sentence Representations via Gaussian Embedding	May 22, 2023	Contrastive LearningNatural Language Inference	CodeCode Available
Improving Lexical Embeddings with Semantic Knowledge	Jun 1, 2014	Language ModellingLearning Word Embeddings	CodeCode Available
Retrofitting Multilingual Sentence Embeddings with Abstract Meaning Representation	Oct 18, 2022	Abstract Meaning RepresentationSemantic Similarity	CodeCode Available
TechNet: Technology Semantic Network Based on Patent Data	Jun 2, 2019	Knowledge GraphsRetrieval	CodeCode Available
Automatic Morpheme Segmentation and Labeling in Universal Dependencies Resources	May 1, 2017	Semantic Textual SimilarityWord Embeddings	CodeCode Available

Show:10 25 50

← PrevPage 41 of 48Next →

All datasets STS Benchmark MTEB MRPC SICK STS13 STS14 STS12 STS15 STS16 MRPC Dev SentEval SICK-R

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	SMARTRoBERTa	Dev Pearson Correlation	92.8	—	Unverified
2	DeBERTa (large)	Accuracy	92.5	—	Unverified
3	SMART-BERT	Dev Pearson Correlation	90	—	Unverified
4	MT-DNN-SMART	Pearson Correlation	0.93	—	Unverified
5	StructBERTRoBERTa ensemble	Pearson Correlation	0.93	—	Unverified
6	Mnet-Sim	Pearson Correlation	0.93	—	Unverified
7	XLNet (single model)	Pearson Correlation	0.93	—	Unverified
8	ALBERT	Pearson Correlation	0.93	—	Unverified
9	T5-11B	Pearson Correlation	0.93	—	Unverified
10	RoBERTa	Pearson Correlation	0.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AnglE-UAE	Spearman Correlation	84.54	—	Unverified
2	ST5-XXL	Spearman Correlation	82.63	—	Unverified
3	ST5-Large	Spearman Correlation	81.83	—	Unverified
4	ST5-XL	Spearman Correlation	81.66	—	Unverified
5	ST5-Base	Spearman Correlation	81.14	—	Unverified
6	MPNet-multilingual	Spearman Correlation	80.73	—	Unverified
7	SGPT-5.8B-nli	Spearman Correlation	80.53	—	Unverified
8	MPNet	Spearman Correlation	80.28	—	Unverified
9	MiniLM-L12	Spearman Correlation	79.8	—	Unverified
10	SimCSE-BERT-sup	Spearman Correlation	79.12	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MT-DNN-SMART	Accuracy	93.7	—	Unverified
2	ALBERT	Accuracy	93.4	—	Unverified
3	RoBERTa (ensemble)	Accuracy	92.3	—	Unverified
4	BigBird	F1	91.5	—	Unverified
5	StructBERTRoBERTa ensemble	Accuracy	91.5	—	Unverified
6	FLOATER-large	Accuracy	91.4	—	Unverified
7	SMART	Accuracy	91.3	—	Unverified
8	RoBERTa-large 355M (MLP quantized vector-wise, fine-tuned)	Accuracy	91	—	Unverified
9	RoBERTa-large 355M + Entailment as Few-shot Learner	F1	91	—	Unverified
10	SpanBERT	Accuracy	90.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromCSE-RoBERTa-large (0.355B)	Spearman Correlation	0.82	—	Unverified
2	PromptEOL+CSE+LLaMA-30B	Spearman Correlation	0.82	—	Unverified
3	PromptEOL+CSE+OPT-13B	Spearman Correlation	0.82	—	Unverified
4	SimCSE-RoBERTalarge	Spearman Correlation	0.82	—	Unverified
5	PromptEOL+CSE+OPT-2.7B	Spearman Correlation	0.81	—	Unverified
6	SentenceBERT	Spearman Correlation	0.75	—	Unverified
7	SRoBERTa-NLI-base	Spearman Correlation	0.74	—	Unverified
8	SRoBERTa-NLI-large	Spearman Correlation	0.74	—	Unverified
9	Dino (STS/̄🦕)	Spearman Correlation	0.74	—	Unverified
10	SBERT-NLI-large	Spearman Correlation	0.74	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AnglE-LLaMA-7B	Spearman Correlation	0.91	—	Unverified
2	AnglE-LLaMA-7B-v2	Spearman Correlation	0.91	—	Unverified
3	PromptEOL+CSE+LLaMA-30B	Spearman Correlation	0.9	—	Unverified
4	PromptEOL+CSE+OPT-13B	Spearman Correlation	0.9	—	Unverified
5	PromptEOL+CSE+OPT-2.7B	Spearman Correlation	0.9	—	Unverified
6	PromCSE-RoBERTa-large (0.355B)	Spearman Correlation	0.89	—	Unverified
7	Trans-Encoder-BERT-large-bi (unsup.)	Spearman Correlation	0.89	—	Unverified
8	Trans-Encoder-BERT-large-cross (unsup.)	Spearman Correlation	0.88	—	Unverified
9	Trans-Encoder-RoBERTa-large-cross (unsup.)	Spearman Correlation	0.88	—	Unverified
10	SimCSE-RoBERTa-large	Spearman Correlation	0.87	—	Unverified