Semantic Textual Similarity

Semantic textual similarity deals with determining how similar two pieces of texts are. This can take the form of assigning a score from 1 to 5. Related tasks are paraphrase or duplicate identification.

Image source: Learning Semantic Textual Similarity from Conversations

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–50 of 2381 papers

Title	Date	Tasks	Status	Hype
SemCSE: Semantic Contrastive Sentence Embeddings Using LLM-Generated Summaries For Scientific Abstracts	Jul 17, 2025	Contrastive LearningSemantic Similarity	—Unverified	0
SARA: Selective and Adaptive Retrieval-augmented Generation with Context Compression	Jul 8, 2025	Evidence SelectionRAG	—Unverified	0
FA: Forced Prompt Learning of Vision-Language Models for Out-of-Distribution Detection	Jul 6, 2025	Out-of-Distribution DetectionOut of Distribution (OOD) Detection	CodeCode Available	0
LineRetriever: Planning-Aware Observation Reduction for Web Agents	Jun 30, 2025	RetrievalSemantic Similarity	—Unverified	0
DALR: Dual-level Alignment Learning for Multimodal Sentence Representation Learning	Jun 26, 2025	cross-modal alignmentRepresentation Learning	—Unverified	0
Enhancing Automatic Term Extraction with Large Language Models via Syntactic Retrieval	Jun 26, 2025	Information RetrievalMachine Translation	—Unverified	0
Leveraging Vision-Language Models to Select Trustworthy Super-Resolution Samples Generated by Diffusion Models	Jun 25, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified	0
Intrinsic vs. Extrinsic Evaluation of Czech Sentence Embeddings: Semantic Relevance Doesn't Help with MT Evaluation	Jun 25, 2025	Machine TranslationSemantic Similarity	—Unverified	0
PrivacyXray: Detecting Privacy Breaches in LLMs through Semantic Consistency and Probability Certainty	Jun 24, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified	0
Semantic similarity estimation for domain specific data using BERT and other techniques	Jun 23, 2025	Information RetrievalMachine Translation	—Unverified	0
ImpliRet: Benchmarking the Implicit Fact Retrieval Challenge	Jun 17, 2025	BenchmarkingRetrieval	CodeCode Available	0
Similarity = Value? Consultation Value Assessment and Alignment for Personalized Search	Jun 17, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified	0
InsertRank: LLMs can reason over BM25 scores to Improve Listwise Reranking	Jun 17, 2025	Information RetrievalReranking	—Unverified	0
GrFormer: A Novel Transformer on Grassmann Manifold for Infrared and Visible Image Fusion	Jun 17, 2025	Infrared And Visible Image FusionSemantic Similarity	—Unverified	0
FindMeIfYouCan: Bringing Open Set metrics to near , far and farther Out-of-Distribution Object Detection	Jun 16, 2025	Autonomous Drivingobject-detection	—Unverified	0
Inv-Entropy: A Fully Probabilistic Framework for Uncertainty Quantification in Language Models	Jun 11, 2025	DiversitySemantic Similarity	CodeCode Available	1
Hierarchical Scoring with 3D Gaussian Splatting for Instance Image-Goal Navigation	Jun 9, 2025	3DGSNavigate	—Unverified	0
Trend-Aware Fashion Recommendation with Visual Segmentation and Semantic Similarity	Jun 9, 2025	Semantic SegmentationSemantic Similarity	CodeCode Available	0
Statistical Hypothesis Testing for Auditing Robustness in Language Models	Jun 9, 2025	FairnessLarge Language Model	—Unverified	0
Conservative Bias in Large Language Models: Measuring Relation Predictions	Jun 9, 2025	HallucinationRelation	—Unverified	0
Denoising Programming Knowledge Tracing with a Code Graph-based Tuning Adaptor	Jun 7, 2025	DenoisingKnowledge Tracing	—Unverified	0
KNN-Defense: Defense against 3D Adversarial Point Clouds using Nearest-Neighbor Search	Jun 7, 2025	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	0
Plugging Schema Graph into Multi-Table QA: A Human-Guided Framework for Reducing LLM Reliance	Jun 4, 2025	Question AnsweringSemantic Similarity	—Unverified	0
MCP-Zero: Active Tool Discovery for Autonomous LLM Agents	Jun 1, 2025	RetrievalSemantic Similarity	—Unverified	0
IRT-Router: Effective and Interpretable Multi-LLM Routing via Item Response Theory	Jun 1, 2025	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	1
VUDG: A Dataset for Video Understanding Domain Generalization	May 30, 2025	Domain GeneralizationMultiple-choice	—Unverified	0
GATE: General Arabic Text Embedding for Enhanced Semantic Textual Similarity with Matryoshka Representation Learning and Hybrid Loss Training	May 30, 2025	MTEB BenchmarkNatural Language Inference	—Unverified	0
Category-aware EEG image generation based on wavelet transform and contrast semantic loss	May 30, 2025	EEGImage Generation	CodeCode Available	0
PRISM: A Framework for Producing Interpretable Political Bias Embeddings with Political-Aware Cross-Encoder	May 30, 2025	ArticlesSemantic Similarity	CodeCode Available	0
Label-Guided In-Context Learning for Named Entity Recognition	May 29, 2025	In-Context Learningnamed-entity-recognition	CodeCode Available	1
Document Valuation in LLM Summaries: A Cluster Shapley Approach	May 28, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified	0
Improving Brain-to-Image Reconstruction via Fine-Grained Text Bridging	May 28, 2025	Image ReconstructionLanguage Modeling	—Unverified	0
LLMs as Better Recommenders with Natural Language Collaborative Signals: A Self-Assessing Retrieval Approach	May 26, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified	0
Position: Mechanistic Interpretability Should Prioritize Feature Consistency in SAEs	May 26, 2025	PositionSemantic Similarity	CodeCode Available	0
The Avengers: A Simple Recipe for Uniting Smaller Language Models to Challenge Proprietary Giants	May 26, 2025	ClusteringOut-of-Distribution Generalization	CodeCode Available	1
Hypercube-RAG: Hypercube-Based Retrieval-Augmented Generation for In-domain Scientific Question-Answering	May 25, 2025	Question AnsweringRAG	CodeCode Available	0
CrosGrpsABS: Cross-Attention over Syntactic and Semantic Graphs for Aspect-Based Sentiment Analysis in a Low-Resource Language	May 25, 2025	Aspect-Based Sentiment AnalysisAspect-Based Sentiment Analysis (ABSA)	—Unverified	0
Sparse VideoGen2: Accelerate Video Generation with Sparse Attention via Semantic-Aware Permutation	May 24, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified	0
Smoothie: Smoothing Diffusion on Token Embeddings for Text Generation	May 24, 2025	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	1
Accidental Misalignment: Fine-Tuning Language Models Induces Unexpected Vulnerability	May 22, 2025	Adversarial DefenseSemantic Similarity	CodeCode Available	0
Omni TM-AE: A Scalable and Interpretable Embedding Model Using the Full Tsetlin Machine State Space	May 22, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified	0
Automated Feedback Loops to Protect Text Simplification with Generative AI from Information Loss	May 22, 2025	Missing ElementsSemantic Similarity	—Unverified	0
LLMs Are Not Scorers: Rethinking MT Evaluation with Generation-Based Methods	May 22, 2025	DecoderMachine Translation	CodeCode Available	0
EquivPruner: Boosting Efficiency and Quality in LLM-Based Search via Action Pruning	May 22, 2025	GSM8KMath	CodeCode Available	0
EcomScriptBench: A Multi-task Benchmark for E-commerce Script Planning via Step-wise Intention-Driven Product Association	May 21, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified	0
Language Specific Knowledge: Do Models Know Better in X than in English?	May 21, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified	0
Leveraging the Powerful Attention of a Pre-trained Diffusion Model for Exemplar-based Image Colorization	May 21, 2025	ColorizationImage Colorization	CodeCode Available	0
InstructSAM: A Training-Free Framework for Instruction-Oriented Remote Sensing Object Recognition	May 21, 2025	Earth ObservationObject	CodeCode Available	2
MultiHal: Multilingual Dataset for Knowledge-Graph Grounded Evaluation of LLM Hallucinations	May 20, 2025	Fact CheckingHallucination	CodeCode Available	0
R2MED: A Benchmark for Reasoning-Driven Medical Retrieval	May 20, 2025	DiagnosticRe-Ranking	CodeCode Available	1

Show:10 25 50

← PrevPage 1 of 48Next →

All datasets STS Benchmark MTEB MRPC SICK STS13 STS14 STS12 STS15 STS16 MRPC Dev SentEval SICK-R

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	SMARTRoBERTa	Dev Pearson Correlation	92.8	—	Unverified
2	DeBERTa (large)	Accuracy	92.5	—	Unverified
3	SMART-BERT	Dev Pearson Correlation	90	—	Unverified
4	MT-DNN-SMART	Pearson Correlation	0.93	—	Unverified
5	StructBERTRoBERTa ensemble	Pearson Correlation	0.93	—	Unverified
6	Mnet-Sim	Pearson Correlation	0.93	—	Unverified
7	XLNet (single model)	Pearson Correlation	0.93	—	Unverified
8	ALBERT	Pearson Correlation	0.93	—	Unverified
9	T5-11B	Pearson Correlation	0.93	—	Unverified
10	RoBERTa	Pearson Correlation	0.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AnglE-UAE	Spearman Correlation	84.54	—	Unverified
2	ST5-XXL	Spearman Correlation	82.63	—	Unverified
3	ST5-Large	Spearman Correlation	81.83	—	Unverified
4	ST5-XL	Spearman Correlation	81.66	—	Unverified
5	ST5-Base	Spearman Correlation	81.14	—	Unverified
6	MPNet-multilingual	Spearman Correlation	80.73	—	Unverified
7	SGPT-5.8B-nli	Spearman Correlation	80.53	—	Unverified
8	MPNet	Spearman Correlation	80.28	—	Unverified
9	MiniLM-L12	Spearman Correlation	79.8	—	Unverified
10	SimCSE-BERT-sup	Spearman Correlation	79.12	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MT-DNN-SMART	Accuracy	93.7	—	Unverified
2	ALBERT	Accuracy	93.4	—	Unverified
3	RoBERTa (ensemble)	Accuracy	92.3	—	Unverified
4	BigBird	F1	91.5	—	Unverified
5	StructBERTRoBERTa ensemble	Accuracy	91.5	—	Unverified
6	FLOATER-large	Accuracy	91.4	—	Unverified
7	SMART	Accuracy	91.3	—	Unverified
8	RoBERTa-large 355M (MLP quantized vector-wise, fine-tuned)	Accuracy	91	—	Unverified
9	RoBERTa-large 355M + Entailment as Few-shot Learner	F1	91	—	Unverified
10	SpanBERT	Accuracy	90.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromCSE-RoBERTa-large (0.355B)	Spearman Correlation	0.82	—	Unverified
2	PromptEOL+CSE+LLaMA-30B	Spearman Correlation	0.82	—	Unverified
3	PromptEOL+CSE+OPT-13B	Spearman Correlation	0.82	—	Unverified
4	SimCSE-RoBERTalarge	Spearman Correlation	0.82	—	Unverified
5	PromptEOL+CSE+OPT-2.7B	Spearman Correlation	0.81	—	Unverified
6	SentenceBERT	Spearman Correlation	0.75	—	Unverified
7	SRoBERTa-NLI-base	Spearman Correlation	0.74	—	Unverified
8	SRoBERTa-NLI-large	Spearman Correlation	0.74	—	Unverified
9	Dino (STS/̄🦕)	Spearman Correlation	0.74	—	Unverified
10	SBERT-NLI-large	Spearman Correlation	0.74	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AnglE-LLaMA-7B	Spearman Correlation	0.91	—	Unverified
2	AnglE-LLaMA-7B-v2	Spearman Correlation	0.91	—	Unverified
3	PromptEOL+CSE+LLaMA-30B	Spearman Correlation	0.9	—	Unverified
4	PromptEOL+CSE+OPT-13B	Spearman Correlation	0.9	—	Unverified
5	PromptEOL+CSE+OPT-2.7B	Spearman Correlation	0.9	—	Unverified
6	PromCSE-RoBERTa-large (0.355B)	Spearman Correlation	0.89	—	Unverified
7	Trans-Encoder-BERT-large-bi (unsup.)	Spearman Correlation	0.89	—	Unverified
8	Trans-Encoder-BERT-large-cross (unsup.)	Spearman Correlation	0.88	—	Unverified
9	Trans-Encoder-RoBERTa-large-cross (unsup.)	Spearman Correlation	0.88	—	Unverified
10	SimCSE-RoBERTa-large	Spearman Correlation	0.87	—	Unverified