Semantic Textual Similarity

Semantic textual similarity deals with determining how similar two pieces of texts are. This can take the form of assigning a score from 1 to 5. Related tasks are paraphrase or duplicate identification.

Image source: Learning Semantic Textual Similarity from Conversations

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 301–350 of 2381 papers

Title	Date	Tasks	Status
Leveraging Vision-Language Models to Select Trustworthy Super-Resolution Samples Generated by Diffusion Models	Jun 25, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified
PrivacyXray: Detecting Privacy Breaches in LLMs through Semantic Consistency and Probability Certainty	Jun 24, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified
Semantic similarity estimation for domain specific data using BERT and other techniques	Jun 23, 2025	Information RetrievalMachine Translation	—Unverified
GrFormer: A Novel Transformer on Grassmann Manifold for Infrared and Visible Image Fusion	Jun 17, 2025	Infrared And Visible Image FusionSemantic Similarity	—Unverified
ImpliRet: Benchmarking the Implicit Fact Retrieval Challenge	Jun 17, 2025	BenchmarkingRetrieval	CodeCode Available
InsertRank: LLMs can reason over BM25 scores to Improve Listwise Reranking	Jun 17, 2025	Information RetrievalReranking	—Unverified
Similarity = Value? Consultation Value Assessment and Alignment for Personalized Search	Jun 17, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified
FindMeIfYouCan: Bringing Open Set metrics to near , far and farther Out-of-Distribution Object Detection	Jun 16, 2025	Autonomous Drivingobject-detection	—Unverified
Hierarchical Scoring with 3D Gaussian Splatting for Instance Image-Goal Navigation	Jun 9, 2025	3DGSNavigate	—Unverified
Conservative Bias in Large Language Models: Measuring Relation Predictions	Jun 9, 2025	HallucinationRelation	—Unverified
Statistical Hypothesis Testing for Auditing Robustness in Language Models	Jun 9, 2025	FairnessLarge Language Model	—Unverified
Trend-Aware Fashion Recommendation with Visual Segmentation and Semantic Similarity	Jun 9, 2025	Semantic SegmentationSemantic Similarity	CodeCode Available
Denoising Programming Knowledge Tracing with a Code Graph-based Tuning Adaptor	Jun 7, 2025	DenoisingKnowledge Tracing	—Unverified
KNN-Defense: Defense against 3D Adversarial Point Clouds using Nearest-Neighbor Search	Jun 7, 2025	Semantic SimilaritySemantic Textual Similarity	CodeCode Available
Plugging Schema Graph into Multi-Table QA: A Human-Guided Framework for Reducing LLM Reliance	Jun 4, 2025	Question AnsweringSemantic Similarity	—Unverified
MCP-Zero: Active Tool Discovery for Autonomous LLM Agents	Jun 1, 2025	RetrievalSemantic Similarity	—Unverified
PRISM: A Framework for Producing Interpretable Political Bias Embeddings with Political-Aware Cross-Encoder	May 30, 2025	ArticlesSemantic Similarity	CodeCode Available
Category-aware EEG image generation based on wavelet transform and contrast semantic loss	May 30, 2025	EEGImage Generation	CodeCode Available
VUDG: A Dataset for Video Understanding Domain Generalization	May 30, 2025	Domain GeneralizationMultiple-choice	—Unverified
GATE: General Arabic Text Embedding for Enhanced Semantic Textual Similarity with Matryoshka Representation Learning and Hybrid Loss Training	May 30, 2025	MTEB BenchmarkNatural Language Inference	—Unverified
Improving Brain-to-Image Reconstruction via Fine-Grained Text Bridging	May 28, 2025	Image ReconstructionLanguage Modeling	—Unverified
Document Valuation in LLM Summaries: A Cluster Shapley Approach	May 28, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified
LLMs as Better Recommenders with Natural Language Collaborative Signals: A Self-Assessing Retrieval Approach	May 26, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified
Position: Mechanistic Interpretability Should Prioritize Feature Consistency in SAEs	May 26, 2025	PositionSemantic Similarity	CodeCode Available
Hypercube-RAG: Hypercube-Based Retrieval-Augmented Generation for In-domain Scientific Question-Answering	May 25, 2025	Question AnsweringRAG	CodeCode Available
CrosGrpsABS: Cross-Attention over Syntactic and Semantic Graphs for Aspect-Based Sentiment Analysis in a Low-Resource Language	May 25, 2025	Aspect-Based Sentiment AnalysisAspect-Based Sentiment Analysis (ABSA)	—Unverified
Sparse VideoGen2: Accelerate Video Generation with Sparse Attention via Semantic-Aware Permutation	May 24, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified
Accidental Misalignment: Fine-Tuning Language Models Induces Unexpected Vulnerability	May 22, 2025	Adversarial DefenseSemantic Similarity	CodeCode Available
Omni TM-AE: A Scalable and Interpretable Embedding Model Using the Full Tsetlin Machine State Space	May 22, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified
LLMs Are Not Scorers: Rethinking MT Evaluation with Generation-Based Methods	May 22, 2025	DecoderMachine Translation	CodeCode Available
EquivPruner: Boosting Efficiency and Quality in LLM-Based Search via Action Pruning	May 22, 2025	GSM8KMath	CodeCode Available
Automated Feedback Loops to Protect Text Simplification with Generative AI from Information Loss	May 22, 2025	Missing ElementsSemantic Similarity	—Unverified
Language Specific Knowledge: Do Models Know Better in X than in English?	May 21, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified
EcomScriptBench: A Multi-task Benchmark for E-commerce Script Planning via Step-wise Intention-Driven Product Association	May 21, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified
Leveraging the Powerful Attention of a Pre-trained Diffusion Model for Exemplar-based Image Colorization	May 21, 2025	ColorizationImage Colorization	CodeCode Available
MultiHal: Multilingual Dataset for Knowledge-Graph Grounded Evaluation of LLM Hallucinations	May 20, 2025	Fact CheckingHallucination	CodeCode Available
Efficient Heuristics Generation for Solving Combinatorial Optimization Problems Using Large Language Models	May 19, 2025	Combinatorial OptimizationSemantic Similarity	CodeCode Available
Contrastive Prompting Enhances Sentence Embeddings in LLMs through Inference-Time Steering	May 19, 2025	Prompt EngineeringSemantic Textual Similarity	CodeCode Available
Community Search in Time-dependent Road-social Attributed Networks	May 18, 2025	AttributeCommunity Search	—Unverified
Fine-Grained ECG-Text Contrastive Learning via Waveform Understanding Enhancement	May 17, 2025	Contrastive LearningDiagnostic	—Unverified
Temporally-Grounded Language Generation: A Benchmark for Real-Time Vision-Language Models	May 16, 2025	Image CaptioningQuestion Answering	CodeCode Available
LDIR: Low-Dimensional Dense and Interpretable Text Embeddings with Relative Representations	May 15, 2025	Semantic Textual Similarity	CodeCode Available
FlowDreamer: A RGB-D World Model with Flow-based Motion Representations for Robot Manipulation	May 15, 2025	Robot ManipulationSemantic Similarity	—Unverified
Evaluations at Work: Measuring the Capabilities of GenAI in Use	May 15, 2025	DiversitySemantic Similarity	—Unverified
AI-enhanced semantic feature norms for 786 concepts	May 15, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified
A 2D Semantic-Aware Position Encoding for Vision Transformers	May 14, 2025	PositionSemantic Similarity	—Unverified
Towards Automated Situation Awareness: A RAG-Based Framework for Peacebuilding Reports	May 14, 2025	ArticlesDecision Making	—Unverified
TrialMatchAI: An End-to-End AI-powered Clinical Trial Recommendation System to Streamline Patient-to-Trial Matching	May 13, 2025	Lightweight DeploymentRetrieval-augmented Generation	—Unverified
Hypernym Mercury: Token Optimization Through Semantic Field Constriction And Reconstruction From Hypernyms. A New Text Compression Method	May 12, 2025	Semantic CompressionSemantic Similarity	—Unverified
Concept-Level Explainability for Auditing & Steering LLM Responses	May 12, 2025	Prompt EngineeringSemantic Similarity	CodeCode Available

Show:10 25 50

← PrevPage 7 of 48Next →

All datasets STS Benchmark MTEB MRPC SICK STS13 STS14 STS12 STS15 STS16 MRPC Dev SentEval SICK-R

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	SMARTRoBERTa	Dev Pearson Correlation	92.8	—	Unverified
2	DeBERTa (large)	Accuracy	92.5	—	Unverified
3	SMART-BERT	Dev Pearson Correlation	90	—	Unverified
4	MT-DNN-SMART	Pearson Correlation	0.93	—	Unverified
5	StructBERTRoBERTa ensemble	Pearson Correlation	0.93	—	Unverified
6	Mnet-Sim	Pearson Correlation	0.93	—	Unverified
7	XLNet (single model)	Pearson Correlation	0.93	—	Unverified
8	T5-11B	Pearson Correlation	0.93	—	Unverified
9	ALBERT	Pearson Correlation	0.93	—	Unverified
10	RoBERTa	Pearson Correlation	0.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AnglE-UAE	Spearman Correlation	84.54	—	Unverified
2	ST5-XXL	Spearman Correlation	82.63	—	Unverified
3	ST5-Large	Spearman Correlation	81.83	—	Unverified
4	ST5-XL	Spearman Correlation	81.66	—	Unverified
5	ST5-Base	Spearman Correlation	81.14	—	Unverified
6	MPNet-multilingual	Spearman Correlation	80.73	—	Unverified
7	SGPT-5.8B-nli	Spearman Correlation	80.53	—	Unverified
8	MPNet	Spearman Correlation	80.28	—	Unverified
9	MiniLM-L12	Spearman Correlation	79.8	—	Unverified
10	SimCSE-BERT-sup	Spearman Correlation	79.12	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MT-DNN-SMART	Accuracy	93.7	—	Unverified
2	ALBERT	Accuracy	93.4	—	Unverified
3	RoBERTa (ensemble)	Accuracy	92.3	—	Unverified
4	BigBird	F1	91.5	—	Unverified
5	StructBERTRoBERTa ensemble	Accuracy	91.5	—	Unverified
6	FLOATER-large	Accuracy	91.4	—	Unverified
7	SMART	Accuracy	91.3	—	Unverified
8	RoBERTa-large 355M (MLP quantized vector-wise, fine-tuned)	Accuracy	91	—	Unverified
9	RoBERTa-large 355M + Entailment as Few-shot Learner	F1	91	—	Unverified
10	SpanBERT	Accuracy	90.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromCSE-RoBERTa-large (0.355B)	Spearman Correlation	0.82	—	Unverified
2	PromptEOL+CSE+LLaMA-30B	Spearman Correlation	0.82	—	Unverified
3	PromptEOL+CSE+OPT-13B	Spearman Correlation	0.82	—	Unverified
4	SimCSE-RoBERTalarge	Spearman Correlation	0.82	—	Unverified
5	PromptEOL+CSE+OPT-2.7B	Spearman Correlation	0.81	—	Unverified
6	SentenceBERT	Spearman Correlation	0.75	—	Unverified
7	SRoBERTa-NLI-base	Spearman Correlation	0.74	—	Unverified
8	SRoBERTa-NLI-large	Spearman Correlation	0.74	—	Unverified
9	Dino (STS/̄🦕)	Spearman Correlation	0.74	—	Unverified
10	SBERT-NLI-large	Spearman Correlation	0.74	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AnglE-LLaMA-7B	Spearman Correlation	0.91	—	Unverified
2	AnglE-LLaMA-7B-v2	Spearman Correlation	0.91	—	Unverified
3	PromptEOL+CSE+LLaMA-30B	Spearman Correlation	0.9	—	Unverified
4	PromptEOL+CSE+OPT-13B	Spearman Correlation	0.9	—	Unverified
5	PromptEOL+CSE+OPT-2.7B	Spearman Correlation	0.9	—	Unverified
6	PromCSE-RoBERTa-large (0.355B)	Spearman Correlation	0.89	—	Unverified
7	Trans-Encoder-BERT-large-bi (unsup.)	Spearman Correlation	0.89	—	Unverified
8	Trans-Encoder-BERT-large-cross (unsup.)	Spearman Correlation	0.88	—	Unverified
9	Trans-Encoder-RoBERTa-large-cross (unsup.)	Spearman Correlation	0.88	—	Unverified
10	SimCSE-RoBERTa-large	Spearman Correlation	0.87	—	Unverified