Semantic Textual Similarity

Semantic textual similarity deals with determining how similar two pieces of texts are. This can take the form of assigning a score from 1 to 5. Related tasks are paraphrase or duplicate identification.

Image source: Learning Semantic Textual Similarity from Conversations

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–75 of 2381 papers

Title	Date	Tasks	Status	Hype
Contrastive Prompting Enhances Sentence Embeddings in LLMs through Inference-Time Steering	May 19, 2025	Prompt EngineeringSemantic Textual Similarity	CodeCode Available	0
Efficient Heuristics Generation for Solving Combinatorial Optimization Problems Using Large Language Models	May 19, 2025	Combinatorial OptimizationSemantic Similarity	CodeCode Available	0
One-Step Offline Distillation of Diffusion-based Models via Koopman Modeling	May 19, 2025	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	1
Community Search in Time-dependent Road-social Attributed Networks	May 18, 2025	AttributeCommunity Search	—Unverified	0
Fine-Grained ECG-Text Contrastive Learning via Waveform Understanding Enhancement	May 17, 2025	Contrastive LearningDiagnostic	—Unverified	0
ELITE: Embedding-Less retrieval with Iterative Text Exploration	May 17, 2025	graph constructionRAG	CodeCode Available	1
Temporally-Grounded Language Generation: A Benchmark for Real-Time Vision-Language Models	May 16, 2025	Image CaptioningQuestion Answering	CodeCode Available	0
Evaluations at Work: Measuring the Capabilities of GenAI in Use	May 15, 2025	DiversitySemantic Similarity	—Unverified	0
AI-enhanced semantic feature norms for 786 concepts	May 15, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified	0
FlowDreamer: A RGB-D World Model with Flow-based Motion Representations for Robot Manipulation	May 15, 2025	Robot ManipulationSemantic Similarity	—Unverified	0
LDIR: Low-Dimensional Dense and Interpretable Text Embeddings with Relative Representations	May 15, 2025	Semantic Textual Similarity	CodeCode Available	0
Towards Automated Situation Awareness: A RAG-Based Framework for Peacebuilding Reports	May 14, 2025	ArticlesDecision Making	—Unverified	0
A 2D Semantic-Aware Position Encoding for Vision Transformers	May 14, 2025	PositionSemantic Similarity	—Unverified	0
TrialMatchAI: An End-to-End AI-powered Clinical Trial Recommendation System to Streamline Patient-to-Trial Matching	May 13, 2025	Lightweight DeploymentRetrieval-augmented Generation	—Unverified	0
Are LLMs complicated ethical dilemma analyzers?	May 12, 2025	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	0
Hypernym Mercury: Token Optimization Through Semantic Field Constriction And Reconstruction From Hypernyms. A New Text Compression Method	May 12, 2025	Semantic CompressionSemantic Similarity	—Unverified	0
Concept-Level Explainability for Auditing & Steering LLM Responses	May 12, 2025	Prompt EngineeringSemantic Similarity	CodeCode Available	0
Jailbreaking the Text-to-Video Generative Models	May 10, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified	0
Estimating Quality in Therapeutic Conversations: A Multi-Dimensional Natural Language Processing Framework	May 9, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified	0
Sparse Attention Remapping with Clustering for Efficient LLM Decoding on PIM	May 9, 2025	ClusteringSemantic Similarity	—Unverified	0
Stealthy LLM-Driven Data Poisoning Attacks Against Embedding-Based Retrieval-Augmented Recommender Systems	May 8, 2025	Data PoisoningLanguage Modeling	—Unverified	0
R&B: Domain Regrouping and Data Mixture Balancing for Efficient Foundation Model Training	May 1, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified	0
Retrieval-Enhanced Few-Shot Prompting for Speech Event Extraction	Apr 30, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Homa at SemEval-2025 Task 5: Aligning Librarian Records with OntoAligner for Subject Tagging	Apr 30, 2025	RAGRetrieval	—Unverified	0
20min-XD: A Comparable Corpus of Swiss News Articles	Apr 30, 2025	ArticlesSemantic Similarity	CodeCode Available	0

Show:10 25 50

← PrevPage 3 of 96Next →

All datasets STS Benchmark MTEB MRPC SICK STS13 STS14 STS12 STS15 STS16 MRPC Dev SentEval SICK-R

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	SMARTRoBERTa	Dev Pearson Correlation	92.8	—	Unverified
2	DeBERTa (large)	Accuracy	92.5	—	Unverified
3	SMART-BERT	Dev Pearson Correlation	90	—	Unverified
4	MT-DNN-SMART	Pearson Correlation	0.93	—	Unverified
5	StructBERTRoBERTa ensemble	Pearson Correlation	0.93	—	Unverified
6	Mnet-Sim	Pearson Correlation	0.93	—	Unverified
7	XLNet (single model)	Pearson Correlation	0.93	—	Unverified
8	ALBERT	Pearson Correlation	0.93	—	Unverified
9	T5-11B	Pearson Correlation	0.93	—	Unverified
10	RoBERTa	Pearson Correlation	0.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AnglE-UAE	Spearman Correlation	84.54	—	Unverified
2	ST5-XXL	Spearman Correlation	82.63	—	Unverified
3	ST5-Large	Spearman Correlation	81.83	—	Unverified
4	ST5-XL	Spearman Correlation	81.66	—	Unverified
5	ST5-Base	Spearman Correlation	81.14	—	Unverified
6	MPNet-multilingual	Spearman Correlation	80.73	—	Unverified
7	SGPT-5.8B-nli	Spearman Correlation	80.53	—	Unverified
8	MPNet	Spearman Correlation	80.28	—	Unverified
9	MiniLM-L12	Spearman Correlation	79.8	—	Unverified
10	SimCSE-BERT-sup	Spearman Correlation	79.12	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MT-DNN-SMART	Accuracy	93.7	—	Unverified
2	ALBERT	Accuracy	93.4	—	Unverified
3	RoBERTa (ensemble)	Accuracy	92.3	—	Unverified
4	BigBird	F1	91.5	—	Unverified
5	StructBERTRoBERTa ensemble	Accuracy	91.5	—	Unverified
6	FLOATER-large	Accuracy	91.4	—	Unverified
7	SMART	Accuracy	91.3	—	Unverified
8	RoBERTa-large 355M (MLP quantized vector-wise, fine-tuned)	Accuracy	91	—	Unverified
9	RoBERTa-large 355M + Entailment as Few-shot Learner	F1	91	—	Unverified
10	SpanBERT	Accuracy	90.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromCSE-RoBERTa-large (0.355B)	Spearman Correlation	0.82	—	Unverified
2	PromptEOL+CSE+LLaMA-30B	Spearman Correlation	0.82	—	Unverified
3	PromptEOL+CSE+OPT-13B	Spearman Correlation	0.82	—	Unverified
4	SimCSE-RoBERTalarge	Spearman Correlation	0.82	—	Unverified
5	PromptEOL+CSE+OPT-2.7B	Spearman Correlation	0.81	—	Unverified
6	SentenceBERT	Spearman Correlation	0.75	—	Unverified
7	SRoBERTa-NLI-base	Spearman Correlation	0.74	—	Unverified
8	SRoBERTa-NLI-large	Spearman Correlation	0.74	—	Unverified
9	Dino (STS/̄🦕)	Spearman Correlation	0.74	—	Unverified
10	SBERT-NLI-large	Spearman Correlation	0.74	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AnglE-LLaMA-7B	Spearman Correlation	0.91	—	Unverified
2	AnglE-LLaMA-7B-v2	Spearman Correlation	0.91	—	Unverified
3	PromptEOL+CSE+LLaMA-30B	Spearman Correlation	0.9	—	Unverified
4	PromptEOL+CSE+OPT-13B	Spearman Correlation	0.9	—	Unverified
5	PromptEOL+CSE+OPT-2.7B	Spearman Correlation	0.9	—	Unverified
6	PromCSE-RoBERTa-large (0.355B)	Spearman Correlation	0.89	—	Unverified
7	Trans-Encoder-BERT-large-bi (unsup.)	Spearman Correlation	0.89	—	Unverified
8	Trans-Encoder-BERT-large-cross (unsup.)	Spearman Correlation	0.88	—	Unverified
9	Trans-Encoder-RoBERTa-large-cross (unsup.)	Spearman Correlation	0.88	—	Unverified
10	SimCSE-RoBERTa-large	Spearman Correlation	0.87	—	Unverified