Semantic Textual Similarity

Semantic textual similarity deals with determining how similar two pieces of texts are. This can take the form of assigning a score from 1 to 5. Related tasks are paraphrase or duplicate identification.

Image source: Learning Semantic Textual Similarity from Conversations

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 401–450 of 2381 papers

Title	Date	Tasks	Status
Language-agnostic, automated assessment of listeners' speech recall using large language models	Mar 2, 2025	Prompt EngineeringSemantic Similarity	—Unverified
Statistical Mechanics of Semantic Compression	Mar 1, 2025	Semantic CompressionSemantic Similarity	—Unverified
TempRetriever: Fusion-based Temporal Dense Passage Retrieval for Time-Sensitive Questions	Feb 28, 2025	Information RetrievalPassage Retrieval	—Unverified
Towards Label-Only Membership Inference Attack against Pre-trained Large Language Models	Feb 26, 2025	Inference AttackMembership Inference Attack	—Unverified
EnDive: A Cross-Dialect Benchmark for Fairness and Performance in Large Language Models	Feb 25, 2025	DiversityFairness	—Unverified
How Vital is the Jurisprudential Relevance: Law Article Intervened Legal Case Retrieval and Matching	Feb 25, 2025	Multi-Task LearningRetrieval	—Unverified
ATEB: Evaluating and Improving Advanced NLP Tasks for Text Embedding Models	Feb 24, 2025	Information RetrievalInstruction Following	—Unverified
CLIMB-3D: Continual Learning for Imbalanced 3D Instance Segmentation	Feb 24, 2025	3D Instance SegmentationContinual Learning	CodeCode Available
Uncertainty Quantification of Large Language Models through Multi-Dimensional Responses	Feb 24, 2025	Decision MakingSemantic Similarity	—Unverified
Constructing a Norm for Children's Scientific Drawing: Distribution Features Based on Semantic Similarity of Large Language Models	Feb 21, 2025	Large Language ModelSemantic Similarity	—Unverified
A Meta-Evaluation of Style and Attribute Transfer Metrics	Feb 20, 2025	AttributeSemantic Similarity	—Unverified
Exploring RWKV for Sentence Embeddings: Layer-wise Analysis and Baseline Comparison for Semantic Similarity	Feb 20, 2025	GPULanguage Modeling	CodeCode Available
DeepRTL: Bridging Verilog Understanding and Generation with a Unified Representation Model	Feb 20, 2025	Code GenerationSemantic Similarity	—Unverified
Evolutionary Algorithms Approach For Search Based On Semantic Document Similarity	Feb 20, 2025	Cloud ComputingDistributed Computing	—Unverified
Event Segmentation Applications in Large Language Model Enabled Automated Recall Assessments	Feb 19, 2025	Event SegmentationLanguage Modeling	—Unverified
Breaking the Clusters: Uniformity-Optimization for Text-Based Sequential Recommendation	Feb 19, 2025	Recommendation SystemsSemantic Similarity	CodeCode Available
HopRAG: Multi-Hop Reasoning for Logic-Aware Retrieval-Augmented Generation	Feb 18, 2025	Logical ReasoningRAG	—Unverified
FaMTEB: Massive Text Embedding Benchmark in Persian Language	Feb 17, 2025	ChatbotMTEB Benchmark	—Unverified
Balanced Multi-Factor In-Context Learning for Multilingual Large Language Models	Feb 17, 2025	In-Context LearningSemantic Similarity	—Unverified
PropNet: a White-Box and Human-Like Network for Sentence Representation	Feb 15, 2025	Semantic Textual SimilaritySentence	—Unverified
Examining Multilingual Embedding Models Cross-Lingually Through LLM-Generated Adversarial Examples	Feb 12, 2025	Distractor GenerationInformation Retrieval	—Unverified
PDV: Prompt Directional Vectors for Zero-shot Composed Image Retrieval	Feb 11, 2025	Image RetrievalRetrieval	—Unverified
Bridging LLM-Generated Code and Requirements: Reverse Generation technique and SBC Metric for Developer Insights	Feb 11, 2025	Code GenerationSemantic Similarity	CodeCode Available
Elevating Legal LLM Responses: Harnessing Trainable Logical Structures and Semantic Knowledge with Legal Reasoning	Feb 11, 2025	HallucinationIn-Context Learning	CodeCode Available
Can LLMs Replace Human Evaluators? An Empirical Study of LLM-as-a-Judge in Software Engineering	Feb 10, 2025	Code GenerationCode Summarization	—Unverified
Enhancing Health Information Retrieval with RAG by Prioritizing Topical Relevance and Factual Accuracy	Feb 7, 2025	Information RetrievalMisinformation	—Unverified
Detecting Backdoor Attacks via Similarity in Semantic Communication Systems	Feb 6, 2025	Semantic CommunicationSemantic Similarity	—Unverified
How does a Multilingual LM Handle Multiple Languages?	Feb 6, 2025	Multilingual NLPMultilingual Word Embeddings	—Unverified
How do Humans and Language Models Reason About Creativity? A Comparative Analysis	Feb 5, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified
HSI: A Holistic Style Injector for Arbitrary Style Transfer	Feb 5, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified
Reverse Probing: Evaluating Knowledge Transfer via Finetuned Task Embeddings for Coreference Resolution	Jan 31, 2025	coreference-resolutionCoreference Resolution	—Unverified
Transformer Semantic Genetic Programming for Symbolic Regression	Jan 30, 2025	regressionSemantic Similarity	—Unverified
Fake News Detection After LLM Laundering: Measurement and Explanation	Jan 29, 2025	Fake News DetectionMisinformation	CodeCode Available
Feedback-Aware Monte Carlo Tree Search for Efficient Information Seeking in Goal-Oriented Conversations	Jan 25, 2025	Medical DiagnosisSemantic Similarity	—Unverified
Recommending Actionable Strategies: A Semantic Approach to Integrating Analytical Frameworks with Decision Heuristics	Jan 24, 2025	Recommendation SystemsSemantic Similarity	—Unverified
Causal Graphs Meet Thoughts: Enhancing Complex Reasoning in Graph-Augmented LLMs	Jan 24, 2025	Knowledge GraphsMedical Question Answering	CodeCode Available
A Comprehensive Framework for Semantic Similarity Analysis of Human and AI-Generated Text Using Transformer Architectures and Ensemble Techniques	Jan 24, 2025	Data AugmentationDomain Adaptation	—Unverified
2-Tier SimCSE: Elevating BERT for Robust Sentence Embeddings	Jan 23, 2025	Contrastive LearningSemantic Textual Similarity	—Unverified
Sequence Spreading-Based Semantic Communication Under High RF Interference	Jan 21, 2025	Semantic CommunicationSemantic Similarity	—Unverified
LegalGuardian: A Privacy-Preserving Framework for Secure Integration of Large Language Models in Legal Practice	Jan 19, 2025	named-entity-recognitionNamed Entity Recognition	—Unverified
Evaluating GenAI for Simplifying Texts for Education: Improving Accuracy and Consistency for Enhanced Readability	Jan 15, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified
Consistency of Responses and Continuations Generated by Large Language Models on Social Media	Jan 14, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified
Contextual ASR Error Handling with LLMs Augmentation for Goal-Oriented Conversational AI	Jan 10, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Universal Features Guided Zero-Shot Category-Level Object Pose Estimation	Jan 6, 2025	DiversityPose Estimation	—Unverified
GeAR: Generation Augmented Retrieval	Jan 6, 2025	RetrievalSemantic Similarity	—Unverified
Harnessing Frozen Unimodal Encoders for Flexible Multimodal Alignment	Jan 1, 2025	Semantic SimilaritySemantic Textual Similarity	CodeCode Available
Anchor-Aware Similarity Cohesion in Target Frames Enables Predicting Temporal Moment Boundaries in 2D	Jan 1, 2025	Moment RetrievalSemantic Similarity	CodeCode Available
ProtCLIP: Function-Informed Protein Multi-Modal Learning	Dec 28, 2024	Protein Function PredictionSemantic Similarity	—Unverified
Multiple References with Meaningful Variations Improve Literary Machine Translation	Dec 24, 2024	Machine TranslationSemantic Similarity	—Unverified
HashAttention: Semantic Sparsity for Faster Inference	Dec 19, 2024	GPUSemantic Similarity	—Unverified

Show:10 25 50

← PrevPage 9 of 48Next →

All datasets STS Benchmark MTEB MRPC SICK STS13 STS14 STS12 STS15 STS16 MRPC Dev SentEval SICK-R

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	SMARTRoBERTa	Dev Pearson Correlation	92.8	—	Unverified
2	DeBERTa (large)	Accuracy	92.5	—	Unverified
3	SMART-BERT	Dev Pearson Correlation	90	—	Unverified
4	MT-DNN-SMART	Pearson Correlation	0.93	—	Unverified
5	StructBERTRoBERTa ensemble	Pearson Correlation	0.93	—	Unverified
6	Mnet-Sim	Pearson Correlation	0.93	—	Unverified
7	XLNet (single model)	Pearson Correlation	0.93	—	Unverified
8	ALBERT	Pearson Correlation	0.93	—	Unverified
9	T5-11B	Pearson Correlation	0.93	—	Unverified
10	RoBERTa	Pearson Correlation	0.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AnglE-UAE	Spearman Correlation	84.54	—	Unverified
2	ST5-XXL	Spearman Correlation	82.63	—	Unverified
3	ST5-Large	Spearman Correlation	81.83	—	Unverified
4	ST5-XL	Spearman Correlation	81.66	—	Unverified
5	ST5-Base	Spearman Correlation	81.14	—	Unverified
6	MPNet-multilingual	Spearman Correlation	80.73	—	Unverified
7	SGPT-5.8B-nli	Spearman Correlation	80.53	—	Unverified
8	MPNet	Spearman Correlation	80.28	—	Unverified
9	MiniLM-L12	Spearman Correlation	79.8	—	Unverified
10	SimCSE-BERT-sup	Spearman Correlation	79.12	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MT-DNN-SMART	Accuracy	93.7	—	Unverified
2	ALBERT	Accuracy	93.4	—	Unverified
3	RoBERTa (ensemble)	Accuracy	92.3	—	Unverified
4	BigBird	F1	91.5	—	Unverified
5	StructBERTRoBERTa ensemble	Accuracy	91.5	—	Unverified
6	FLOATER-large	Accuracy	91.4	—	Unverified
7	SMART	Accuracy	91.3	—	Unverified
8	RoBERTa-large 355M (MLP quantized vector-wise, fine-tuned)	Accuracy	91	—	Unverified
9	RoBERTa-large 355M + Entailment as Few-shot Learner	F1	91	—	Unverified
10	SpanBERT	Accuracy	90.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromCSE-RoBERTa-large (0.355B)	Spearman Correlation	0.82	—	Unverified
2	PromptEOL+CSE+LLaMA-30B	Spearman Correlation	0.82	—	Unverified
3	PromptEOL+CSE+OPT-13B	Spearman Correlation	0.82	—	Unverified
4	SimCSE-RoBERTalarge	Spearman Correlation	0.82	—	Unverified
5	PromptEOL+CSE+OPT-2.7B	Spearman Correlation	0.81	—	Unverified
6	SentenceBERT	Spearman Correlation	0.75	—	Unverified
7	SRoBERTa-NLI-base	Spearman Correlation	0.74	—	Unverified
8	SRoBERTa-NLI-large	Spearman Correlation	0.74	—	Unverified
9	Dino (STS/̄🦕)	Spearman Correlation	0.74	—	Unverified
10	SBERT-NLI-large	Spearman Correlation	0.74	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AnglE-LLaMA-7B	Spearman Correlation	0.91	—	Unverified
2	AnglE-LLaMA-7B-v2	Spearman Correlation	0.91	—	Unverified
3	PromptEOL+CSE+LLaMA-30B	Spearman Correlation	0.9	—	Unverified
4	PromptEOL+CSE+OPT-13B	Spearman Correlation	0.9	—	Unverified
5	PromptEOL+CSE+OPT-2.7B	Spearman Correlation	0.9	—	Unverified
6	PromCSE-RoBERTa-large (0.355B)	Spearman Correlation	0.89	—	Unverified
7	Trans-Encoder-BERT-large-bi (unsup.)	Spearman Correlation	0.89	—	Unverified
8	Trans-Encoder-BERT-large-cross (unsup.)	Spearman Correlation	0.88	—	Unverified
9	Trans-Encoder-RoBERTa-large-cross (unsup.)	Spearman Correlation	0.88	—	Unverified
10	SimCSE-RoBERTa-large	Spearman Correlation	0.87	—	Unverified