Semantic Textual Similarity

Semantic textual similarity deals with determining how similar two pieces of texts are. This can take the form of assigning a score from 1 to 5. Related tasks are paraphrase or duplicate identification.

Image source: Learning Semantic Textual Similarity from Conversations

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 351–400 of 2381 papers

Title	Date	Tasks	Status
Hypernym Mercury: Token Optimization Through Semantic Field Constriction And Reconstruction From Hypernyms. A New Text Compression Method	May 12, 2025	Semantic CompressionSemantic Similarity	—Unverified
Jailbreaking the Text-to-Video Generative Models	May 10, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified
Estimating Quality in Therapeutic Conversations: A Multi-Dimensional Natural Language Processing Framework	May 9, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified
Sparse Attention Remapping with Clustering for Efficient LLM Decoding on PIM	May 9, 2025	ClusteringSemantic Similarity	—Unverified
Stealthy LLM-Driven Data Poisoning Attacks Against Embedding-Based Retrieval-Augmented Recommender Systems	May 8, 2025	Data PoisoningLanguage Modeling	—Unverified
R&B: Domain Regrouping and Data Mixture Balancing for Efficient Foundation Model Training	May 1, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified
Homa at SemEval-2025 Task 5: Aligning Librarian Records with OntoAligner for Subject Tagging	Apr 30, 2025	RAGRetrieval	—Unverified
Retrieval-Enhanced Few-Shot Prompting for Speech Event Extraction	Apr 30, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
20min-XD: A Comparable Corpus of Swiss News Articles	Apr 30, 2025	ArticlesSemantic Similarity	CodeCode Available
ReCellTy: Domain-specific knowledge graph retrieval-augmented LLMs workflow for single-cell annotation	Apr 24, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified
Stay Hungry, Stay Foolish: On the Extended Reading Articles Generation with LLMs	Apr 21, 2025	ArticlesSemantic Similarity	—Unverified
Cyc3D: Fine-grained Controllable 3D Generation via Cycle Consistency Regularization	Apr 21, 2025	3D GenerationSemantic Similarity	—Unverified
Exploring Language Patterns of Prompts in Text-to-Image Generation and Their Impact on Visual Diversity	Apr 19, 2025	DiversityImage Generation	—Unverified
Towards a Multi-Agent Vision-Language System for Zero-Shot Novel Hazardous Object Detection for Autonomous Driving Safety	Apr 18, 2025	Anomaly DetectionAutonomous Driving	CodeCode Available
Semantic Similarity-Informed Bayesian Borrowing for Quantitative Signal Detection of Adverse Events	Apr 16, 2025	Bayesian InferenceMarketing	—Unverified
Self-Controlled Dynamic Expansion Model for Continual Learning	Apr 14, 2025	Continual Learningmodel	—Unverified
HD-RAG: Retrieval-Augmented Generation for Hybrid Documents Containing Text and Hierarchical Tables	Apr 13, 2025	Question AnsweringRAG	—Unverified
Embodied Image Captioning: Self-supervised Learning Agents for Spatially Coherent Image Descriptions	Apr 11, 2025	Contrastive LearningImage Captioning	—Unverified
Evaluating Retrieval Augmented Generative Models for Document Queries in Transportation Safety	Apr 9, 2025	Information RetrievalRAG	—Unverified
Balancing Complexity and Informativeness in LLM-Based Clustering: Finding the Goldilocks Zone	Apr 6, 2025	ClusteringInformativeness	—Unverified
ProtoGuard-guided PROPEL: Class-Aware Prototype Enhancement and Progressive Labeling for Incremental 3D Point Cloud Segmentation	Apr 2, 2025	class-incremental learningClass Incremental Learning	—Unverified
Horizon Scans can be accelerated using novel information retrieval and artificial intelligence tools	Apr 2, 2025	Active LearningArticles	—Unverified
SentenceKV: Efficient LLM Inference via Sentence-Level Semantic KV Caching	Apr 1, 2025	Computational EfficiencyCPU	—Unverified
Context-Aware Human Behavior Prediction Using Multimodal Large Language Models: Challenges and Insights	Apr 1, 2025	Activity PredictionDomain Generalization	—Unverified
Beyond Detection: Designing AI-Resilient Assessments with Automated Feedback Tool to Foster Critical Thinking	Mar 30, 2025	FairnessSemantic Similarity	—Unverified
Discovering Knowledge Deficiencies of Language Models on Massive Knowledge Base	Mar 30, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified
A Quantitative Approach to Evaluating Open-Source EHR Systems for Indian Healthcare	Mar 27, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified
HyperFree: A Channel-adaptive and Tuning-free Foundation Model for Hyperspectral Remote Sensing Imagery	Mar 27, 2025	Earth ObservationPrompt Engineering	—Unverified
Ontology-based Semantic Similarity Measures for Clustering Medical Concepts in Drug Safety	Mar 26, 2025	ClusteringPharmacovigilance	CodeCode Available
BeLightRec: A lightweight recommender system enhanced with BERT	Mar 26, 2025	Collaborative FilteringRecommendation Systems	—Unverified
CausalRAG: Integrating Causal Graphs into Retrieval-Augmented Generation	Mar 25, 2025	ChunkingRAG	—Unverified
SeLIP: Similarity Enhanced Contrastive Language Image Pretraining for Multi-modal Head MRI	Mar 25, 2025	Contrastive LearningImage Segmentation	—Unverified
Unleashing the power of text for credit default prediction: Comparing human-written and generative AI-refined texts	Mar 23, 2025	Large Language ModelSemantic Similarity	—Unverified
Vision Transformer Based Semantic Communications for Next Generation Wireless Networks	Mar 21, 2025	DecoderSemantic Communication	—Unverified
CASE -- Condition-Aware Sentence Embeddings for Conditional Semantic Textual Similarity Measurement	Mar 21, 2025	Dimensionality ReductionLanguage Modeling	—Unverified
KVShare: An LLM Service System with Efficient and Effective Multi-Tenant KV Cache Reuse	Mar 17, 2025	DiversityLanguage Modeling	—Unverified
A General Close-loop Predictive Coding Framework for Auditory Working Memory	Mar 16, 2025	Language AcquisitionSemantic Similarity	—Unverified
TLAC: Two-stage LMM Augmented CLIP for Zero-Shot Classification	Mar 15, 2025	Domain Generalizationimage-classification	CodeCode Available
Measuring Similarity in Causal Graphs: A Framework for Semantic and Structural Analysis	Mar 14, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified
Domain Adaptation for Japanese Sentence Embeddings with Contrastive Learning based on Synthetic Sentence Generation	Mar 12, 2025	Contrastive LearningDomain Adaptation	CodeCode Available
PromptMap: An Alternative Interaction Style for AI-Based Image Generation	Mar 12, 2025	Image GenerationSemantic Similarity	CodeCode Available
Asymmetric Visual Semantic Embedding Framework for Efficient Vision-Language Alignment	Mar 10, 2025	Semantic SimilaritySemantic Textual Similarity	CodeCode Available
Are We Truly Forgetting? A Critical Re-examination of Machine Unlearning Evaluation Protocols	Mar 10, 2025	Machine UnlearningSemantic Similarity	—Unverified
MIGA: Mutual Information-Guided Attack on Denoising Models for Semantic Manipulation	Mar 10, 2025	DenoisingSemantic Similarity	—Unverified
AuthorMist: Evading AI Text Detectors with Reinforcement Learning	Mar 10, 2025	reinforcement-learningReinforcement Learning	—Unverified
SEED: Towards More Accurate Semantic Evaluation for Visual Brain Decoding	Mar 9, 2025	Brain DecodingSemantic Similarity	—Unverified
Improving RAG Retrieval via Propositional Content Extraction: a Speech Act Theory Approach	Mar 7, 2025	RAGRetrieval	—Unverified
AutoTestForge: A Multidimensional Automated Testing Framework for Natural Language Processing Models	Mar 7, 2025	FairnessSemantic Textual Similarity	—Unverified
Token-Level Privacy in Large Language Models	Mar 5, 2025	Privacy PreservingSemantic Similarity	—Unverified
SEOE: A Scalable and Reliable Semantic Evaluation Framework for Open Domain Event Detection	Mar 5, 2025	Event DetectionSemantic Similarity	—Unverified

Show:10 25 50

← PrevPage 8 of 48Next →

All datasets STS Benchmark MTEB MRPC SICK STS13 STS14 STS12 STS15 STS16 MRPC Dev SentEval SICK-R

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	SMARTRoBERTa	Dev Pearson Correlation	92.8	—	Unverified
2	DeBERTa (large)	Accuracy	92.5	—	Unverified
3	SMART-BERT	Dev Pearson Correlation	90	—	Unverified
4	MT-DNN-SMART	Pearson Correlation	0.93	—	Unverified
5	StructBERTRoBERTa ensemble	Pearson Correlation	0.93	—	Unverified
6	Mnet-Sim	Pearson Correlation	0.93	—	Unverified
7	XLNet (single model)	Pearson Correlation	0.93	—	Unverified
8	ALBERT	Pearson Correlation	0.93	—	Unverified
9	T5-11B	Pearson Correlation	0.93	—	Unverified
10	RoBERTa	Pearson Correlation	0.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AnglE-UAE	Spearman Correlation	84.54	—	Unverified
2	ST5-XXL	Spearman Correlation	82.63	—	Unverified
3	ST5-Large	Spearman Correlation	81.83	—	Unverified
4	ST5-XL	Spearman Correlation	81.66	—	Unverified
5	ST5-Base	Spearman Correlation	81.14	—	Unverified
6	MPNet-multilingual	Spearman Correlation	80.73	—	Unverified
7	SGPT-5.8B-nli	Spearman Correlation	80.53	—	Unverified
8	MPNet	Spearman Correlation	80.28	—	Unverified
9	MiniLM-L12	Spearman Correlation	79.8	—	Unverified
10	SimCSE-BERT-sup	Spearman Correlation	79.12	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MT-DNN-SMART	Accuracy	93.7	—	Unverified
2	ALBERT	Accuracy	93.4	—	Unverified
3	RoBERTa (ensemble)	Accuracy	92.3	—	Unverified
4	BigBird	F1	91.5	—	Unverified
5	StructBERTRoBERTa ensemble	Accuracy	91.5	—	Unverified
6	FLOATER-large	Accuracy	91.4	—	Unverified
7	SMART	Accuracy	91.3	—	Unverified
8	RoBERTa-large 355M (MLP quantized vector-wise, fine-tuned)	Accuracy	91	—	Unverified
9	RoBERTa-large 355M + Entailment as Few-shot Learner	F1	91	—	Unverified
10	SpanBERT	Accuracy	90.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromCSE-RoBERTa-large (0.355B)	Spearman Correlation	0.82	—	Unverified
2	PromptEOL+CSE+LLaMA-30B	Spearman Correlation	0.82	—	Unverified
3	PromptEOL+CSE+OPT-13B	Spearman Correlation	0.82	—	Unverified
4	SimCSE-RoBERTalarge	Spearman Correlation	0.82	—	Unverified
5	PromptEOL+CSE+OPT-2.7B	Spearman Correlation	0.81	—	Unverified
6	SentenceBERT	Spearman Correlation	0.75	—	Unverified
7	SRoBERTa-NLI-base	Spearman Correlation	0.74	—	Unverified
8	SRoBERTa-NLI-large	Spearman Correlation	0.74	—	Unverified
9	Dino (STS/̄🦕)	Spearman Correlation	0.74	—	Unverified
10	SBERT-NLI-large	Spearman Correlation	0.74	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AnglE-LLaMA-7B	Spearman Correlation	0.91	—	Unverified
2	AnglE-LLaMA-7B-v2	Spearman Correlation	0.91	—	Unverified
3	PromptEOL+CSE+LLaMA-30B	Spearman Correlation	0.9	—	Unverified
4	PromptEOL+CSE+OPT-13B	Spearman Correlation	0.9	—	Unverified
5	PromptEOL+CSE+OPT-2.7B	Spearman Correlation	0.9	—	Unverified
6	PromCSE-RoBERTa-large (0.355B)	Spearman Correlation	0.89	—	Unverified
7	Trans-Encoder-BERT-large-bi (unsup.)	Spearman Correlation	0.89	—	Unverified
8	Trans-Encoder-BERT-large-cross (unsup.)	Spearman Correlation	0.88	—	Unverified
9	Trans-Encoder-RoBERTa-large-cross (unsup.)	Spearman Correlation	0.88	—	Unverified
10	SimCSE-RoBERTa-large	Spearman Correlation	0.87	—	Unverified