Semantic Textual Similarity

Semantic textual similarity deals with determining how similar two pieces of texts are. This can take the form of assigning a score from 1 to 5. Related tasks are paraphrase or duplicate identification.

Image source: Learning Semantic Textual Similarity from Conversations

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2151–2200 of 2381 papers

Title	Date	Tasks	Status
SimMatch: Semi-supervised Learning with Similarity Matching	Mar 14, 2022	Semantic SimilaritySemantic Textual Similarity	CodeCode Available
DIBERT: Dependency Injected Bidirectional Encoder Representations from Transformers	Dec 5, 2021	Language ModelingLanguage Modelling	CodeCode Available
Gating Mechanisms for Combining Character and Word-level Word Representations: An Empirical Study	Apr 11, 2019	Semantic SimilaritySemantic Textual Similarity	CodeCode Available
Description and Evaluation of Semantic Similarity Measures Approaches	Oct 30, 2013	Semantic SimilaritySemantic Textual Similarity	CodeCode Available
KNN-Defense: Defense against 3D Adversarial Point Clouds using Nearest-Neighbor Search	Jun 7, 2025	Semantic SimilaritySemantic Textual Similarity	CodeCode Available
One Size Fits All for Semantic Shifts: Adaptive Prompt Tuning for Continual Learning	Nov 18, 2023	AllContinual Learning	CodeCode Available
Def2Vec: Extensible Word Embeddings from Dictionary Definitions	Dec 16, 2023	Chunkingnamed-entity-recognition	CodeCode Available
Knowledgeable Storyteller: A Commonsense-Driven Generative Model for Visual Storytelling	May 4, 2019	AI AgentKnowledge Graphs	CodeCode Available
On Learning Text Style Transfer with Direct Rewards	Oct 24, 2020	Machine TranslationSemantic Similarity	CodeCode Available
Text-in-Context: Token-Level Error Detection for Table-to-Text Generation	Aug 1, 2021	Language ModelingLanguage Modelling	CodeCode Available
reCSE: Portable Reshaping Features for Sentence Embedding in Self-supervised Contrastive Learning	Aug 9, 2024	Contrastive LearningData Augmentation	CodeCode Available
SDA: Simple Discrete Augmentation for Contrastive Sentence Representation Learning	Oct 8, 2022	Contrastive LearningData Augmentation	CodeCode Available
Single-View Graph Contrastive Learning with Soft Neighborhood Awareness	Dec 12, 2024	Contrastive LearningSemantic Similarity	CodeCode Available
Deep Metric Learning Beyond Binary Supervision	Apr 21, 2019	Image CaptioningImage Retrieval	CodeCode Available
Agile Effort Estimation: Have We Solved the Problem Yet? Insights From A Replication Study	Jan 14, 2022	Semantic SimilaritySemantic Textual Similarity	CodeCode Available
From Unimodal to Multimodal: Scaling up Projectors to Align Modalities	Sep 28, 2024	Image-text RetrievalSemantic Similarity	CodeCode Available
Text Representation Distillation via Information Bottleneck Principle	Nov 9, 2023	Knowledge DistillationRetrieval	CodeCode Available
Decoupling Semantic Similarity from Spatial Alignment for Neural Networks	Oct 30, 2024	Image RetrievalSemantic Similarity	CodeCode Available
SEA: Sentence Encoder Assembly for Video Retrieval by Textual Queries	Nov 24, 2020	Ad-hoc video searchManagement	CodeCode Available
From Stance to Concern: Adaptation of Propositional Analysis to New Tasks and Domains	Mar 20, 2022	Semantic SimilaritySemantic Textual Similarity	CodeCode Available
FlowRetrieval: Flow-Guided Data Retrieval for Few-Shot Imitation Learning	Aug 29, 2024	Few-Shot Imitation LearningImitation Learning	CodeCode Available
Deconstruct to Reconstruct a Configurable Evaluation Metric for Open-Domain Dialogue Systems	Nov 1, 2020	Dialogue EvaluationSemantic Similarity	CodeCode Available
Finnish resources for evaluating language model semantics	May 1, 2017	Language ModelingLanguage Modelling	CodeCode Available
Language-agnostic Representation from Multilingual Sentence Encoders for Cross-lingual Similarity Estimation	Nov 1, 2021	Cross-Lingual Semantic Textual SimilarityMachine Translation	CodeCode Available
Import2vec - Learning Embeddings for Software Libraries	Mar 27, 2019	Semantic SimilaritySemantic Textual Similarity	CodeCode Available
Ontology-based Semantic Similarity Measures for Clustering Medical Concepts in Drug Safety	Mar 26, 2025	ClusteringPharmacovigilance	CodeCode Available
Second-Order NLP Adversarial Examples	Oct 5, 2020	Adversarial AttackSemantic Similarity	CodeCode Available
OPA2Vec: combining formal and informal content of biomedical ontologies to improve similarity-based prediction	Apr 29, 2018	Semantic SimilaritySemantic Textual Similarity	CodeCode Available
20min-XD: A Comparable Corpus of Swiss News Articles	Apr 30, 2025	ArticlesSemantic Similarity	CodeCode Available
Size vs. Structure in Training Corpora for Word Embedding Models: Araneum Russicum Maximum and Russian National Corpus	Jan 19, 2018	Semantic SimilaritySemantic Textual Similarity	CodeCode Available
A Semantics-Based Measure of Emoji Similarity	Jul 14, 2017	Semantic SimilaritySemantic Textual Similarity	CodeCode Available
SLPL SHROOM at SemEval2024 Task 06: A comprehensive study on models ability to detect hallucination	Apr 7, 2024	HallucinationMachine Translation	CodeCode Available
TFW2V: An Enhanced Document Similarity Method for the Morphologically Rich Finnish Language	Dec 23, 2021	BenchmarkingClustering	CodeCode Available
OrderBkd: Textual backdoor attack through repositioning	Feb 12, 2024	Backdoor AttackPOS	CodeCode Available
FFCI: A Framework for Interpretable Automatic Evaluation of Summarization	Nov 27, 2020	Question AnsweringSemantic Textual Similarity	CodeCode Available
SMARAGD: Learning SMatch for Accurate and Rapid Approximate Graph Distance	Mar 24, 2022	ClusteringData Augmentation	CodeCode Available
Large-Scale Evaluation of Topic Models and Dimensionality Reduction Methods for 2D Text Spatialization	Jul 17, 2023	Dimensionality ReductionSemantic Similarity	CodeCode Available
Large-Scale Multi-Domain Belief Tracking with Knowledge Sharing	Jul 17, 2018	Multi-domain Dialogue State TrackingSemantic Similarity	CodeCode Available
SeFNet: Bridging Tabular Datasets with Semantic Feature Nets	Jun 20, 2023	Meta-LearningSemantic Similarity	CodeCode Available
A Semantic Relevance Based Neural Network for Text Summarization and Text Simplification	Oct 6, 2017	DecoderSemantic Similarity	CodeCode Available
Capturing Semantic Similarity for Entity Linking with Convolutional Neural Networks	Apr 4, 2016	Entity LinkingSemantic correspondence	CodeCode Available
Selective Text Augmentation with Word Roles for Low-Resource Text Classification	Sep 4, 2022	ClassificationData Augmentation	CodeCode Available
LDIR: Low-Dimensional Dense and Interpretable Text Embeddings with Relative Representations	May 15, 2025	Semantic Textual Similarity	CodeCode Available
De-Conflated Semantic Representations	Aug 5, 2016	Semantic SimilaritySemantic Textual Similarity	CodeCode Available
Are you tough enough? Framework for Robustness Validation of Machine Comprehension Systems	Dec 5, 2018	Question AnsweringReading Comprehension	CodeCode Available
Are we describing the same sound? An analysis of word embedding spaces of expressive piano performance	Dec 31, 2023	Information RetrievalRetrieval	CodeCode Available
ParaAMR: A Large-Scale Syntactically Diverse Paraphrase Dataset by AMR Back-Translation	May 26, 2023	Abstract Meaning RepresentationData Augmentation	CodeCode Available
Few-shot Hybrid Domain Adaptation of Image Generators	Oct 30, 2023	Domain AdaptationSemantic Similarity	CodeCode Available
Learning Composition Models for Phrase Embeddings	Jan 1, 2015	Language ModelingLanguage Modelling	CodeCode Available
Self-Judge: Selective Instruction Following with Alignment Self-Evaluation	Sep 2, 2024	Instruction FollowingSemantic Similarity	CodeCode Available

Show:10 25 50

← PrevPage 44 of 48Next →

All datasets STS Benchmark MTEB MRPC SICK STS13 STS14 STS12 STS15 STS16 MRPC Dev SentEval SICK-R

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	SMARTRoBERTa	Dev Pearson Correlation	92.8	—	Unverified
2	DeBERTa (large)	Accuracy	92.5	—	Unverified
3	SMART-BERT	Dev Pearson Correlation	90	—	Unverified
4	MT-DNN-SMART	Pearson Correlation	0.93	—	Unverified
5	StructBERTRoBERTa ensemble	Pearson Correlation	0.93	—	Unverified
6	Mnet-Sim	Pearson Correlation	0.93	—	Unverified
7	XLNet (single model)	Pearson Correlation	0.93	—	Unverified
8	ALBERT	Pearson Correlation	0.93	—	Unverified
9	T5-11B	Pearson Correlation	0.93	—	Unverified
10	RoBERTa	Pearson Correlation	0.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AnglE-UAE	Spearman Correlation	84.54	—	Unverified
2	ST5-XXL	Spearman Correlation	82.63	—	Unverified
3	ST5-Large	Spearman Correlation	81.83	—	Unverified
4	ST5-XL	Spearman Correlation	81.66	—	Unverified
5	ST5-Base	Spearman Correlation	81.14	—	Unverified
6	MPNet-multilingual	Spearman Correlation	80.73	—	Unverified
7	SGPT-5.8B-nli	Spearman Correlation	80.53	—	Unverified
8	MPNet	Spearman Correlation	80.28	—	Unverified
9	MiniLM-L12	Spearman Correlation	79.8	—	Unverified
10	SimCSE-BERT-sup	Spearman Correlation	79.12	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MT-DNN-SMART	Accuracy	93.7	—	Unverified
2	ALBERT	Accuracy	93.4	—	Unverified
3	RoBERTa (ensemble)	Accuracy	92.3	—	Unverified
4	BigBird	F1	91.5	—	Unverified
5	StructBERTRoBERTa ensemble	Accuracy	91.5	—	Unverified
6	FLOATER-large	Accuracy	91.4	—	Unverified
7	SMART	Accuracy	91.3	—	Unverified
8	RoBERTa-large 355M (MLP quantized vector-wise, fine-tuned)	Accuracy	91	—	Unverified
9	RoBERTa-large 355M + Entailment as Few-shot Learner	F1	91	—	Unverified
10	SpanBERT	Accuracy	90.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromCSE-RoBERTa-large (0.355B)	Spearman Correlation	0.82	—	Unverified
2	PromptEOL+CSE+LLaMA-30B	Spearman Correlation	0.82	—	Unverified
3	PromptEOL+CSE+OPT-13B	Spearman Correlation	0.82	—	Unverified
4	SimCSE-RoBERTalarge	Spearman Correlation	0.82	—	Unverified
5	PromptEOL+CSE+OPT-2.7B	Spearman Correlation	0.81	—	Unverified
6	SentenceBERT	Spearman Correlation	0.75	—	Unverified
7	SRoBERTa-NLI-base	Spearman Correlation	0.74	—	Unverified
8	SRoBERTa-NLI-large	Spearman Correlation	0.74	—	Unverified
9	Dino (STS/̄🦕)	Spearman Correlation	0.74	—	Unverified
10	SBERT-NLI-large	Spearman Correlation	0.74	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AnglE-LLaMA-7B	Spearman Correlation	0.91	—	Unverified
2	AnglE-LLaMA-7B-v2	Spearman Correlation	0.91	—	Unverified
3	PromptEOL+CSE+LLaMA-30B	Spearman Correlation	0.9	—	Unverified
4	PromptEOL+CSE+OPT-13B	Spearman Correlation	0.9	—	Unverified
5	PromptEOL+CSE+OPT-2.7B	Spearman Correlation	0.9	—	Unverified
6	PromCSE-RoBERTa-large (0.355B)	Spearman Correlation	0.89	—	Unverified
7	Trans-Encoder-BERT-large-bi (unsup.)	Spearman Correlation	0.89	—	Unverified
8	Trans-Encoder-BERT-large-cross (unsup.)	Spearman Correlation	0.88	—	Unverified
9	Trans-Encoder-RoBERTa-large-cross (unsup.)	Spearman Correlation	0.88	—	Unverified
10	SimCSE-RoBERTa-large	Spearman Correlation	0.87	—	Unverified