Semantic Textual Similarity

Semantic textual similarity deals with determining how similar two pieces of texts are. This can take the form of assigning a score from 1 to 5. Related tasks are paraphrase or duplicate identification.

Image source: Learning Semantic Textual Similarity from Conversations

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 951–1000 of 2381 papers

Title	Date	Tasks	Status
Evaluation on Second Language Collocational Congruency with Computational Semantic Similarity	Nov 1, 2013	Semantic SimilaritySemantic Textual Similarity	—Unverified
GiBERT: Introducing Linguistic Knowledge into BERT through a Lightweight Gated Injection Method	Oct 23, 2020	Semantic SimilaritySemantic Textual Similarity	—Unverified
GiCCS: A German in-Context Conversational Similarity Benchmark	Dec 16, 2022	BenchmarkingSemantic Textual Similarity	—Unverified
GKR: the Graphical Knowledge Representation for semantic parsing	Jun 1, 2018	Natural Language InferenceSemantic Parsing	—Unverified
Evaluation of taxonomic and neural embedding methods for calculating semantic similarity	Sep 30, 2022	Semantic SimilaritySemantic Textual Similarity	—Unverified
Evaluation of Simple Distributional Compositional Operations on Longer Texts	May 1, 2014	Semantic Textual SimilaritySentence	—Unverified
CFILT-CORE: Semantic Textual Similarity using Universal Networking Language	Jun 1, 2013	Information RetrievalNatural Language Inference	—Unverified
Evaluation of Semantic Search and its Role in Retrieved-Augmented-Generation (RAG) for Arabic Language	Mar 27, 2024	RAGRetrieval	—Unverified
Evaluation of BERT and ALBERT Sentence Embedding Performance on Downstream NLP Tasks	Jan 26, 2021	Language ModellingNatural Language Inference	—Unverified
Evaluation Datasets for Cross-lingual Semantic Textual Similarity	Sep 1, 2021	Cross-Lingual Semantic Textual SimilaritySemantic Textual Similarity	—Unverified
Gold Standard Online Debates Summaries and First Experiments Towards Automatic Summarization of Online Debate Data	Aug 15, 2017	ArticlesExtractive Summarization	—Unverified
GPTSee: Enhancing Moment Retrieval and Highlight Detection via Description-Based Similarity Features	Mar 3, 2024	DecoderHighlight Detection	—Unverified
Graph-Augmented Cyclic Learning Framework for Similarity Estimation of Medical Clinical Notes	Aug 19, 2022	DiagnosticLanguage Modeling	—Unverified
Evaluation by Association: A Systematic Study of Quantitative Word Association Evaluation	Apr 1, 2017	Information RetrievalRepresentation Learning	—Unverified
Center-wise Local Image Mixture For Contrastive Representation Learning	Nov 5, 2020	Contrastive LearningData Augmentation	—Unverified
GrFormer: A Novel Transformer on Grassmann Manifold for Infrared and Visible Image Fusion	Jun 17, 2025	Infrared And Visible Image FusionSemantic Similarity	—Unverified
Grounding Action Descriptions in Videos	Jan 1, 2013	Semantic Textual SimilarityVideo Understanding	—Unverified
Grounding Semantics in Olfactory Perception	Jul 1, 2015	Semantic Textual SimilarityZero-Shot Learning	—Unverified
GSI-UPM at SemEval-2019 Task 5: Semantic Similarity and Word Embeddings for Multilingual Detection of Hate Speech Against Immigrants and Women on Twitter	Jun 1, 2019	POSPosition	—Unverified
Are We Truly Forgetting? A Critical Re-examination of Machine Unlearning Evaluation Protocols	Mar 10, 2025	Machine UnlearningSemantic Similarity	—Unverified
A Large-Scale Multilingual Disambiguation of Glosses	Aug 24, 2016	ClusteringNatural Language Understanding	—Unverified
A Contrastive Framework for Learning Sentence Representations from Pairwise and Triple-wise Perspective in Angular Space	May 1, 2022	Contrastive LearningSemantic Textual Similarity	—Unverified
Evaluating Topic Coherence Using Distributional Semantics	Mar 1, 2013	Information RetrievalSemantic Textual Similarity	—Unverified
Evaluating the Utility of Model Configurations and Data Augmentation on Clinical Semantic Textual Similarity	Jul 1, 2020	Data AugmentationSemantic Textual Similarity	—Unverified
Evaluating the Susceptibility of Pre-Trained Language Models via Handcrafted Adversarial Examples	Sep 5, 2022	Semantic SimilaritySemantic Textual Similarity	—Unverified
Evaluating the Stability of Embedding-based Word Similarities	Jan 1, 2018	Semantic Textual SimilarityWord Embeddings	—Unverified
Hardness of Samples Need to be Quantified for a Reliable Evaluation System: Exploring Potential Opportunities with a New Task	Oct 14, 2022	Semantic Textual SimilaritySTS	—Unverified
CDTDS: Predicting Paraphrases in Twitter via Support Vector Regression	Jun 1, 2015	regressionSemantic Textual Similarity	—Unverified
Harnessing label semantics to extract higher performance under noisy label for Company to Industry matching	Dec 3, 2022	AI AgentMulti Label Text Classification	—Unverified
HashAttention: Semantic Sparsity for Faster Inference	Dec 19, 2024	GPUSemantic Similarity	—Unverified
Hashtags are (not) judgemental: The untold story of Lok Sabha elections 2019	Sep 16, 2019	Semantic SimilaritySemantic Textual Similarity	—Unverified
HCCL at SemEval-2017 Task 2: Combining Multilingual Word Embeddings and Transliteration Model for Semantic Similarity	Aug 1, 2017	Cross-Lingual Word EmbeddingsMachine Translation	—Unverified
Evaluating the Effectiveness of Efficient Neural Architecture Search for Sentence-Pair Tasks	Oct 8, 2020	image-classificationImage Classification	—Unverified
HD-RAG: Retrieval-Augmented Generation for Hybrid Documents Containing Text and Hierarchical Tables	Apr 13, 2025	Question AnsweringRAG	—Unverified
Headerless, Quoteless, but not Hopeless? Using Pairwise Email Classification to Disentangle Email Threads	Sep 1, 2013	General ClassificationSemantic Textual Similarity	—Unverified
HENRY-CORE: Domain Adaptation and Stacking for Text Similarity	Jun 1, 2013	Domain AdaptationMachine Translation	—Unverified
HHU at SemEval-2016 Task 1: Multiple Approaches to Measuring Semantic Textual Similarity	Jun 1, 2016	LemmatizationNamed Entity Recognition (NER)	—Unverified
HHU at SemEval-2017 Task 2: Fast Hash-Based Embeddings for Semantic Word Similarity Assessment	Aug 1, 2017	Learning Word EmbeddingsSemantic Textual Similarity	—Unverified
Evaluating text coherence based on semantic similarity graph	Aug 1, 2017	graph constructionSemantic Similarity	—Unverified
CausalRAG: Integrating Causal Graphs into Retrieval-Augmented Generation	Mar 25, 2025	ChunkingRAG	—Unverified
Evaluating Tag Recommendations for E-Book Annotation Using a Semantic Similarity Metric	Aug 12, 2019	DescriptiveDiversity	—Unverified
Evaluating semantic models with word-sentence relatedness	Mar 23, 2016	ImplicaturesSemantic Similarity	—Unverified
Are Multilingual Models the Best Choice for Moderately Under-resourced Languages? A Comprehensive Assessment for Catalan	Jul 16, 2021	Language ModelingLanguage Modelling	—Unverified
Highlights of Semantics in Multi-objective Genetic Programming	Jun 10, 2022	Binary ClassificationDiversity	—Unverified
A Large Resource of Patterns for Verbal Paraphrases	May 1, 2018	Natural Language InferenceSemantic Textual Similarity	—Unverified
Evaluating Retrieval Augmented Generative Models for Document Queries in Transportation Safety	Apr 9, 2025	Information RetrievalRAG	—Unverified
Causal Adversarial Perturbations for Individual Fairness and Robustness in Heterogeneous Data Spaces	Aug 17, 2023	Adversarial RobustnessFairness	—Unverified
Evaluating Multimodal Representations on Sentence Similarity: vSTS, Visual Semantic Textual Similarity Dataset	Sep 11, 2018	Semantic Textual SimilaritySentence	—Unverified
HLTC-HKUST: A Neural Network Paraphrase Classifier using Translation Metrics, Semantic Roles and Lexical Similarity Features	Jun 1, 2015	Paraphrase IdentificationSemantic Textual Similarity	—Unverified
Are Manually Prepared Affective Lexicons Really Useful for Sentiment Analysis	Nov 1, 2017	Semantic Textual SimilaritySentiment Analysis	—Unverified

Show:10 25 50

← PrevPage 20 of 48Next →

All datasets STS Benchmark MTEB MRPC SICK STS13 STS14 STS12 STS15 STS16 MRPC Dev SentEval SICK-R

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	SMARTRoBERTa	Dev Pearson Correlation	92.8	—	Unverified
2	DeBERTa (large)	Accuracy	92.5	—	Unverified
3	SMART-BERT	Dev Pearson Correlation	90	—	Unverified
4	MT-DNN-SMART	Pearson Correlation	0.93	—	Unverified
5	StructBERTRoBERTa ensemble	Pearson Correlation	0.93	—	Unverified
6	Mnet-Sim	Pearson Correlation	0.93	—	Unverified
7	XLNet (single model)	Pearson Correlation	0.93	—	Unverified
8	ALBERT	Pearson Correlation	0.93	—	Unverified
9	T5-11B	Pearson Correlation	0.93	—	Unverified
10	RoBERTa	Pearson Correlation	0.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AnglE-UAE	Spearman Correlation	84.54	—	Unverified
2	ST5-XXL	Spearman Correlation	82.63	—	Unverified
3	ST5-Large	Spearman Correlation	81.83	—	Unverified
4	ST5-XL	Spearman Correlation	81.66	—	Unverified
5	ST5-Base	Spearman Correlation	81.14	—	Unverified
6	MPNet-multilingual	Spearman Correlation	80.73	—	Unverified
7	SGPT-5.8B-nli	Spearman Correlation	80.53	—	Unverified
8	MPNet	Spearman Correlation	80.28	—	Unverified
9	MiniLM-L12	Spearman Correlation	79.8	—	Unverified
10	SimCSE-BERT-sup	Spearman Correlation	79.12	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MT-DNN-SMART	Accuracy	93.7	—	Unverified
2	ALBERT	Accuracy	93.4	—	Unverified
3	RoBERTa (ensemble)	Accuracy	92.3	—	Unverified
4	BigBird	F1	91.5	—	Unverified
5	StructBERTRoBERTa ensemble	Accuracy	91.5	—	Unverified
6	FLOATER-large	Accuracy	91.4	—	Unverified
7	SMART	Accuracy	91.3	—	Unverified
8	RoBERTa-large 355M (MLP quantized vector-wise, fine-tuned)	Accuracy	91	—	Unverified
9	RoBERTa-large 355M + Entailment as Few-shot Learner	F1	91	—	Unverified
10	SpanBERT	Accuracy	90.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromCSE-RoBERTa-large (0.355B)	Spearman Correlation	0.82	—	Unverified
2	PromptEOL+CSE+LLaMA-30B	Spearman Correlation	0.82	—	Unverified
3	PromptEOL+CSE+OPT-13B	Spearman Correlation	0.82	—	Unverified
4	SimCSE-RoBERTalarge	Spearman Correlation	0.82	—	Unverified
5	PromptEOL+CSE+OPT-2.7B	Spearman Correlation	0.81	—	Unverified
6	SentenceBERT	Spearman Correlation	0.75	—	Unverified
7	SRoBERTa-NLI-base	Spearman Correlation	0.74	—	Unverified
8	SRoBERTa-NLI-large	Spearman Correlation	0.74	—	Unverified
9	Dino (STS/̄🦕)	Spearman Correlation	0.74	—	Unverified
10	SBERT-NLI-large	Spearman Correlation	0.74	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AnglE-LLaMA-7B	Spearman Correlation	0.91	—	Unverified
2	AnglE-LLaMA-7B-v2	Spearman Correlation	0.91	—	Unverified
3	PromptEOL+CSE+LLaMA-30B	Spearman Correlation	0.9	—	Unverified
4	PromptEOL+CSE+OPT-13B	Spearman Correlation	0.9	—	Unverified
5	PromptEOL+CSE+OPT-2.7B	Spearman Correlation	0.9	—	Unverified
6	PromCSE-RoBERTa-large (0.355B)	Spearman Correlation	0.89	—	Unverified
7	Trans-Encoder-BERT-large-bi (unsup.)	Spearman Correlation	0.89	—	Unverified
8	Trans-Encoder-BERT-large-cross (unsup.)	Spearman Correlation	0.88	—	Unverified
9	Trans-Encoder-RoBERTa-large-cross (unsup.)	Spearman Correlation	0.88	—	Unverified
10	SimCSE-RoBERTa-large	Spearman Correlation	0.87	—	Unverified