Semantic Textual Similarity

Semantic textual similarity deals with determining how similar two pieces of texts are. This can take the form of assigning a score from 1 to 5. Related tasks are paraphrase or duplicate identification.

Image source: Learning Semantic Textual Similarity from Conversations

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1851–1900 of 2381 papers

Title	Date	Tasks	Status
Problems With Evaluation of Word Embeddings Using Word Similarity Tasks	May 8, 2016	Semantic SimilaritySemantic Textual Similarity	—Unverified
Proceedings of the LexSem+Logics Workshop 2016	Aug 14, 2016	Entity DisambiguationOpen Information Extraction	—Unverified
Processing and Normalizing Hashtags	Sep 1, 2015	LemmatizationRumour Detection	—Unverified
ProcSim: Proxy-based Confidence for Robust Similarity Learning	Nov 1, 2023	Metric LearningSemantic Similarity	—Unverified
Product Feature Mining: Semantic Clues versus Syntactic Constituents	Jun 1, 2014	Opinion MiningSemantic Textual Similarity	—Unverified
Promoting Semantics in Multi-objective Genetic Programming based on Decomposition	Dec 8, 2020	DiversityEvolutionary Algorithms	—Unverified
PromptBERT: Improving BERT Sentence Embeddings with Prompts	Nov 16, 2021	DenoisingSemantic Similarity	—Unverified
PromptExp: Multi-granularity Prompt Explanation of Large Language Models	Oct 16, 2024	Natural Language UnderstandingPrompt Engineering	—Unverified
Prompting Large Language Model for Machine Translation: A Case Study	Jan 17, 2023	Language ModelingLanguage Modelling	—Unverified
Prompt Obfuscation for Large Language Models	Sep 17, 2024	Large Language ModelSemantic Similarity	—Unverified
Prompt-tuning for Clickbait Detection via Text Summarization	Apr 17, 2024	Clickbait DetectionSemantic Similarity	—Unverified
PropNet: a White-Box and Human-Like Network for Sentence Representation	Feb 15, 2025	Semantic Textual SimilaritySentence	—Unverified
ProtCLIP: Function-Informed Protein Multi-Modal Learning	Dec 28, 2024	Protein Function PredictionSemantic Similarity	—Unverified
ProtoGMM: Multi-prototype Gaussian-Mixture-based Domain Adaptation Model for Semantic Segmentation	Jun 27, 2024	Contrastive LearningDomain Adaptation	—Unverified
ProtoGuard-guided PROPEL: Class-Aware Prototype Enhancement and Progressive Labeling for Incremental 3D Point Cloud Segmentation	Apr 2, 2025	class-incremental learningClass Incremental Learning	—Unverified
PurdueNLP at SemEval-2017 Task 1: Predicting Semantic Textual Similarity with Paraphrase and Event Embeddings	Aug 1, 2017	Question Answeringregression	—Unverified
Push for Quantization: Deep Fisher Hashing	Aug 31, 2019	QuantizationSemantic Similarity	—Unverified
QA4PRF: A Question Answering based Framework for Pseudo Relevance Feedback	Nov 16, 2021	Question AnsweringSemantic Similarity	—Unverified
Q-BERT: Hessian Based Ultra Low Precision Quantization of BERT	Sep 12, 2019	Linguistic AcceptabilityNatural Language Inference	—Unverified
QLUT at SemEval-2017 Task 1: Semantic Textual Similarity Based on Word Embeddings	Aug 1, 2017	LemmatizationSemantic Textual Similarity	—Unverified
QSTS: A Question-Sensitive Text Similarity Measure for Question Generation	Oct 1, 2022	Question GenerationQuestion-Generation	—Unverified
Quality Estimation for Machine Translation Using the Joint Method of Evaluation Criteria and Statistical Modeling	Aug 1, 2013	Machine TranslationNatural Language Inference	—Unverified
Quantifying perturbation impacts for large language models	Dec 1, 2024	Semantic SimilaritySemantic Textual Similarity	—Unverified
QU-BIGIR at SemEval 2017 Task 3: Using Similarity Features for Arabic Community Question Answering Forums	Aug 1, 2017	Community Question AnsweringQuestion Answering	—Unverified
QurSim: A corpus for evaluation of relatedness in short texts	May 1, 2012	Information RetrievalMachine Translation	—Unverified
Qwant Research @DEFT 2019: Document matching and information retrieval using clinical cases	Jul 6, 2019	Information RetrievalRetrieval	—Unverified
RAGulator: Lightweight Out-of-Context Detectors for Grounded Text Generation	Nov 6, 2024	Feature EngineeringRAG	—Unverified
Raising the Bar on the Evaluation of Out-of-Distribution Detection	Sep 24, 2022	image-classificationImage Classification	—Unverified
RAMP: Retrieval and Attribute-Marking Enhanced Prompting for Attribute-Controlled Translation	May 26, 2023	AttributeMachine Translation	—Unverified
Random Positive-Only Projections: PPMI-Enabled Incremental Semantic Space Construction	Aug 1, 2016	Dimensionality ReductionSemantic Textual Similarity	—Unverified
Random Walks and Neural Network Language Models on Knowledge Bases	May 1, 2015	Semantic SimilaritySemantic Textual Similarity	—Unverified
Rank-Consistency Deep Hashing for Scalable Multi-Label Image Search	Feb 2, 2021	ClusteringDeep Hashing	—Unverified
R&B: Domain Regrouping and Data Mixture Balancing for Efficient Foundation Model Training	May 1, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified
Reasoning before Comparison: LLM-Enhanced Semantic Similarity Metrics for Domain Specialized Text Analysis	Feb 17, 2024	Semantic SimilaritySemantic Textual Similarity	—Unverified
ReCellTy: Domain-specific knowledge graph retrieval-augmented LLMs workflow for single-cell annotation	Apr 24, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified
Recognizing Arguing Subjectivity and Argument Tags	Jul 1, 2012	Semantic Textual SimilaritySentiment Analysis	—Unverified
Recognizing Humour using Word Associations and Humour Anchor Extraction	Aug 1, 2018	Semantic Textual SimilarityWord Embeddings	—Unverified
Recognizing Similar Crises through the Application of Ontology-based Knowledge Mining	Jan 8, 2024	ManagementSemantic Similarity	—Unverified
Recommending Actionable Strategies: A Semantic Approach to Integrating Analytical Frameworks with Decision Heuristics	Jan 24, 2025	Recommendation SystemsSemantic Similarity	—Unverified
Reconstructing Big Semantic Similarity Networks	Oct 1, 2013	Dimensionality ReductionMetric Learning	—Unverified
Recurrent Continuous Translation Models	Oct 1, 2013	Language ModellingMachine Translation	—Unverified
Reddit Temporal N-gram Corpus and its Applications on Paraphrase and Semantic Similarity in Social Media using a Topic-based Latent Semantic Analysis	Dec 1, 2016	AttributeInformation Retrieval	—Unverified
Reducing Sentiment Bias in Language Models via Counterfactual Evaluation	Nov 8, 2019	Articlescounterfactual	—Unverified
Referential Translation Machines for Predicting Translation Quality and Related Statistics	Sep 1, 2015	Machine TranslationSemantic Textual Similarity	—Unverified
Referential Translation Machines for Predicting Translation Quality	Jun 1, 2014	Machine TranslationSemantic Textual Similarity	—Unverified
Referential Translation Machines for Quality Estimation	Aug 1, 2013	Machine TranslationSemantic Textual Similarity	—Unverified
Refiner: Data Refining against Gradient Leakage Attacks in Federated Learning	Dec 5, 2022	Federated LearningSemantic Similarity	—Unverified
Regression-free Blind Image Quality Assessment with Content-Distortion Consistency	Jul 18, 2023	Image Quality AssessmentNo-Reference Image Quality Assessment	—Unverified
Reinforce Attack: Adversarial Attack against BERT with Reinforcement Learning	Aug 17, 2021	Adversarial AttackAdversarial Text	—Unverified
ReinforceBug: A Framework to Generate Adversarial Textual Examples	Mar 11, 2021	Semantic SimilaritySemantic Textual Similarity	—Unverified

Show:10 25 50

← PrevPage 38 of 48Next →

All datasets STS Benchmark MTEB MRPC SICK STS13 STS14 STS12 STS15 STS16 MRPC Dev SentEval SICK-R

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	SMARTRoBERTa	Dev Pearson Correlation	92.8	—	Unverified
2	DeBERTa (large)	Accuracy	92.5	—	Unverified
3	SMART-BERT	Dev Pearson Correlation	90	—	Unverified
4	MT-DNN-SMART	Pearson Correlation	0.93	—	Unverified
5	StructBERTRoBERTa ensemble	Pearson Correlation	0.93	—	Unverified
6	Mnet-Sim	Pearson Correlation	0.93	—	Unverified
7	XLNet (single model)	Pearson Correlation	0.93	—	Unverified
8	ALBERT	Pearson Correlation	0.93	—	Unverified
9	T5-11B	Pearson Correlation	0.93	—	Unverified
10	RoBERTa	Pearson Correlation	0.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AnglE-UAE	Spearman Correlation	84.54	—	Unverified
2	ST5-XXL	Spearman Correlation	82.63	—	Unverified
3	ST5-Large	Spearman Correlation	81.83	—	Unverified
4	ST5-XL	Spearman Correlation	81.66	—	Unverified
5	ST5-Base	Spearman Correlation	81.14	—	Unverified
6	MPNet-multilingual	Spearman Correlation	80.73	—	Unverified
7	SGPT-5.8B-nli	Spearman Correlation	80.53	—	Unverified
8	MPNet	Spearman Correlation	80.28	—	Unverified
9	MiniLM-L12	Spearman Correlation	79.8	—	Unverified
10	SimCSE-BERT-sup	Spearman Correlation	79.12	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MT-DNN-SMART	Accuracy	93.7	—	Unverified
2	ALBERT	Accuracy	93.4	—	Unverified
3	RoBERTa (ensemble)	Accuracy	92.3	—	Unverified
4	BigBird	F1	91.5	—	Unverified
5	StructBERTRoBERTa ensemble	Accuracy	91.5	—	Unverified
6	FLOATER-large	Accuracy	91.4	—	Unverified
7	SMART	Accuracy	91.3	—	Unverified
8	RoBERTa-large 355M (MLP quantized vector-wise, fine-tuned)	Accuracy	91	—	Unverified
9	RoBERTa-large 355M + Entailment as Few-shot Learner	F1	91	—	Unverified
10	SpanBERT	Accuracy	90.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromCSE-RoBERTa-large (0.355B)	Spearman Correlation	0.82	—	Unverified
2	PromptEOL+CSE+LLaMA-30B	Spearman Correlation	0.82	—	Unverified
3	PromptEOL+CSE+OPT-13B	Spearman Correlation	0.82	—	Unverified
4	SimCSE-RoBERTalarge	Spearman Correlation	0.82	—	Unverified
5	PromptEOL+CSE+OPT-2.7B	Spearman Correlation	0.81	—	Unverified
6	SentenceBERT	Spearman Correlation	0.75	—	Unverified
7	SRoBERTa-NLI-base	Spearman Correlation	0.74	—	Unverified
8	SRoBERTa-NLI-large	Spearman Correlation	0.74	—	Unverified
9	Dino (STS/̄🦕)	Spearman Correlation	0.74	—	Unverified
10	SBERT-NLI-large	Spearman Correlation	0.74	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AnglE-LLaMA-7B	Spearman Correlation	0.91	—	Unverified
2	AnglE-LLaMA-7B-v2	Spearman Correlation	0.91	—	Unverified
3	PromptEOL+CSE+LLaMA-30B	Spearman Correlation	0.9	—	Unverified
4	PromptEOL+CSE+OPT-13B	Spearman Correlation	0.9	—	Unverified
5	PromptEOL+CSE+OPT-2.7B	Spearman Correlation	0.9	—	Unverified
6	PromCSE-RoBERTa-large (0.355B)	Spearman Correlation	0.89	—	Unverified
7	Trans-Encoder-BERT-large-bi (unsup.)	Spearman Correlation	0.89	—	Unverified
8	Trans-Encoder-BERT-large-cross (unsup.)	Spearman Correlation	0.88	—	Unverified
9	Trans-Encoder-RoBERTa-large-cross (unsup.)	Spearman Correlation	0.88	—	Unverified
10	SimCSE-RoBERTa-large	Spearman Correlation	0.87	—	Unverified