Semantic Textual Similarity

Semantic textual similarity deals with determining how similar two pieces of texts are. This can take the form of assigning a score from 1 to 5. Related tasks are paraphrase or duplicate identification.

Image source: Learning Semantic Textual Similarity from Conversations

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 601–650 of 2381 papers

Title	Date	Tasks	Status	Hype
SAMScore: A Content Structural Similarity Metric for Image Translation Evaluation	May 24, 2023	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	1
Bridging Continuous and Discrete Spaces: Interpretable Sentence Representation Learning via Compositional Operations	May 24, 2023	DecoderRepresentation Learning	CodeCode Available	0
C-STS: Conditional Semantic Textual Similarity	May 24, 2023	Information RetrievalLanguage Model Evaluation	CodeCode Available	1
FOCUS: Effective Embedding Initialization for Monolingual Specialization of Multilingual Models	May 23, 2023	Language ModelingLanguage Modelling	CodeCode Available	1
Modeling Empathic Similarity in Personal Narratives	May 23, 2023	RetrievalSemantic Similarity	—Unverified	0
Sentence Representations via Gaussian Embedding	May 22, 2023	Contrastive LearningNatural Language Inference	CodeCode Available	0
SneakyPrompt: Jailbreaking Text-to-image Generative Models	May 20, 2023	Reinforcement Learning (RL)Semantic Similarity	CodeCode Available	1
Interpretable Word Sense Representations via Definition Generation: The Case of Semantic Change Analysis	May 19, 2023	Language ModelingLanguage Modelling	CodeCode Available	0
Cue-CoT: Chain-of-thought Prompting for Responding to In-depth Dialogue Questions with LLMs	May 19, 2023	Question AnsweringSemantic Similarity	CodeCode Available	1
Ditto: A Simple and Efficient Approach to Improve Sentence Embeddings	May 18, 2023	Language ModelingLanguage Modelling	—Unverified	0
Balancing Lexical and Semantic Quality in Abstractive Summarization	May 17, 2023	Abstractive Text SummarizationRe-Ranking	CodeCode Available	1
Semantic Similarity Measure of Natural Language Text through Machine Learning and a Keyword-Aware Cross-Encoder-Ranking Summarizer -- A Case Study Using UCGIS GIS&T Body of Knowledge	May 17, 2023	Semantic SimilaritySemantic Textual Similarity	—Unverified	0
Clustering-Aware Negative Sampling for Unsupervised Sentence Representation	May 17, 2023	ClusteringContrastive Learning	CodeCode Available	1
Adapting Sentence Transformers for the Aviation Domain	May 16, 2023	DenoisingNatural Language Inference	—Unverified	0
Similarity-weighted Construction of Contextualized Commonsense Knowledge Graphs for Knowledge-intense Argumentation Tasks	May 15, 2023	Knowledge GraphsSemantic Similarity	CodeCode Available	1
PESTS: Persian_English Cross Lingual Corpus for Semantic Textual Similarity	May 13, 2023	Machine TranslationSemantic Similarity	—Unverified	0
Instance Smoothed Contrastive Learning for Unsupervised Sentence Embedding	May 12, 2023	Contrastive LearningSemantic Similarity	CodeCode Available	0
SMATCH++: Standardized and Extended Evaluation of Semantic Graphs	May 11, 2023	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	1
Benchmarking large language models for biomedical natural language processing applications and recommendations	May 10, 2023	BenchmarkingDocument Classification	CodeCode Available	1
Alleviating Over-smoothing for Unsupervised Sentence Representation	May 9, 2023	Contrastive LearningSemantic Textual Similarity	CodeCode Available	1
REINFOREST: Reinforcing Semantic Code Similarity for Cross-Lingual Code Search Models	May 5, 2023	Code SearchContrastive Learning	CodeCode Available	0
Context-Aware Semantic Similarity Measurement for Unsupervised Word Sense Disambiguation	May 5, 2023	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	1
Unsupervised Dialogue Topic Segmentation with Topic-aware Utterance Representation	May 4, 2023	SegmentationSemantic Similarity	—Unverified	0
Improving Contrastive Learning of Sentence Embeddings from AI Feedback	May 3, 2023	Contrastive LearningData Augmentation	CodeCode Available	1
Neural Keyphrase Generation: Analysis and Evaluation	Apr 27, 2023	DecoderKeyphrase Generation	—Unverified	0
Deep Lifelong Cross-modal Hashing	Apr 26, 2023	Cross-Modal RetrievalLifelong learning	—Unverified	0
Low-resource Bilingual Dialect Lexicon Induction with Large Language Models	Apr 19, 2023	Bilingual Lexicon InductionMachine Translation	CodeCode Available	0
Bridging Natural Language Processing and Psycholinguistics: computationally grounded semantic similarity datasets for Basque and Spanish	Apr 19, 2023	Semantic SimilaritySemantic Textual Similarity	—Unverified	0
D2CSE: Difference-aware Deep continuous prompts for Contrastive Sentence Embeddings	Apr 18, 2023	Contrastive LearningRetrieval	—Unverified	0
Learning Geometry-aware Representations by Sketching	Apr 17, 2023	AttributeSemantic Similarity	—Unverified	0
A Clustering Framework for Unsupervised and Semi-supervised New Intent Discovery	Apr 16, 2023	ClusteringIntent Discovery	—Unverified	0
PCPNet: An Efficient and Semantic-Enhanced Transformer Network for Point Cloud Prediction	Apr 16, 2023	Autonomous VehiclesDecision Making	CodeCode Available	1
Semantic Feature Verification in FLAN-T5	Apr 12, 2023	Language ModelingLanguage Modelling	—Unverified	0
Are Large Language Models Ready for Healthcare? A Comparative Study on Clinical Language Understanding	Apr 9, 2023	Document Classificationnamed-entity-recognition	CodeCode Available	1
Static Fuzzy Bag-of-Words: a lightweight sentence embedding algorithm	Apr 6, 2023	Semantic Textual SimilaritySentence	—Unverified	0
Efficient Audio Captioning Transformer with Patchout and Text Guidance	Apr 6, 2023	Audio captioningCaption Generation	—Unverified	0
SuperDisco: Super-Class Discovery Improves Visual Recognition for the Long-Tail	Mar 31, 2023	Representation LearningSemantic Similarity	—Unverified	0
Using Semantic Similarity and Text Embedding to Measure the Social Media Echo of Strategic Communications	Mar 29, 2023	DiversitySemantic Similarity	—Unverified	0
LEURN: Learning Explainable Univariate Rules with Neural Networks	Mar 27, 2023	Feature ImportanceSemantic Similarity	—Unverified	0
A Novel Patent Similarity Measurement Methodology: Semantic Distance and Technological Distance	Mar 23, 2023	Patent classificationSemantic Similarity	CodeCode Available	0
Micro-video Tagging via Jointly Modeling Social Influence and Tag Relation	Mar 15, 2023	Link PredictionRelation	CodeCode Available	0
ESCL: Equivariant Self-Contrastive Learning for Sentence Representations	Mar 9, 2023	Contrastive LearningMulti-Task Learning	—Unverified	0
INO at Factify 2: Structure Coherence based Multi-Modal Fact Verification	Mar 2, 2023	Claim VerificationFact Verification	CodeCode Available	0
Weighted Sampling for Masked Language Modeling	Feb 28, 2023	Language ModelingLanguage Modelling	—Unverified	0
AdapterSoup: Weight Averaging to Improve Generalization of Pretrained Language Models	Feb 14, 2023	ClusteringLanguage Modeling	—Unverified	0
NapSS: Paragraph-level Medical Text Simplification via Narrative Prompting and Sentence-matching Summarization	Feb 11, 2023	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	0
A Parametric Similarity Method: Comparative Experiments based on Semantically Annotated Large Datasets	Feb 8, 2023	Semantic SimilaritySemantic Textual Similarity	—Unverified	0
Analyzing the impact of climate change on critical infrastructure from the scientific literature: A weakly supervised NLP approach	Feb 3, 2023	ArticlesDecision Making	—Unverified	0
How to choose "Good" Samples for Text Data Augmentation	Feb 2, 2023	Data AugmentationSemantic Similarity	—Unverified	0
TransFool: An Adversarial Attack against Neural Machine Translation Models	Feb 2, 2023	Adversarial AttackLanguage Modelling	CodeCode Available	0

Show:10 25 50

← PrevPage 13 of 48Next →

All datasets STS Benchmark MTEB MRPC SICK STS13 STS14 STS12 STS15 STS16 MRPC Dev SentEval SICK-R

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	SMARTRoBERTa	Dev Pearson Correlation	92.8	—	Unverified
2	DeBERTa (large)	Accuracy	92.5	—	Unverified
3	SMART-BERT	Dev Pearson Correlation	90	—	Unverified
4	MT-DNN-SMART	Pearson Correlation	0.93	—	Unverified
5	StructBERTRoBERTa ensemble	Pearson Correlation	0.93	—	Unverified
6	Mnet-Sim	Pearson Correlation	0.93	—	Unverified
7	XLNet (single model)	Pearson Correlation	0.93	—	Unverified
8	T5-11B	Pearson Correlation	0.93	—	Unverified
9	ALBERT	Pearson Correlation	0.93	—	Unverified
10	RoBERTa	Pearson Correlation	0.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AnglE-UAE	Spearman Correlation	84.54	—	Unverified
2	ST5-XXL	Spearman Correlation	82.63	—	Unverified
3	ST5-Large	Spearman Correlation	81.83	—	Unverified
4	ST5-XL	Spearman Correlation	81.66	—	Unverified
5	ST5-Base	Spearman Correlation	81.14	—	Unverified
6	MPNet-multilingual	Spearman Correlation	80.73	—	Unverified
7	SGPT-5.8B-nli	Spearman Correlation	80.53	—	Unverified
8	MPNet	Spearman Correlation	80.28	—	Unverified
9	MiniLM-L12	Spearman Correlation	79.8	—	Unverified
10	SimCSE-BERT-sup	Spearman Correlation	79.12	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MT-DNN-SMART	Accuracy	93.7	—	Unverified
2	ALBERT	Accuracy	93.4	—	Unverified
3	RoBERTa (ensemble)	Accuracy	92.3	—	Unverified
4	BigBird	F1	91.5	—	Unverified
5	StructBERTRoBERTa ensemble	Accuracy	91.5	—	Unverified
6	FLOATER-large	Accuracy	91.4	—	Unverified
7	SMART	Accuracy	91.3	—	Unverified
8	RoBERTa-large 355M (MLP quantized vector-wise, fine-tuned)	Accuracy	91	—	Unverified
9	RoBERTa-large 355M + Entailment as Few-shot Learner	F1	91	—	Unverified
10	SpanBERT	Accuracy	90.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromCSE-RoBERTa-large (0.355B)	Spearman Correlation	0.82	—	Unverified
2	PromptEOL+CSE+LLaMA-30B	Spearman Correlation	0.82	—	Unverified
3	PromptEOL+CSE+OPT-13B	Spearman Correlation	0.82	—	Unverified
4	SimCSE-RoBERTalarge	Spearman Correlation	0.82	—	Unverified
5	PromptEOL+CSE+OPT-2.7B	Spearman Correlation	0.81	—	Unverified
6	SentenceBERT	Spearman Correlation	0.75	—	Unverified
7	SRoBERTa-NLI-base	Spearman Correlation	0.74	—	Unverified
8	SRoBERTa-NLI-large	Spearman Correlation	0.74	—	Unverified
9	Dino (STS/̄🦕)	Spearman Correlation	0.74	—	Unverified
10	SBERT-NLI-large	Spearman Correlation	0.74	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AnglE-LLaMA-7B	Spearman Correlation	0.91	—	Unverified
2	AnglE-LLaMA-7B-v2	Spearman Correlation	0.91	—	Unverified
3	PromptEOL+CSE+LLaMA-30B	Spearman Correlation	0.9	—	Unverified
4	PromptEOL+CSE+OPT-13B	Spearman Correlation	0.9	—	Unverified
5	PromptEOL+CSE+OPT-2.7B	Spearman Correlation	0.9	—	Unverified
6	PromCSE-RoBERTa-large (0.355B)	Spearman Correlation	0.89	—	Unverified
7	Trans-Encoder-BERT-large-bi (unsup.)	Spearman Correlation	0.89	—	Unverified
8	Trans-Encoder-BERT-large-cross (unsup.)	Spearman Correlation	0.88	—	Unverified
9	Trans-Encoder-RoBERTa-large-cross (unsup.)	Spearman Correlation	0.88	—	Unverified
10	SimCSE-RoBERTa-large	Spearman Correlation	0.87	—	Unverified