Semantic Textual Similarity

Semantic textual similarity deals with determining how similar two pieces of texts are. This can take the form of assigning a score from 1 to 5. Related tasks are paraphrase or duplicate identification.

Image source: Learning Semantic Textual Similarity from Conversations

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 401–425 of 2381 papers

Title	Date	Tasks	Status	Hype
Improving Sentence Embeddings with Automatic Generation of Training Data Using Few-shot Examples	Feb 23, 2024	Dataset GenerationDecoder	CodeCode Available	0
Fine-tuning CLIP Text Encoders with Two-step Paraphrasing	Feb 23, 2024	Image CaptioningImage Retrieval	—Unverified	0
Efficient data selection employing Semantic Similarity-based Graph Structures for model training	Feb 22, 2024	Semantic SimilaritySemantic Textual Similarity	—Unverified	0
The Impact of Word Splitting on the Semantic Content of Contextualized Word Representations	Feb 22, 2024	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	0
2D Matryoshka Sentence Embeddings	Feb 22, 2024	RAGRepresentation Learning	CodeCode Available	4
Semantic Mirror Jailbreak: Genetic Algorithm Based Jailbreak Prompts Against Open-source LLMs	Feb 21, 2024	Code GenerationSemantic Similarity	—Unverified	0
On Defining Smart Cities using Transformer Neural Networks	Feb 20, 2024	Semantic SimilaritySemantic Textual Similarity	—Unverified	0
DrBenchmark: A Large Language Understanding Evaluation Benchmark for French Biomedical Domain	Feb 20, 2024	named-entity-recognitionNamed Entity Recognition	CodeCode Available	1
Are ELECTRA's Sentence Embeddings Beyond Repair? The Case of Semantic Textual Similarity	Feb 20, 2024	Semantic Textual SimilaritySentence	CodeCode Available	0
UMBCLU at SemEval-2024 Task 1A and 1C: Semantic Textual Relatedness with and without machine translation	Feb 20, 2024	Machine TranslationNatural Language Understanding	CodeCode Available	0
Semantic Textual Similarity Assessment in Chest X-ray Reports Using a Domain-Specific Cosine-Based Metric	Feb 19, 2024	DiagnosticMachine Translation	CodeCode Available	0
Reasoning before Comparison: LLM-Enhanced Semantic Similarity Metrics for Domain Specialized Text Analysis	Feb 17, 2024	Semantic SimilaritySemantic Textual Similarity	—Unverified	0
SemRel2024: A Collection of Semantic Textual Relatedness Datasets for 13 Languages	Feb 13, 2024	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	1
Pixel Sentence Representation Learning	Feb 13, 2024	Natural Language InferenceRepresentation Learning	CodeCode Available	1
The Sound of Healthcare: Improving Medical Transcription ASR Accuracy with Large Language Models	Feb 12, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
OrderBkd: Textual backdoor attack through repositioning	Feb 12, 2024	Backdoor AttackPOS	CodeCode Available	0
Large Language Model Augmented Exercise Retrieval for Personalized Language Learning	Feb 8, 2024	Information RetrievalLanguage Modeling	—Unverified	0
Reconstruct Your Previous Conversations! Comprehensively Investigating Privacy Leakage Risks in Conversations with GPT Models	Feb 5, 2024	Reconstruction AttackSemantic Similarity	CodeCode Available	1
Multi-Lingual Malaysian Embedding: Leveraging Large Language Models for Semantic Representations	Feb 5, 2024	RAGRetrieval	—Unverified	0
HQA-Attack: Toward High Quality Black-Box Hard-Label Adversarial Attack on Text	Feb 2, 2024	Adversarial AttackHard-label Attack	CodeCode Available	0
In-Context Learning for Few-Shot Nested Named Entity Recognition	Feb 2, 2024	Contrastive LearningIn-Context Learning	—Unverified	0
Benchmarking Transferable Adversarial Attacks	Feb 1, 2024	Adversarial AttackBenchmarking	CodeCode Available	1
Enhancing End-to-End Multi-Task Dialogue Systems: A Study on Intrinsic Motivation Reinforcement Learning Algorithms for Improved Training and Adaptability	Jan 31, 2024	reinforcement-learningReinforcement Learning	—Unverified	0
SemScore: Automated Evaluation of Instruction-Tuned LLMs based on Semantic Textual Similarity	Jan 30, 2024	Semantic Textual SimilaritySTS	—Unverified	0
Autoencoder-Based Domain Learning for Semantic Communication with Conceptual Spaces	Jan 29, 2024	Semantic CommunicationSemantic Similarity	—Unverified	0

Show:10 25 50

← PrevPage 17 of 96Next →

All datasets STS Benchmark MTEB MRPC SICK STS13 STS14 STS12 STS15 STS16 MRPC Dev SentEval SICK-R

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	SMARTRoBERTa	Dev Pearson Correlation	92.8	—	Unverified
2	DeBERTa (large)	Accuracy	92.5	—	Unverified
3	SMART-BERT	Dev Pearson Correlation	90	—	Unverified
4	MT-DNN-SMART	Pearson Correlation	0.93	—	Unverified
5	StructBERTRoBERTa ensemble	Pearson Correlation	0.93	—	Unverified
6	Mnet-Sim	Pearson Correlation	0.93	—	Unverified
7	XLNet (single model)	Pearson Correlation	0.93	—	Unverified
8	ALBERT	Pearson Correlation	0.93	—	Unverified
9	T5-11B	Pearson Correlation	0.93	—	Unverified
10	RoBERTa	Pearson Correlation	0.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AnglE-UAE	Spearman Correlation	84.54	—	Unverified
2	ST5-XXL	Spearman Correlation	82.63	—	Unverified
3	ST5-Large	Spearman Correlation	81.83	—	Unverified
4	ST5-XL	Spearman Correlation	81.66	—	Unverified
5	ST5-Base	Spearman Correlation	81.14	—	Unverified
6	MPNet-multilingual	Spearman Correlation	80.73	—	Unverified
7	SGPT-5.8B-nli	Spearman Correlation	80.53	—	Unverified
8	MPNet	Spearman Correlation	80.28	—	Unverified
9	MiniLM-L12	Spearman Correlation	79.8	—	Unverified
10	SimCSE-BERT-sup	Spearman Correlation	79.12	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MT-DNN-SMART	Accuracy	93.7	—	Unverified
2	ALBERT	Accuracy	93.4	—	Unverified
3	RoBERTa (ensemble)	Accuracy	92.3	—	Unverified
4	BigBird	F1	91.5	—	Unverified
5	StructBERTRoBERTa ensemble	Accuracy	91.5	—	Unverified
6	FLOATER-large	Accuracy	91.4	—	Unverified
7	SMART	Accuracy	91.3	—	Unverified
8	RoBERTa-large 355M (MLP quantized vector-wise, fine-tuned)	Accuracy	91	—	Unverified
9	RoBERTa-large 355M + Entailment as Few-shot Learner	F1	91	—	Unverified
10	SpanBERT	Accuracy	90.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromCSE-RoBERTa-large (0.355B)	Spearman Correlation	0.82	—	Unverified
2	PromptEOL+CSE+LLaMA-30B	Spearman Correlation	0.82	—	Unverified
3	PromptEOL+CSE+OPT-13B	Spearman Correlation	0.82	—	Unverified
4	SimCSE-RoBERTalarge	Spearman Correlation	0.82	—	Unverified
5	PromptEOL+CSE+OPT-2.7B	Spearman Correlation	0.81	—	Unverified
6	SentenceBERT	Spearman Correlation	0.75	—	Unverified
7	SRoBERTa-NLI-base	Spearman Correlation	0.74	—	Unverified
8	SRoBERTa-NLI-large	Spearman Correlation	0.74	—	Unverified
9	Dino (STS/̄🦕)	Spearman Correlation	0.74	—	Unverified
10	SBERT-NLI-large	Spearman Correlation	0.74	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AnglE-LLaMA-7B	Spearman Correlation	0.91	—	Unverified
2	AnglE-LLaMA-7B-v2	Spearman Correlation	0.91	—	Unverified
3	PromptEOL+CSE+LLaMA-30B	Spearman Correlation	0.9	—	Unverified
4	PromptEOL+CSE+OPT-13B	Spearman Correlation	0.9	—	Unverified
5	PromptEOL+CSE+OPT-2.7B	Spearman Correlation	0.9	—	Unverified
6	PromCSE-RoBERTa-large (0.355B)	Spearman Correlation	0.89	—	Unverified
7	Trans-Encoder-BERT-large-bi (unsup.)	Spearman Correlation	0.89	—	Unverified
8	Trans-Encoder-BERT-large-cross (unsup.)	Spearman Correlation	0.88	—	Unverified
9	Trans-Encoder-RoBERTa-large-cross (unsup.)	Spearman Correlation	0.88	—	Unverified
10	SimCSE-RoBERTa-large	Spearman Correlation	0.87	—	Unverified