Semantic Textual Similarity

Semantic textual similarity deals with determining how similar two pieces of texts are. This can take the form of assigning a score from 1 to 5. Related tasks are paraphrase or duplicate identification.

Image source: Learning Semantic Textual Similarity from Conversations

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 401–450 of 2381 papers

Title	Date	Tasks	Status	Hype
Fine-tuning CLIP Text Encoders with Two-step Paraphrasing	Feb 23, 2024	Image CaptioningImage Retrieval	—Unverified	0
Improving Sentence Embeddings with Automatic Generation of Training Data Using Few-shot Examples	Feb 23, 2024	Dataset GenerationDecoder	CodeCode Available	0
Efficient data selection employing Semantic Similarity-based Graph Structures for model training	Feb 22, 2024	Semantic SimilaritySemantic Textual Similarity	—Unverified	0
The Impact of Word Splitting on the Semantic Content of Contextualized Word Representations	Feb 22, 2024	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	0
2D Matryoshka Sentence Embeddings	Feb 22, 2024	RAGRepresentation Learning	CodeCode Available	4
Semantic Mirror Jailbreak: Genetic Algorithm Based Jailbreak Prompts Against Open-source LLMs	Feb 21, 2024	Code GenerationSemantic Similarity	—Unverified	0
On Defining Smart Cities using Transformer Neural Networks	Feb 20, 2024	Semantic SimilaritySemantic Textual Similarity	—Unverified	0
DrBenchmark: A Large Language Understanding Evaluation Benchmark for French Biomedical Domain	Feb 20, 2024	named-entity-recognitionNamed Entity Recognition	CodeCode Available	1
Are ELECTRA's Sentence Embeddings Beyond Repair? The Case of Semantic Textual Similarity	Feb 20, 2024	Semantic Textual SimilaritySentence	CodeCode Available	0
UMBCLU at SemEval-2024 Task 1A and 1C: Semantic Textual Relatedness with and without machine translation	Feb 20, 2024	Machine TranslationNatural Language Understanding	CodeCode Available	0
Semantic Textual Similarity Assessment in Chest X-ray Reports Using a Domain-Specific Cosine-Based Metric	Feb 19, 2024	DiagnosticMachine Translation	CodeCode Available	0
Reasoning before Comparison: LLM-Enhanced Semantic Similarity Metrics for Domain Specialized Text Analysis	Feb 17, 2024	Semantic SimilaritySemantic Textual Similarity	—Unverified	0
SemRel2024: A Collection of Semantic Textual Relatedness Datasets for 13 Languages	Feb 13, 2024	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	1
Pixel Sentence Representation Learning	Feb 13, 2024	Natural Language InferenceRepresentation Learning	CodeCode Available	1
The Sound of Healthcare: Improving Medical Transcription ASR Accuracy with Large Language Models	Feb 12, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
OrderBkd: Textual backdoor attack through repositioning	Feb 12, 2024	Backdoor AttackPOS	CodeCode Available	0
Large Language Model Augmented Exercise Retrieval for Personalized Language Learning	Feb 8, 2024	Information RetrievalLanguage Modeling	—Unverified	0
Multi-Lingual Malaysian Embedding: Leveraging Large Language Models for Semantic Representations	Feb 5, 2024	RAGRetrieval	—Unverified	0
Reconstruct Your Previous Conversations! Comprehensively Investigating Privacy Leakage Risks in Conversations with GPT Models	Feb 5, 2024	Reconstruction AttackSemantic Similarity	CodeCode Available	1
HQA-Attack: Toward High Quality Black-Box Hard-Label Adversarial Attack on Text	Feb 2, 2024	Adversarial AttackHard-label Attack	CodeCode Available	0
In-Context Learning for Few-Shot Nested Named Entity Recognition	Feb 2, 2024	Contrastive LearningIn-Context Learning	—Unverified	0
Benchmarking Transferable Adversarial Attacks	Feb 1, 2024	Adversarial AttackBenchmarking	CodeCode Available	1
Enhancing End-to-End Multi-Task Dialogue Systems: A Study on Intrinsic Motivation Reinforcement Learning Algorithms for Improved Training and Adaptability	Jan 31, 2024	reinforcement-learningReinforcement Learning	—Unverified	0
SemScore: Automated Evaluation of Instruction-Tuned LLMs based on Semantic Textual Similarity	Jan 30, 2024	Semantic Textual SimilaritySTS	—Unverified	0
Autoencoder-Based Domain Learning for Semantic Communication with Conceptual Spaces	Jan 29, 2024	Semantic CommunicationSemantic Similarity	—Unverified	0
DenoSent: A Denoising Objective for Self-Supervised Sentence Representation Learning	Jan 24, 2024	Contrastive LearningDenoising	CodeCode Available	1
It's About Time: Incorporating Temporality in Retrieval Augmented Language Models	Jan 24, 2024	Few-Shot LearningHallucination	—Unverified	0
Contrastive Learning in Distilled Models	Jan 23, 2024	Contrastive LearningKnowledge Distillation	CodeCode Available	0
Investigating Large Language Models for Financial Causality Detection in Multilingual Setup	Jan 22, 2024	Semantic SimilaritySemantic Textual Similarity	—Unverified	0
Connecting the Dots: Leveraging Spatio-Temporal Graph Neural Networks for Accurate Bangla Sign Language Recognition	Jan 22, 2024	Graph Neural NetworkSemantic Similarity	—Unverified	0
Using LLMs to discover emerging coded antisemitic hate-speech in extremist social media	Jan 19, 2024	Language ModelingLanguage Modelling	—Unverified	0
PhotoBot: Reference-Guided Interactive Photography via Natural Language	Jan 19, 2024	Language ModelingLanguage Modelling	—Unverified	0
Noise Contrastive Estimation-based Matching Framework for Low-Resource Security Attack Pattern Recognition	Jan 18, 2024	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	1
A character-based steganography using masked language modeling	Jan 15, 2024	Language ModelingLanguage Modelling	CodeCode Available	0
Image Similarity using An Ensemble of Context-Sensitive Models	Jan 15, 2024	Dimensionality ReductionSemantic Similarity	CodeCode Available	0
MaskClustering: View Consensus based Mask Graph Clustering for Open-Vocabulary 3D Instance Segmentation	Jan 15, 2024	3D Instance Segmentation3D Open-Vocabulary Instance Segmentation	—Unverified	0
HiHPQ: Hierarchical Hyperbolic Product Quantization for Unsupervised Image Retrieval	Jan 14, 2024	Contrastive LearningImage Retrieval	CodeCode Available	1
Do Vision and Language Encoders Represent the World Similarly?	Jan 10, 2024	Graph Matchingimage-classification	CodeCode Available	1
Estimating Text Similarity based on Semantic Concept Embeddings	Jan 9, 2024	MarketingSemantic Similarity	—Unverified	0
Recognizing Similar Crises through the Application of Ontology-based Knowledge Mining	Jan 8, 2024	ManagementSemantic Similarity	—Unverified	0
Semantic Similarity Matching for Patent Documents Using Ensemble BERT-related Model and Novel Text Processing Method	Jan 6, 2024	Patent classificationSemantic Similarity	—Unverified	0
Unsupervised hard Negative Augmentation for contrastive learning	Jan 5, 2024	Contrastive LearningData Augmentation	CodeCode Available	0
PeFoMed: Parameter Efficient Fine-tuning of Multimodal Large Language Models for Medical Imaging	Jan 5, 2024	Medical Report GenerationMedical Visual Question Answering	CodeCode Available	2
Saliency-Aware Regularized Graph Neural Network	Jan 1, 2024	ClassificationGraph Classification	—Unverified	0
Are we describing the same sound? An analysis of word embedding spaces of expressive piano performance	Dec 31, 2023	Information RetrievalRetrieval	CodeCode Available	0
AHAM: Adapt, Help, Ask, Model -- Harvesting LLMs for literature mining	Dec 25, 2023	Domain AdaptationLanguage Modelling	—Unverified	0
MMGPL: Multimodal Medical Data Analysis with Graph Prompt Learning	Dec 22, 2023	Prompt LearningSemantic Similarity	—Unverified	0
LlaMaVAE: Guiding Large Language Model Generation via Continuous Latent Sentence Spaces	Dec 20, 2023	DecoderDefinition Modelling	—Unverified	0
Automated Assessment of Students' Code Comprehension using LLMs	Dec 19, 2023	Semantic Textual SimilaritySTS	—Unverified	0
An Empirical study of Unsupervised Neural Machine Translation: analyzing NMT output, model's behavior and sentences' contribution	Dec 19, 2023	Low Resource Neural Machine TranslationLow-Resource Neural Machine Translation	—Unverified	0

Show:10 25 50

← PrevPage 9 of 48Next →

All datasets STS Benchmark MTEB MRPC SICK STS13 STS14 STS12 STS15 STS16 MRPC Dev SentEval SICK-R

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	SMARTRoBERTa	Dev Pearson Correlation	92.8	—	Unverified
2	DeBERTa (large)	Accuracy	92.5	—	Unverified
3	SMART-BERT	Dev Pearson Correlation	90	—	Unverified
4	MT-DNN-SMART	Pearson Correlation	0.93	—	Unverified
5	StructBERTRoBERTa ensemble	Pearson Correlation	0.93	—	Unverified
6	Mnet-Sim	Pearson Correlation	0.93	—	Unverified
7	XLNet (single model)	Pearson Correlation	0.93	—	Unverified
8	ALBERT	Pearson Correlation	0.93	—	Unverified
9	T5-11B	Pearson Correlation	0.93	—	Unverified
10	RoBERTa	Pearson Correlation	0.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AnglE-UAE	Spearman Correlation	84.54	—	Unverified
2	ST5-XXL	Spearman Correlation	82.63	—	Unverified
3	ST5-Large	Spearman Correlation	81.83	—	Unverified
4	ST5-XL	Spearman Correlation	81.66	—	Unverified
5	ST5-Base	Spearman Correlation	81.14	—	Unverified
6	MPNet-multilingual	Spearman Correlation	80.73	—	Unverified
7	SGPT-5.8B-nli	Spearman Correlation	80.53	—	Unverified
8	MPNet	Spearman Correlation	80.28	—	Unverified
9	MiniLM-L12	Spearman Correlation	79.8	—	Unverified
10	SimCSE-BERT-sup	Spearman Correlation	79.12	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MT-DNN-SMART	Accuracy	93.7	—	Unverified
2	ALBERT	Accuracy	93.4	—	Unverified
3	RoBERTa (ensemble)	Accuracy	92.3	—	Unverified
4	BigBird	F1	91.5	—	Unverified
5	StructBERTRoBERTa ensemble	Accuracy	91.5	—	Unverified
6	FLOATER-large	Accuracy	91.4	—	Unverified
7	SMART	Accuracy	91.3	—	Unverified
8	RoBERTa-large 355M (MLP quantized vector-wise, fine-tuned)	Accuracy	91	—	Unverified
9	RoBERTa-large 355M + Entailment as Few-shot Learner	F1	91	—	Unverified
10	SpanBERT	Accuracy	90.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromCSE-RoBERTa-large (0.355B)	Spearman Correlation	0.82	—	Unverified
2	PromptEOL+CSE+LLaMA-30B	Spearman Correlation	0.82	—	Unverified
3	PromptEOL+CSE+OPT-13B	Spearman Correlation	0.82	—	Unverified
4	SimCSE-RoBERTalarge	Spearman Correlation	0.82	—	Unverified
5	PromptEOL+CSE+OPT-2.7B	Spearman Correlation	0.81	—	Unverified
6	SentenceBERT	Spearman Correlation	0.75	—	Unverified
7	SRoBERTa-NLI-base	Spearman Correlation	0.74	—	Unverified
8	SRoBERTa-NLI-large	Spearman Correlation	0.74	—	Unverified
9	Dino (STS/̄🦕)	Spearman Correlation	0.74	—	Unverified
10	SBERT-NLI-large	Spearman Correlation	0.74	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AnglE-LLaMA-7B	Spearman Correlation	0.91	—	Unverified
2	AnglE-LLaMA-7B-v2	Spearman Correlation	0.91	—	Unverified
3	PromptEOL+CSE+LLaMA-30B	Spearman Correlation	0.9	—	Unverified
4	PromptEOL+CSE+OPT-13B	Spearman Correlation	0.9	—	Unverified
5	PromptEOL+CSE+OPT-2.7B	Spearman Correlation	0.9	—	Unverified
6	PromCSE-RoBERTa-large (0.355B)	Spearman Correlation	0.89	—	Unverified
7	Trans-Encoder-BERT-large-bi (unsup.)	Spearman Correlation	0.89	—	Unverified
8	Trans-Encoder-BERT-large-cross (unsup.)	Spearman Correlation	0.88	—	Unverified
9	Trans-Encoder-RoBERTa-large-cross (unsup.)	Spearman Correlation	0.88	—	Unverified
10	SimCSE-RoBERTa-large	Spearman Correlation	0.87	—	Unverified