Semantic Textual Similarity

Semantic textual similarity deals with determining how similar two pieces of texts are. This can take the form of assigning a score from 1 to 5. Related tasks are paraphrase or duplicate identification.

Image source: Learning Semantic Textual Similarity from Conversations

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 551–600 of 2381 papers

Title	Date	Tasks	Status	Hype
Comparing scalable strategies for generating numerical perspectives	Aug 3, 2023	Semantic SimilaritySemantic Textual Similarity	—Unverified	0
Fountain -- an intelligent contextual assistant combining knowledge representation and language models for manufacturing risk identification	Aug 1, 2023	CPUSemantic Similarity	—Unverified	0
VacancySBERT: the approach for representation of titles and skills for semantic similarity search in the recruitment domain	Jul 31, 2023	Language ModellingSemantic Similarity	CodeCode Available	0
Scaling Sentence Embeddings with Large Language Models	Jul 31, 2023	Contrastive LearningIn-Context Learning	CodeCode Available	1
User-Controlled Knowledge Fusion in Large Language Models: Balancing Creativity and Hallucination	Jul 30, 2023	HallucinationSemantic Similarity	—Unverified	0
Building RadiologyNET: Unsupervised annotation of a large-scale multimodal medical database	Jul 27, 2023	ClusteringMedical Diagnosis	—Unverified	0
Transformer-based Joint Source Channel Coding for Textual Semantic Communication	Jul 23, 2023	Semantic CommunicationSemantic Similarity	—Unverified	0
Improving Semantic Similarity Measure Within a Recommender System Based-on RDF Graphs	Jul 20, 2023	Recommendation SystemsSemantic Similarity	—Unverified	0
Jina Embeddings: A Novel Set of High-Performance Sentence Embedding Models	Jul 20, 2023	NegationRetrieval	—Unverified	0
Identical and Fraternal Twins: Fine-Grained Semantic Contrastive Learning of Sentence Representations	Jul 20, 2023	Contrastive LearningData Augmentation	—Unverified	0
Enhancing conversational quality in language learning chatbots: An evaluation of GPT4 for ASR error correction	Jul 19, 2023	Semantic Textual SimilaritySTS	—Unverified	0
Longitudinal Data and a Semantic Similarity Reward for Chest X-Ray Report Generation	Jul 19, 2023	DiagnosticFace Model	CodeCode Available	1
Improving Text Semantic Similarity Modeling through a 3D Siamese Network	Jul 18, 2023	NavigateSemantic Similarity	—Unverified	0
Class-relation Knowledge Distillation for Novel Class Discovery	Jul 18, 2023	Knowledge DistillationNovel Class Discovery	CodeCode Available	1
Regression-free Blind Image Quality Assessment with Content-Distortion Consistency	Jul 18, 2023	Image Quality AssessmentNo-Reference Image Quality Assessment	—Unverified	0
Distilling Coarse-to-Fine Semantic Matching Knowledge for Weakly Supervised 3D Visual Grounding	Jul 18, 2023	3D visual groundingObject	CodeCode Available	1
Large-Scale Evaluation of Topic Models and Dimensionality Reduction Methods for 2D Text Spatialization	Jul 17, 2023	Dimensionality ReductionSemantic Similarity	CodeCode Available	0
AspectCSE: Sentence Embeddings for Aspect-based Semantic Textual Similarity Using Contrastive Learning and Structured Knowledge	Jul 15, 2023	Contrastive LearningInformation Retrieval	—Unverified	0
Improving Trace Link Recommendation by Using Non-Isotropic Distances and Combinations	Jul 15, 2023	Information RetrievalRetrieval	—Unverified	0
Composition-contrastive Learning for Sentence Embeddings	Jul 14, 2023	Contrastive LearningSemantic Textual Similarity	CodeCode Available	0
Histopathology Whole Slide Image Analysis with Heterogeneous Graph Representation Learning	Jul 9, 2023	AttributeGraph Representation Learning	CodeCode Available	1
Novel Categories Discovery Via Constraints on Empirical Prediction Statistics	Jul 7, 2023	ClusteringPseudo Label	CodeCode Available	0
Efficient Domain Adaptation of Sentence Embeddings Using Adapters	Jul 6, 2023	Domain AdaptationSemantic Similarity	—Unverified	0
MWPRanker: An Expression Similarity Based Math Word Problem Retriever	Jul 3, 2023	Logical SequenceMath	—Unverified	0
Automatic Design of Semantic Similarity Ensembles Using Grammatical Evolution	Jul 3, 2023	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	0
Transfer learning for semantic similarity measures based on symbolic regression	Jul 2, 2023	regressionSemantic Similarity	CodeCode Available	0
A Massive Scale Semantic Similarity Dataset of Historical English	Jun 30, 2023	ArticlesSemantic Similarity	—Unverified	0
DialoGPS: Dialogue Path Sampling in Continuous Semantic Space for Data Augmentation in Multi-Turn Conversations	Jun 29, 2023	Data AugmentationDialogue Generation	—Unverified	0
Large Language Models as Annotators: Enhancing Generalization of NLP Models at Minimal Cost	Jun 27, 2023	Active LearningSemantic Similarity	—Unverified	0
Full Automation of Goal-driven LLM Dialog Threads with And-Or Recursors and Refiner Oracles	Jun 24, 2023	Recommendation SystemsSemantic Similarity	CodeCode Available	1
SeFNet: Bridging Tabular Datasets with Semantic Feature Nets	Jun 20, 2023	Meta-LearningSemantic Similarity	CodeCode Available	0
A Relaxed Optimization Approach for Adversarial Attacks against Neural Machine Translation Models	Jun 14, 2023	Adversarial AttackMachine Translation	—Unverified	0
Unbalanced Optimal Transport for Unbalanced Word Alignment	Jun 7, 2023	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	1
Supervised Knowledge May Hurt Novel Class Discovery Performance	Jun 6, 2023	Novel Class DiscoverySemantic Similarity	CodeCode Available	0
Augmenting Reddit Posts to Determine Wellness Dimensions impacting Mental Health	Jun 6, 2023	Data AugmentationSemantic Similarity	CodeCode Available	0
LyricSIM: A novel Dataset and Benchmark for Similarity Detection in Spanish Song LyricS	Jun 2, 2023	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	0
Vocabulary-free Image Classification	Jun 1, 2023	Classificationimage-classification	CodeCode Available	1
Estimating Semantic Similarity between In-Domain and Out-of-Domain Samples	Jun 1, 2023	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	0
Boosting the Performance of Transformer Architectures for Semantic Textual Similarity	Jun 1, 2023	Binary ClassificationSemantic Textual Similarity	—Unverified	0
Exploring Anisotropy and Outliers in Multilingual Language Models for Cross-Lingual Semantic Sentence Similarity	Jun 1, 2023	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	0
RealignDiff: Boosting Text-to-Image Diffusion Model with Coarse-to-fine Semantic Re-alignment	May 31, 2023	Caption GenerationLanguage Modelling	—Unverified	0
Real-World Image Variation by Aligning Diffusion Inversion Chain	May 30, 2023	Image GenerationImage-Variation	CodeCode Available	1
Datasets for Portuguese Legal Semantic Textual Similarity: Comparing weak supervision and an annotation process approaches	May 29, 2023	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	0
Whitening-based Contrastive Learning of Sentence Embeddings	May 28, 2023	Contrastive LearningDiversity	CodeCode Available	1
Modeling Adversarial Attack on Pre-trained Language Models as Sequential Decision Making	May 27, 2023	Adversarial AttackDecision Making	CodeCode Available	0
Evaluating Open-Domain Dialogues in Latent Space with Next Sentence Prediction and Mutual Information	May 26, 2023	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	0
ParaAMR: A Large-Scale Syntactically Diverse Paraphrase Dataset by AMR Back-Translation	May 26, 2023	Abstract Meaning RepresentationData Augmentation	CodeCode Available	0
AlignScore: Evaluating Factual Consistency with a Unified Alignment Function	May 26, 2023	Fact VerificationInformation Retrieval	CodeCode Available	4
RAMP: Retrieval and Attribute-Marking Enhanced Prompting for Attribute-Controlled Translation	May 26, 2023	AttributeMachine Translation	—Unverified	0
RankCSE: Unsupervised Sentence Representations Learning via Learning to Rank	May 26, 2023	Contrastive LearningLearning-To-Rank	CodeCode Available	1

Show:10 25 50

← PrevPage 12 of 48Next →

All datasets STS Benchmark MTEB MRPC SICK STS13 STS14 STS12 STS15 STS16 MRPC Dev SentEval SICK-R

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	SMARTRoBERTa	Dev Pearson Correlation	92.8	—	Unverified
2	DeBERTa (large)	Accuracy	92.5	—	Unverified
3	SMART-BERT	Dev Pearson Correlation	90	—	Unverified
4	MT-DNN-SMART	Pearson Correlation	0.93	—	Unverified
5	StructBERTRoBERTa ensemble	Pearson Correlation	0.93	—	Unverified
6	Mnet-Sim	Pearson Correlation	0.93	—	Unverified
7	XLNet (single model)	Pearson Correlation	0.93	—	Unverified
8	ALBERT	Pearson Correlation	0.93	—	Unverified
9	T5-11B	Pearson Correlation	0.93	—	Unverified
10	RoBERTa	Pearson Correlation	0.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AnglE-UAE	Spearman Correlation	84.54	—	Unverified
2	ST5-XXL	Spearman Correlation	82.63	—	Unverified
3	ST5-Large	Spearman Correlation	81.83	—	Unverified
4	ST5-XL	Spearman Correlation	81.66	—	Unverified
5	ST5-Base	Spearman Correlation	81.14	—	Unverified
6	MPNet-multilingual	Spearman Correlation	80.73	—	Unverified
7	SGPT-5.8B-nli	Spearman Correlation	80.53	—	Unverified
8	MPNet	Spearman Correlation	80.28	—	Unverified
9	MiniLM-L12	Spearman Correlation	79.8	—	Unverified
10	SimCSE-BERT-sup	Spearman Correlation	79.12	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MT-DNN-SMART	Accuracy	93.7	—	Unverified
2	ALBERT	Accuracy	93.4	—	Unverified
3	RoBERTa (ensemble)	Accuracy	92.3	—	Unverified
4	BigBird	F1	91.5	—	Unverified
5	StructBERTRoBERTa ensemble	Accuracy	91.5	—	Unverified
6	FLOATER-large	Accuracy	91.4	—	Unverified
7	SMART	Accuracy	91.3	—	Unverified
8	RoBERTa-large 355M (MLP quantized vector-wise, fine-tuned)	Accuracy	91	—	Unverified
9	RoBERTa-large 355M + Entailment as Few-shot Learner	F1	91	—	Unverified
10	SpanBERT	Accuracy	90.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromCSE-RoBERTa-large (0.355B)	Spearman Correlation	0.82	—	Unverified
2	PromptEOL+CSE+LLaMA-30B	Spearman Correlation	0.82	—	Unverified
3	PromptEOL+CSE+OPT-13B	Spearman Correlation	0.82	—	Unverified
4	SimCSE-RoBERTalarge	Spearman Correlation	0.82	—	Unverified
5	PromptEOL+CSE+OPT-2.7B	Spearman Correlation	0.81	—	Unverified
6	SentenceBERT	Spearman Correlation	0.75	—	Unverified
7	SRoBERTa-NLI-base	Spearman Correlation	0.74	—	Unverified
8	SRoBERTa-NLI-large	Spearman Correlation	0.74	—	Unverified
9	Dino (STS/̄🦕)	Spearman Correlation	0.74	—	Unverified
10	SBERT-NLI-large	Spearman Correlation	0.74	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AnglE-LLaMA-7B	Spearman Correlation	0.91	—	Unverified
2	AnglE-LLaMA-7B-v2	Spearman Correlation	0.91	—	Unverified
3	PromptEOL+CSE+LLaMA-30B	Spearman Correlation	0.9	—	Unverified
4	PromptEOL+CSE+OPT-13B	Spearman Correlation	0.9	—	Unverified
5	PromptEOL+CSE+OPT-2.7B	Spearman Correlation	0.9	—	Unverified
6	PromCSE-RoBERTa-large (0.355B)	Spearman Correlation	0.89	—	Unverified
7	Trans-Encoder-BERT-large-bi (unsup.)	Spearman Correlation	0.89	—	Unverified
8	Trans-Encoder-BERT-large-cross (unsup.)	Spearman Correlation	0.88	—	Unverified
9	Trans-Encoder-RoBERTa-large-cross (unsup.)	Spearman Correlation	0.88	—	Unverified
10	SimCSE-RoBERTa-large	Spearman Correlation	0.87	—	Unverified