Semantic Textual Similarity

Semantic textual similarity deals with determining how similar two pieces of texts are. This can take the form of assigning a score from 1 to 5. Related tasks are paraphrase or duplicate identification.

Image source: Learning Semantic Textual Similarity from Conversations

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–100 of 2381 papers

Title	Date	Tasks	Status	Hype	Score
3D-AVS: LiDAR-based 3D Auto-Vocabulary Segmentation	Jun 13, 2024	Autonomous DrivingObject	CodeCode Available	1	5
DIP: Dual Incongruity Perceiving Network for Sarcasm Detection	Jan 1, 2023	Sarcasm DetectionSemantic Similarity	CodeCode Available	1	5
DriveDiTFit: Fine-tuning Diffusion Transformers for Autonomous Driving	Jul 22, 2024	Autonomous DrivingDiversity	CodeCode Available	1	5
Balancing Lexical and Semantic Quality in Abstractive Summarization	May 17, 2023	Abstractive Text SummarizationRe-Ranking	CodeCode Available	1	5
Big Bird: Transformers for Longer Sequences	Jul 28, 2020	Linguistic AcceptabilityNatural Language Inference	CodeCode Available	1	5
Bootstrapped Unsupervised Sentence Representation Learning	Aug 1, 2021	Representation LearningSemantic Textual Similarity	CodeCode Available	1	5
RACE: Retrieval-Augmented Commit Message Generation	Mar 5, 2022	Information RetrievalRetrieval	CodeCode Available	1	5
Efficient Mask Correction for Click-Based Interactive Image Segmentation	Jan 1, 2023	Image SegmentationSegmentation	CodeCode Available	1	5
Binary Code Summarization: Benchmarking ChatGPT/GPT-4 and Other Large Language Models	Dec 15, 2023	BenchmarkingCode Summarization	CodeCode Available	1	5
Encoding Surgical Videos as Latent Spatiotemporal Graphs for Object and Anatomy-Driven Reasoning	Dec 11, 2023	Action RecognitionAnatomy	CodeCode Available	1	5
Describing Sets of Images with Textual-PCA	Oct 21, 2022	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	1	5
DenoSent: A Denoising Objective for Self-Supervised Sentence Representation Learning	Jan 24, 2024	Contrastive LearningDenoising	CodeCode Available	1	5
DialogueCSE: Dialogue-based Contrastive Learning of Sentence Embeddings	Sep 26, 2021	Contrastive LearningSemantic Textual Similarity	CodeCode Available	1	5
DistilCSE: Effective Knowledge Distillation For Contrastive Sentence Embeddings	Dec 10, 2021	Contrastive LearningKnowledge Distillation	CodeCode Available	1	5
Deep Representational Re-tuning using Contrastive Tension	Jan 1, 2021	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	1	5
ARMAN: Pre-training with Semantically Selecting and Reordering of Sentences for Persian Abstractive Summarization	Sep 9, 2021	Abstractive Text SummarizationDecoder	CodeCode Available	1	5
DeepSim: Semantic similarity metrics for learned image registration	Nov 11, 2020	Image RegistrationSemantic Similarity	CodeCode Available	1	5
Debiased Contrastive Learning of Unsupervised Sentence Representations	May 2, 2022	Contrastive LearningSemantic Textual Similarity	CodeCode Available	1	5
DataSculpt: Crafting Data Landscapes for Long-Context LLMs through Multi-Objective Partitioning	Sep 2, 2024	Code CompletionCombinatorial Optimization	CodeCode Available	1	5
Improved Universal Sentence Embeddings with Prompt-based Contrastive Learning and Energy-based Learning	Mar 14, 2022	AttributeContrastive Learning	CodeCode Available	1	5
Demystifying and Extracting Fault-indicating Information from Logs for Failure Diagnosis	Sep 20, 2024	Anomaly DetectionFault Diagnosis	CodeCode Available	1	5
Discrete Optimization for Unsupervised Sentence Summarization with Word-Level Extraction	May 4, 2020	Language ModelingLanguage Modelling	CodeCode Available	1	5
Reconstruct Your Previous Conversations! Comprehensively Investigating Privacy Leakage Risks in Conversations with GPT Models	Feb 5, 2024	Reconstruction AttackSemantic Similarity	CodeCode Available	1	5
COPNER: Contrastive Learning with Prompt Guiding for Few-shot Named Entity Recognition	Oct 1, 2022	Contrastive Learningfew-shot-ner	CodeCode Available	1	5
Context Compression for Auto-regressive Transformers with Sentinel Tokens	Oct 12, 2023	Language ModelingLanguage Modelling	CodeCode Available	1	5
Context-Aware Semantic Similarity Measurement for Unsupervised Word Sense Disambiguation	May 5, 2023	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	1	5
ContraCLM: Contrastive Learning For Causal Language Model	Oct 3, 2022	Code GenerationCode Search	CodeCode Available	1	5
Towards Better Understanding of User Satisfaction in Open-Domain Conversational Search	Apr 6, 2022	Conversational SearchSemantic Similarity	CodeCode Available	1	5
A Semantic-based Method for Unsupervised Commonsense Question Answering	May 31, 2021	Question AnsweringSemantic Similarity	CodeCode Available	1	5
AugCSE: Contrastive Sentence Embedding with Diverse Augmentations	Oct 20, 2022	Data AugmentationDomain Adaptation	CodeCode Available	1	5
Crisscrossed Captions: Extended Intramodal and Intermodal Semantic Similarity Judgments for MS-COCO	Apr 30, 2020	Image CaptioningRepresentation Learning	CodeCode Available	1	5
Compositional Evaluation on Japanese Textual Entailment and Similarity	Aug 9, 2022	Natural Language InferenceSemantic Textual Similarity	CodeCode Available	1	5
An Efficient Self-Supervised Cross-View Training For Sentence Embedding	Nov 6, 2023	Contrastive LearningLanguage Modeling	CodeCode Available	1	5
Are Large Language Models Ready for Healthcare? A Comparative Study on Clinical Language Understanding	Apr 9, 2023	Document Classificationnamed-entity-recognition	CodeCode Available	1	5
Deep Fusion Transformer Network with Weighted Vector-Wise Keypoints Voting for Robust 6D Object Pose Estimation	Aug 10, 2023	6D Pose Estimation using RGBglobal-optimization	CodeCode Available	1	5
Deep Metric Learning by Online Soft Mining and Class-Aware Attention	Nov 4, 2018	Metric LearningPerson Re-Identification	CodeCode Available	1	5
A Statistical Framework for Low-bitwidth Training of Deep Neural Networks	Oct 27, 2020	Linguistic AcceptabilityNatural Language Inference	CodeCode Available	1	5
Audio-Visual Class-Incremental Learning	Aug 21, 2023	class-incremental learningClass Incremental Learning	CodeCode Available	1	5
A Sentence is Worth 128 Pseudo Tokens: A Semantic-Aware Contrastive Learning Framework for Sentence Embeddings	Mar 11, 2022	Contrastive LearningSemantic Textual Similarity	CodeCode Available	1	5
A Simple Long-Tailed Recognition Baseline via Vision-Language Model	Nov 29, 2021	Contrastive LearningLanguage Modeling	CodeCode Available	1	5
ComStreamClust: a communicative multi-agent approach to text clustering in streaming data	Oct 11, 2020	ClusteringSemantic Similarity	CodeCode Available	1	5
Attributable Visual Similarity Learning	Mar 28, 2022	Metric LearningSemantic Similarity	CodeCode Available	1	5
R&R: Metric-guided Adversarial Sentence Generation	Apr 17, 2021	Adversarial AttackGeneral Classification	CodeCode Available	1	5
Attentive Normalization for Conditional Image Generation	Apr 8, 2020	Conditional Image GenerationImage Generation	CodeCode Available	1	5
An Unsupervised Sentence Embedding Method by Mutual Information Maximization	Sep 25, 2020	ClusteringSelf-Supervised Learning	CodeCode Available	1	5
CODER: Knowledge infused cross-lingual medical term embedding for term normalization	Nov 5, 2020	Contrastive LearningKnowledge Graphs	CodeCode Available	1	5
AutoKG: Efficient Automated Knowledge Graph Generation for Language Models	Nov 22, 2023	Graph GenerationRetrieval	CodeCode Available	1	5
AutoGCL: Automated Graph Contrastive Learning via Learnable View Generators	Sep 21, 2021	Contrastive LearningGraph Representation Learning	CodeCode Available	1	5
A large-scale computational study of content preservation measures for text style transfer and paraphrase generation	May 1, 2022	Paraphrase GenerationSemantic Similarity	CodeCode Available	1	5
ConSERT: A Contrastive Framework for Self-Supervised Sentence Representation Transfer	May 25, 2021	Contrastive LearningSemantic Textual Similarity	CodeCode Available	1	5

Show:10 25 50

← PrevPage 2 of 48Next →

All datasets STS Benchmark MTEB MRPC SICK STS13 STS14 STS12 STS15 STS16 MRPC Dev SentEval SICK-R

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	SMARTRoBERTa	Dev Pearson Correlation	92.8	—	Unverified
2	DeBERTa (large)	Accuracy	92.5	—	Unverified
3	SMART-BERT	Dev Pearson Correlation	90	—	Unverified
4	MT-DNN-SMART	Pearson Correlation	0.93	—	Unverified
5	StructBERTRoBERTa ensemble	Pearson Correlation	0.93	—	Unverified
6	Mnet-Sim	Pearson Correlation	0.93	—	Unverified
7	XLNet (single model)	Pearson Correlation	0.93	—	Unverified
8	ALBERT	Pearson Correlation	0.93	—	Unverified
9	T5-11B	Pearson Correlation	0.93	—	Unverified
10	RoBERTa	Pearson Correlation	0.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AnglE-UAE	Spearman Correlation	84.54	—	Unverified
2	ST5-XXL	Spearman Correlation	82.63	—	Unverified
3	ST5-Large	Spearman Correlation	81.83	—	Unverified
4	ST5-XL	Spearman Correlation	81.66	—	Unverified
5	ST5-Base	Spearman Correlation	81.14	—	Unverified
6	MPNet-multilingual	Spearman Correlation	80.73	—	Unverified
7	SGPT-5.8B-nli	Spearman Correlation	80.53	—	Unverified
8	MPNet	Spearman Correlation	80.28	—	Unverified
9	MiniLM-L12	Spearman Correlation	79.8	—	Unverified
10	SimCSE-BERT-sup	Spearman Correlation	79.12	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MT-DNN-SMART	Accuracy	93.7	—	Unverified
2	ALBERT	Accuracy	93.4	—	Unverified
3	RoBERTa (ensemble)	Accuracy	92.3	—	Unverified
4	BigBird	F1	91.5	—	Unverified
5	StructBERTRoBERTa ensemble	Accuracy	91.5	—	Unverified
6	FLOATER-large	Accuracy	91.4	—	Unverified
7	SMART	Accuracy	91.3	—	Unverified
8	RoBERTa-large 355M (MLP quantized vector-wise, fine-tuned)	Accuracy	91	—	Unverified
9	RoBERTa-large 355M + Entailment as Few-shot Learner	F1	91	—	Unverified
10	SpanBERT	Accuracy	90.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromCSE-RoBERTa-large (0.355B)	Spearman Correlation	0.82	—	Unverified
2	PromptEOL+CSE+LLaMA-30B	Spearman Correlation	0.82	—	Unverified
3	PromptEOL+CSE+OPT-13B	Spearman Correlation	0.82	—	Unverified
4	SimCSE-RoBERTalarge	Spearman Correlation	0.82	—	Unverified
5	PromptEOL+CSE+OPT-2.7B	Spearman Correlation	0.81	—	Unverified
6	SentenceBERT	Spearman Correlation	0.75	—	Unverified
7	SRoBERTa-NLI-base	Spearman Correlation	0.74	—	Unverified
8	SRoBERTa-NLI-large	Spearman Correlation	0.74	—	Unverified
9	Dino (STS/̄🦕)	Spearman Correlation	0.74	—	Unverified
10	SBERT-NLI-large	Spearman Correlation	0.74	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AnglE-LLaMA-7B	Spearman Correlation	0.91	—	Unverified
2	AnglE-LLaMA-7B-v2	Spearman Correlation	0.91	—	Unverified
3	PromptEOL+CSE+LLaMA-30B	Spearman Correlation	0.9	—	Unverified
4	PromptEOL+CSE+OPT-13B	Spearman Correlation	0.9	—	Unverified
5	PromptEOL+CSE+OPT-2.7B	Spearman Correlation	0.9	—	Unverified
6	PromCSE-RoBERTa-large (0.355B)	Spearman Correlation	0.89	—	Unverified
7	Trans-Encoder-BERT-large-bi (unsup.)	Spearman Correlation	0.89	—	Unverified
8	Trans-Encoder-BERT-large-cross (unsup.)	Spearman Correlation	0.88	—	Unverified
9	Trans-Encoder-RoBERTa-large-cross (unsup.)	Spearman Correlation	0.88	—	Unverified
10	SimCSE-RoBERTa-large	Spearman Correlation	0.87	—	Unverified