Semantic Textual Similarity

Semantic textual similarity deals with determining how similar two pieces of texts are. This can take the form of assigning a score from 1 to 5. Related tasks are paraphrase or duplicate identification.

Image source: Learning Semantic Textual Similarity from Conversations

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–100 of 2381 papers

Title	Date	Tasks	Status	Hype
CmdCaliper: A Semantic-Aware Command-Line Embedding Model and Dataset for Security Research	Nov 2, 2024	Line DetectionSemantic Similarity	CodeCode Available	1
Emotional RAG: Enhancing Role-Playing Agents through Emotional Retrieval	Oct 30, 2024	RAGResponse Generation	CodeCode Available	1
Demystifying and Extracting Fault-indicating Information from Logs for Failure Diagnosis	Sep 20, 2024	Anomaly DetectionFault Diagnosis	CodeCode Available	1
DataSculpt: Crafting Data Landscapes for Long-Context LLMs through Multi-Objective Partitioning	Sep 2, 2024	Code CompletionCombinatorial Optimization	CodeCode Available	1
Distinguish Confusion in Legal Judgment Prediction via Revised Relation Knowledge	Aug 18, 2024	ArticlesInductive Bias	CodeCode Available	1
Unsupervised Episode Detection for Large-Scale News Events	Aug 9, 2024	ArticlesEvent Detection	CodeCode Available	1
DriveDiTFit: Fine-tuning Diffusion Transformers for Autonomous Driving	Jul 22, 2024	Autonomous DrivingDiversity	CodeCode Available	1
Towards Bridging the Cross-modal Semantic Gap for Multi-modal Recommendation	Jul 7, 2024	cross-modal alignmentMulti-modal Recommendation	CodeCode Available	1
One Prompt is not Enough: Automated Construction of a Mixture-of-Expert Prompts	Jun 28, 2024	In-Context LearningSemantic Similarity	CodeCode Available	1
3D-AVS: LiDAR-based 3D Auto-Vocabulary Segmentation	Jun 13, 2024	Autonomous DrivingObject	CodeCode Available	1
Factual Serialization Enhancement: A Key Innovation for Chest X-ray Report Generation	May 15, 2024	Contrastive Learningcross-modal alignment	CodeCode Available	1
Calibrating Higher-Order Statistics for Few-Shot Class-Incremental Learning with Pre-trained Vision Transformers	Apr 9, 2024	class-incremental learningClass Incremental Learning	CodeCode Available	1
Retrieval-Augmented Open-Vocabulary Object Detection	Apr 8, 2024	Language ModelingLanguage Modelling	CodeCode Available	1
SemEval-2024 Task 1: Semantic Textual Relatedness for African and Asian Languages	Mar 27, 2024	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	1
KDMCSE: Knowledge Distillation Multimodal Sentence Embeddings with Adaptive Angular margin Contrastive Learning	Mar 26, 2024	Contrastive LearningKnowledge Distillation	CodeCode Available	1
Learning to Rematch Mismatched Pairs for Robust Cross-Modal Retrieval	Mar 8, 2024	Cross-Modal RetrievalCross-modal retrieval with noisy correspondence	CodeCode Available	1
Meta-Task Prompting Elicits Embeddings from Large Language Models	Feb 28, 2024	Semantic Textual SimilaritySentence	CodeCode Available	1
NextLevelBERT: Masked Language Modeling with Higher-Level Representations for Long Documents	Feb 27, 2024	Document ClassificationLanguage Modeling	CodeCode Available	1
DrBenchmark: A Large Language Understanding Evaluation Benchmark for French Biomedical Domain	Feb 20, 2024	named-entity-recognitionNamed Entity Recognition	CodeCode Available	1
Pixel Sentence Representation Learning	Feb 13, 2024	Natural Language InferenceRepresentation Learning	CodeCode Available	1
SemRel2024: A Collection of Semantic Textual Relatedness Datasets for 13 Languages	Feb 13, 2024	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	1
Reconstruct Your Previous Conversations! Comprehensively Investigating Privacy Leakage Risks in Conversations with GPT Models	Feb 5, 2024	Reconstruction AttackSemantic Similarity	CodeCode Available	1
Benchmarking Transferable Adversarial Attacks	Feb 1, 2024	Adversarial AttackBenchmarking	CodeCode Available	1
DenoSent: A Denoising Objective for Self-Supervised Sentence Representation Learning	Jan 24, 2024	Contrastive LearningDenoising	CodeCode Available	1
Noise Contrastive Estimation-based Matching Framework for Low-Resource Security Attack Pattern Recognition	Jan 18, 2024	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	1
HiHPQ: Hierarchical Hyperbolic Product Quantization for Unsupervised Image Retrieval	Jan 14, 2024	Contrastive LearningImage Retrieval	CodeCode Available	1
Do Vision and Language Encoders Represent the World Similarly?	Jan 10, 2024	Graph Matchingimage-classification	CodeCode Available	1
Explicitly Integrating Judgment Prediction with Legal Document Retrieval: A Law-Guided Generative Approach	Dec 15, 2023	PredictionRetrieval	CodeCode Available	1
Binary Code Summarization: Benchmarking ChatGPT/GPT-4 and Other Large Language Models	Dec 15, 2023	BenchmarkingCode Summarization	CodeCode Available	1
TAP4LLM: Table Provider on Sampling, Augmenting, and Packing Semi-structured Data for Large Language Model Reasoning	Dec 14, 2023	Language ModelingLanguage Modelling	CodeCode Available	1
FedSSA: Semantic Similarity-based Aggregation for Efficient Model-Heterogeneous Personalized Federated Learning	Dec 14, 2023	Computational EfficiencyFederated Learning	CodeCode Available	1
Mining Gaze for Contrastive Learning toward Computer-Assisted Diagnosis	Dec 11, 2023	Contrastive LearningSemantic Similarity	CodeCode Available	1
Encoding Surgical Videos as Latent Spatiotemporal Graphs for Object and Anatomy-Driven Reasoning	Dec 11, 2023	Action RecognitionAnatomy	CodeCode Available	1
Few-Shot Class-Incremental Learning via Training-Free Prototype Calibration	Dec 8, 2023	class-incremental learningClass Incremental Learning	CodeCode Available	1
AutoKG: Efficient Automated Knowledge Graph Generation for Language Models	Nov 22, 2023	Graph GenerationRetrieval	CodeCode Available	1
Sub-Sentence Encoder: Contrastive Learning of Propositional Semantic Representations	Nov 7, 2023	Contrastive LearningSemantic Similarity	CodeCode Available	1
An Efficient Self-Supervised Cross-View Training For Sentence Embedding	Nov 6, 2023	Contrastive LearningLanguage Modeling	CodeCode Available	1
TPSeNCE: Towards Artifact-Free Realistic Rain Generation for Deraining and Object Detection in Rain	Nov 1, 2023	Contrastive LearningImage-to-Image Translation	CodeCode Available	1
Meaning Representations from Trajectories in Autoregressive Models	Oct 23, 2023	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	1
Visual Grounding Helps Learn Word Meanings in Low-Data Regimes	Oct 20, 2023	Image CaptioningLanguage Acquisition	CodeCode Available	1
Context Compression for Auto-regressive Transformers with Sentinel Tokens	Oct 12, 2023	Language ModelingLanguage Modelling	CodeCode Available	1
AstroCLIP: A Cross-Modal Foundation Model for Galaxies	Oct 4, 2023	Contrastive Learningmodel	CodeCode Available	1
Sieve: Multimodal Dataset Pruning Using Image Captioning Models	Oct 3, 2023	DiversityImage Captioning	CodeCode Available	1
InstructERC: Reforming Emotion Recognition in Conversation with Multi-task Retrieval-Augmented Large Language Models	Sep 21, 2023	Emotion RecognitionEmotion Recognition in Conversation	CodeCode Available	1
Dual-Modal Attention-Enhanced Text-Video Retrieval with Triplet Partial Margin Contrastive Learning	Sep 20, 2023	Contrastive LearningRetrieval	CodeCode Available	1
LinkTransformer: A Unified Package for Record Linkage with Transformer Language Models	Sep 2, 2023	BlockingLanguage Modelling	CodeCode Available	1
CALM : A Multi-task Benchmark for Comprehensive Assessment of Language Model Bias	Aug 24, 2023	DiversityLanguage Modeling	CodeCode Available	1
Sentence Embedding Models for Ancient Greek Using Multilingual Knowledge Distillation	Aug 24, 2023	Authorship AttributionKnowledge Distillation	CodeCode Available	1
Audio-Visual Class-Incremental Learning	Aug 21, 2023	class-incremental learningClass Incremental Learning	CodeCode Available	1
Deep Fusion Transformer Network with Weighted Vector-Wise Keypoints Voting for Robust 6D Object Pose Estimation	Aug 10, 2023	6D Pose Estimation using RGBglobal-optimization	CodeCode Available	1

Show:10 25 50

← PrevPage 2 of 48Next →

All datasets STS Benchmark MTEB MRPC SICK STS13 STS14 STS12 STS15 STS16 MRPC Dev SentEval SICK-R

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	SMARTRoBERTa	Dev Pearson Correlation	92.8	—	Unverified
2	DeBERTa (large)	Accuracy	92.5	—	Unverified
3	SMART-BERT	Dev Pearson Correlation	90	—	Unverified
4	MT-DNN-SMART	Pearson Correlation	0.93	—	Unverified
5	StructBERTRoBERTa ensemble	Pearson Correlation	0.93	—	Unverified
6	Mnet-Sim	Pearson Correlation	0.93	—	Unverified
7	XLNet (single model)	Pearson Correlation	0.93	—	Unverified
8	ALBERT	Pearson Correlation	0.93	—	Unverified
9	T5-11B	Pearson Correlation	0.93	—	Unverified
10	RoBERTa	Pearson Correlation	0.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AnglE-UAE	Spearman Correlation	84.54	—	Unverified
2	ST5-XXL	Spearman Correlation	82.63	—	Unverified
3	ST5-Large	Spearman Correlation	81.83	—	Unverified
4	ST5-XL	Spearman Correlation	81.66	—	Unverified
5	ST5-Base	Spearman Correlation	81.14	—	Unverified
6	MPNet-multilingual	Spearman Correlation	80.73	—	Unverified
7	SGPT-5.8B-nli	Spearman Correlation	80.53	—	Unverified
8	MPNet	Spearman Correlation	80.28	—	Unverified
9	MiniLM-L12	Spearman Correlation	79.8	—	Unverified
10	SimCSE-BERT-sup	Spearman Correlation	79.12	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MT-DNN-SMART	Accuracy	93.7	—	Unverified
2	ALBERT	Accuracy	93.4	—	Unverified
3	RoBERTa (ensemble)	Accuracy	92.3	—	Unverified
4	BigBird	F1	91.5	—	Unverified
5	StructBERTRoBERTa ensemble	Accuracy	91.5	—	Unverified
6	FLOATER-large	Accuracy	91.4	—	Unverified
7	SMART	Accuracy	91.3	—	Unverified
8	RoBERTa-large 355M (MLP quantized vector-wise, fine-tuned)	Accuracy	91	—	Unverified
9	RoBERTa-large 355M + Entailment as Few-shot Learner	F1	91	—	Unverified
10	SpanBERT	Accuracy	90.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromCSE-RoBERTa-large (0.355B)	Spearman Correlation	0.82	—	Unverified
2	PromptEOL+CSE+LLaMA-30B	Spearman Correlation	0.82	—	Unverified
3	PromptEOL+CSE+OPT-13B	Spearman Correlation	0.82	—	Unverified
4	SimCSE-RoBERTalarge	Spearman Correlation	0.82	—	Unverified
5	PromptEOL+CSE+OPT-2.7B	Spearman Correlation	0.81	—	Unverified
6	SentenceBERT	Spearman Correlation	0.75	—	Unverified
7	SRoBERTa-NLI-base	Spearman Correlation	0.74	—	Unverified
8	SRoBERTa-NLI-large	Spearman Correlation	0.74	—	Unverified
9	Dino (STS/̄🦕)	Spearman Correlation	0.74	—	Unverified
10	SBERT-NLI-large	Spearman Correlation	0.74	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AnglE-LLaMA-7B	Spearman Correlation	0.91	—	Unverified
2	AnglE-LLaMA-7B-v2	Spearman Correlation	0.91	—	Unverified
3	PromptEOL+CSE+LLaMA-30B	Spearman Correlation	0.9	—	Unverified
4	PromptEOL+CSE+OPT-13B	Spearman Correlation	0.9	—	Unverified
5	PromptEOL+CSE+OPT-2.7B	Spearman Correlation	0.9	—	Unverified
6	PromCSE-RoBERTa-large (0.355B)	Spearman Correlation	0.89	—	Unverified
7	Trans-Encoder-BERT-large-bi (unsup.)	Spearman Correlation	0.89	—	Unverified
8	Trans-Encoder-BERT-large-cross (unsup.)	Spearman Correlation	0.88	—	Unverified
9	Trans-Encoder-RoBERTa-large-cross (unsup.)	Spearman Correlation	0.88	—	Unverified
10	SimCSE-RoBERTa-large	Spearman Correlation	0.87	—	Unverified