Semantic Textual Similarity

Semantic textual similarity deals with determining how similar two pieces of texts are. This can take the form of assigning a score from 1 to 5. Related tasks are paraphrase or duplicate identification.

Image source: Learning Semantic Textual Similarity from Conversations

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 451–500 of 2381 papers

Title	Date	Tasks	Status	Hype
Def2Vec: Extensible Word Embeddings from Dictionary Definitions	Dec 16, 2023	Chunkingnamed-entity-recognition	CodeCode Available	0
Explicitly Integrating Judgment Prediction with Legal Document Retrieval: A Law-Guided Generative Approach	Dec 15, 2023	PredictionRetrieval	CodeCode Available	1
Binary Code Summarization: Benchmarking ChatGPT/GPT-4 and Other Large Language Models	Dec 15, 2023	BenchmarkingCode Summarization	CodeCode Available	1
FedSSA: Semantic Similarity-based Aggregation for Efficient Model-Heterogeneous Personalized Federated Learning	Dec 14, 2023	Computational EfficiencyFederated Learning	CodeCode Available	1
TAP4LLM: Table Provider on Sampling, Augmenting, and Packing Semi-structured Data for Large Language Model Reasoning	Dec 14, 2023	Language ModelingLanguage Modelling	CodeCode Available	1
Encoding Surgical Videos as Latent Spatiotemporal Graphs for Object and Anatomy-Driven Reasoning	Dec 11, 2023	Action RecognitionAnatomy	CodeCode Available	1
Mining Gaze for Contrastive Learning toward Computer-Assisted Diagnosis	Dec 11, 2023	Contrastive LearningSemantic Similarity	CodeCode Available	1
Sim-GPT: Text Similarity via GPT Annotated Data	Dec 9, 2023	Semantic Textual SimilaritySentence	CodeCode Available	0
Few-Shot Class-Incremental Learning via Training-Free Prototype Calibration	Dec 8, 2023	class-incremental learningClass Incremental Learning	CodeCode Available	1
Self-Critical Alternate Learning based Semantic Broadcast Communication	Dec 3, 2023	Reinforcement Learning (RL)Semantic Communication	—Unverified	0
Hyperpolyglot LLMs: Cross-Lingual Interpretability in Token Embeddings	Nov 29, 2023	Cross-Lingual TransferLanguage Modeling	CodeCode Available	0
Reinforcement Replaces Supervision: Query focused Summarization using Deep Reinforcement Learning	Nov 29, 2023	Deep Reinforcement LearningLong Form Question Answering	CodeCode Available	0
A Distribution-Based Threshold for Determining Sentence Similarity	Nov 28, 2023	Semantic Textual SimilaritySentence	—Unverified	0
Large Language Models as Topological Structure Enhancers for Text-Attributed Graphs	Nov 24, 2023	Graph LearningGraph Neural Network	—Unverified	0
AutoKG: Efficient Automated Knowledge Graph Generation for Language Models	Nov 22, 2023	Graph GenerationRetrieval	CodeCode Available	1
IEKM: A Model Incorporating External Keyword Matrices	Nov 21, 2023	modelSemantic Similarity	—Unverified	0
Do Smaller Language Models Answer Contextualised Questions Through Memorisation Or Generalisation?	Nov 21, 2023	Question AnsweringSemantic Similarity	—Unverified	0
Portuguese FAQ for Financial Services	Nov 19, 2023	Data AugmentationSemantic Similarity	—Unverified	0
One Size Fits All for Semantic Shifts: Adaptive Prompt Tuning for Continual Learning	Nov 18, 2023	AllContinual Learning	CodeCode Available	0
Beyond Images: An Integrative Multi-modal Approach to Chest X-Ray Report Generation	Nov 18, 2023	Image to textSemantic Similarity	—Unverified	0
Eval-GCSC: A New Metric for Evaluating ChatGPT's Performance in Chinese Spelling Correction	Nov 14, 2023	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	0
BeLLM: Backward Dependency Enhanced Large Language Model for Sentence Embeddings	Nov 9, 2023	Language ModelingLanguage Modelling	CodeCode Available	2
Active Mining Sample Pair Semantics for Image-text Matching	Nov 9, 2023	Active LearningImage-text matching	—Unverified	0
Text Representation Distillation via Information Bottleneck Principle	Nov 9, 2023	Knowledge DistillationRetrieval	CodeCode Available	0
Large-scale study of human memory for meaningful narratives	Nov 8, 2023	Semantic SimilaritySemantic Textual Similarity	—Unverified	0
Sub-Sentence Encoder: Contrastive Learning of Propositional Semantic Representations	Nov 7, 2023	Contrastive LearningSemantic Similarity	CodeCode Available	1
Sparse Contrastive Learning of Sentence Embeddings	Nov 7, 2023	Contrastive LearningSemantic Textual Similarity	—Unverified	0
Unveiling Safety Vulnerabilities of Large Language Models	Nov 7, 2023	Semantic SimilaritySemantic Textual Similarity	—Unverified	0
An Efficient Self-Supervised Cross-View Training For Sentence Embedding	Nov 6, 2023	Contrastive LearningLanguage Modeling	CodeCode Available	1
Divide & Conquer for Entailment-aware Multi-hop Evidence Retrieval	Nov 5, 2023	Information RetrievalMulti-hop Question Answering	—Unverified	0
Relation Extraction Model Based on Semantic Enhancement Mechanism	Nov 5, 2023	Information Retrievalmodel	—Unverified	0
Contextualizing the Limits of Model & Evaluation Dataset Curation on Semantic Similarity Classification Tasks	Nov 3, 2023	ClassificationFriction	—Unverified	0
ProcSim: Proxy-based Confidence for Robust Similarity Learning	Nov 1, 2023	Metric LearningSemantic Similarity	—Unverified	0
TPSeNCE: Towards Artifact-Free Realistic Rain Generation for Deraining and Object Detection in Rain	Nov 1, 2023	Contrastive LearningImage-to-Image Translation	CodeCode Available	1
SEINE: Short-to-Long Video Diffusion Model for Generative Transition and Prediction	Oct 31, 2023	PredictionSemantic Similarity	CodeCode Available	2
Few-shot Hybrid Domain Adaptation of Image Generators	Oct 30, 2023	Domain AdaptationSemantic Similarity	CodeCode Available	0
Accelerating LLaMA Inference by Enabling Intermediate Layer Decoding via Instruction Tuning with LITE	Oct 28, 2023	Semantic SimilaritySemantic Textual Similarity	—Unverified	0
Translating away Translationese without Parallel Data	Oct 28, 2023	Binary ClassificationLanguage Modelling	—Unverified	0
The Distributional Hypothesis Does Not Fully Explain the Benefits of Masked Language Model Pretraining	Oct 25, 2023	Language ModelingLanguage Modelling	CodeCode Available	0
Can GPT models Follow Human Summarization Guidelines? Evaluating ChatGPT and GPT-4 for Dialogue Summarization	Oct 25, 2023	Semantic SimilaritySemantic Textual Similarity	—Unverified	0
Topology-aware Debiased Self-supervised Graph Learning for Recommendation	Oct 24, 2023	Collaborative FilteringContrastive Learning	CodeCode Available	0
Meaning Representations from Trajectories in Autoregressive Models	Oct 23, 2023	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	1
Chain-of-Factors Paper-Reviewer Matching	Oct 23, 2023	Information RetrievalLanguage Modelling	CodeCode Available	0
PaRaDe: Passage Ranking using Demonstrations with Large Language Models	Oct 22, 2023	Passage RankingPassage Re-Ranking	—Unverified	0
Prompt-based Grouping Transformer for Nucleus Detection and Classification	Oct 22, 2023	ClassificationSemantic Similarity	CodeCode Available	0
Visual Grounding Helps Learn Word Meanings in Low-Data Regimes	Oct 20, 2023	Image CaptioningLanguage Acquisition	CodeCode Available	1
Investigating semantic subspaces of Transformer sentence embeddings through linear structural probing	Oct 18, 2023	DecoderNatural Language Inference	CodeCode Available	0
Improving Long Document Topic Segmentation Models With Enhanced Coherence Modeling	Oct 18, 2023	Information RetrievalSegmentation	—Unverified	0
Exploring Automatic Evaluation Methods based on a Decoder-based LLM for Text Generation	Oct 17, 2023	DecoderIn-Context Learning	—Unverified	0
Noise Contrastive Estimation-based Matching Framework for Low-resource Security Attack Pattern Recognition	Oct 16, 2023	Semantic SimilaritySemantic Textual Similarity	—Unverified	0

Show:10 25 50

← PrevPage 10 of 48Next →

All datasets STS Benchmark MTEB MRPC SICK STS13 STS14 STS12 STS15 STS16 MRPC Dev SentEval SICK-R

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	SMARTRoBERTa	Dev Pearson Correlation	92.8	—	Unverified
2	DeBERTa (large)	Accuracy	92.5	—	Unverified
3	SMART-BERT	Dev Pearson Correlation	90	—	Unverified
4	MT-DNN-SMART	Pearson Correlation	0.93	—	Unverified
5	StructBERTRoBERTa ensemble	Pearson Correlation	0.93	—	Unverified
6	Mnet-Sim	Pearson Correlation	0.93	—	Unverified
7	XLNet (single model)	Pearson Correlation	0.93	—	Unverified
8	ALBERT	Pearson Correlation	0.93	—	Unverified
9	T5-11B	Pearson Correlation	0.93	—	Unverified
10	RoBERTa	Pearson Correlation	0.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AnglE-UAE	Spearman Correlation	84.54	—	Unverified
2	ST5-XXL	Spearman Correlation	82.63	—	Unverified
3	ST5-Large	Spearman Correlation	81.83	—	Unverified
4	ST5-XL	Spearman Correlation	81.66	—	Unverified
5	ST5-Base	Spearman Correlation	81.14	—	Unverified
6	MPNet-multilingual	Spearman Correlation	80.73	—	Unverified
7	SGPT-5.8B-nli	Spearman Correlation	80.53	—	Unverified
8	MPNet	Spearman Correlation	80.28	—	Unverified
9	MiniLM-L12	Spearman Correlation	79.8	—	Unverified
10	SimCSE-BERT-sup	Spearman Correlation	79.12	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MT-DNN-SMART	Accuracy	93.7	—	Unverified
2	ALBERT	Accuracy	93.4	—	Unverified
3	RoBERTa (ensemble)	Accuracy	92.3	—	Unverified
4	BigBird	F1	91.5	—	Unverified
5	StructBERTRoBERTa ensemble	Accuracy	91.5	—	Unverified
6	FLOATER-large	Accuracy	91.4	—	Unverified
7	SMART	Accuracy	91.3	—	Unverified
8	RoBERTa-large 355M (MLP quantized vector-wise, fine-tuned)	Accuracy	91	—	Unverified
9	RoBERTa-large 355M + Entailment as Few-shot Learner	F1	91	—	Unverified
10	SpanBERT	Accuracy	90.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromCSE-RoBERTa-large (0.355B)	Spearman Correlation	0.82	—	Unverified
2	PromptEOL+CSE+LLaMA-30B	Spearman Correlation	0.82	—	Unverified
3	PromptEOL+CSE+OPT-13B	Spearman Correlation	0.82	—	Unverified
4	SimCSE-RoBERTalarge	Spearman Correlation	0.82	—	Unverified
5	PromptEOL+CSE+OPT-2.7B	Spearman Correlation	0.81	—	Unverified
6	SentenceBERT	Spearman Correlation	0.75	—	Unverified
7	SRoBERTa-NLI-base	Spearman Correlation	0.74	—	Unverified
8	SRoBERTa-NLI-large	Spearman Correlation	0.74	—	Unverified
9	Dino (STS/̄🦕)	Spearman Correlation	0.74	—	Unverified
10	SBERT-NLI-large	Spearman Correlation	0.74	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AnglE-LLaMA-7B	Spearman Correlation	0.91	—	Unverified
2	AnglE-LLaMA-7B-v2	Spearman Correlation	0.91	—	Unverified
3	PromptEOL+CSE+LLaMA-30B	Spearman Correlation	0.9	—	Unverified
4	PromptEOL+CSE+OPT-13B	Spearman Correlation	0.9	—	Unverified
5	PromptEOL+CSE+OPT-2.7B	Spearman Correlation	0.9	—	Unverified
6	PromCSE-RoBERTa-large (0.355B)	Spearman Correlation	0.89	—	Unverified
7	Trans-Encoder-BERT-large-bi (unsup.)	Spearman Correlation	0.89	—	Unverified
8	Trans-Encoder-BERT-large-cross (unsup.)	Spearman Correlation	0.88	—	Unverified
9	Trans-Encoder-RoBERTa-large-cross (unsup.)	Spearman Correlation	0.88	—	Unverified
10	SimCSE-RoBERTa-large	Spearman Correlation	0.87	—	Unverified