Semantic Textual Similarity

Semantic textual similarity deals with determining how similar two pieces of texts are. This can take the form of assigning a score from 1 to 5. Related tasks are paraphrase or duplicate identification.

Image source: Learning Semantic Textual Similarity from Conversations

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 201–250 of 2381 papers

Title	Date	Tasks	Status	Hype
Sentence-T5: Scalable Sentence Encoders from Pre-trained Text-to-Text Models	Aug 19, 2021	Contrastive LearningDecoder	CodeCode Available	1
Instance Similarity Learning for Unsupervised Feature Representation	Aug 5, 2021	image-classificationImage Classification	CodeCode Available	1
Bootstrapped Unsupervised Sentence Representation Learning	Aug 1, 2021	Representation LearningSemantic Textual Similarity	CodeCode Available	1
Multimodal Representation for Neural Code Search	Jul 2, 2021	Code SearchSemantic Similarity	CodeCode Available	1
Charformer: Fast Character Transformers via Gradient-based Subword Tokenization	Jun 23, 2021	Inductive BiasLinguistic Acceptability	CodeCode Available	1
Catch-A-Waveform: Learning to Generate Audio from a Single Short Example	Jun 11, 2021	Audio GenerationSemantic Similarity	CodeCode Available	1
Entity Concept-enhanced Few-shot Relation Extraction	Jun 4, 2021	RelationRelation Extraction	CodeCode Available	1
Self-Supervised Document Similarity Ranking via Contextualized Language Models and Hierarchical Inference	Jun 2, 2021	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	1
A Semantic-based Method for Unsupervised Commonsense Question Answering	May 31, 2021	Question AnsweringSemantic Similarity	CodeCode Available	1
ConSERT: A Contrastive Framework for Self-Supervised Sentence Representation Transfer	May 25, 2021	Contrastive LearningSemantic Textual Similarity	CodeCode Available	1
Cross-lingual Text Classification with Heterogeneous Graph Neural Network	May 24, 2021	ClassificationGraph Neural Network	CodeCode Available	1
KLUE: Korean Language Understanding Evaluation	May 20, 2021	Dependency ParsingDialogue State Tracking	CodeCode Available	1
Long Text Generation by Modeling Sentence-Level and Discourse-Level Coherence	May 19, 2021	DecoderSemantic Similarity	CodeCode Available	1
Predicting Gene-Disease Associations with Knowledge Graph Embeddings over Multiple Ontologies	May 11, 2021	Knowledge Graph EmbeddingsSemantic Similarity	CodeCode Available	1
FNet: Mixing Tokens with Fourier Transforms	May 9, 2021	Linguistic AcceptabilityMachine Translation	CodeCode Available	1
Paraphrastic Representations at Scale	Apr 30, 2021	CPUGPU	CodeCode Available	1
Entailment as Few-Shot Learner	Apr 29, 2021	Contrastive LearningData Augmentation	CodeCode Available	1
Semantic similarity metrics for learned image registration	Apr 20, 2021	Image RegistrationSemantic Similarity	CodeCode Available	1
R&R: Metric-guided Adversarial Sentence Generation	Apr 17, 2021	Adversarial AttackGeneral Classification	CodeCode Available	1
Fast, Effective, and Self-Supervised: Transforming Masked Language Models into Universal Lexical and Sentence Encoders	Apr 16, 2021	Contrastive LearningCross-Lingual Semantic Textual Similarity	CodeCode Available	1
Generating Datasets with Pretrained Language Models	Apr 15, 2021	Semantic Textual SimilaritySentence	CodeCode Available	1
How to Train BERT with an Academic Budget	Apr 15, 2021	Language ModelingLanguage Modelling	CodeCode Available	1
TSDAE: Using Transformer-based Sequential Denoising Auto-Encoder for Unsupervised Sentence Embedding Learning	Apr 14, 2021	DenoisingDomain Adaptation	CodeCode Available	1
SQN: Weakly-Supervised Semantic Segmentation of Large-Scale 3D Point Clouds	Apr 11, 2021	Semantic SegmentationSemantic Similarity	CodeCode Available	1
Disentangling Semantics and Syntax in Sentence Embeddings with Pre-trained Language Models	Apr 11, 2021	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	1
Automated radiology report generation using conditioned transformers	Mar 26, 2021	Medical Report GenerationSemantic Similarity	CodeCode Available	1
PatentSBERTa: A Deep NLP based Hybrid Model for Patent Distance and Classification using Augmented SBERT	Mar 22, 2021	ClassificationGeneral Classification	CodeCode Available	1
On Semantic Similarity in Video Retrieval	Mar 18, 2021	RetrievalSemantic Similarity	CodeCode Available	1
SPICE: Semantic Pseudo-labeling for Image Clustering	Mar 17, 2021	ClusteringContrastive Learning	CodeCode Available	1
Real-time Relevant Recommendation Suggestion	Mar 8, 2021	Mixture-of-ExpertsRecommendation Systems	CodeCode Available	1
Scalable Learning With a Structural Recurrent Neural Network for Short-Term Traffic Prediction	Mar 3, 2021	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	1
Distributional Formal Semantics	Mar 2, 2021	NegationSemantic Similarity	CodeCode Available	1
Unsupervised Extractive Summarization using Pointwise Mutual Information	Feb 11, 2021	ArticlesExtractive Summarization	CodeCode Available	1
Nyströmformer: A Nyström-Based Algorithm for Approximating Self-Attention	Feb 7, 2021	Natural Language InferenceQuestion Answering	CodeCode Available	1
Deep Representational Re-tuning using Contrastive Tension	Jan 1, 2021	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	1
Generating Natural Language Attacks in a Hard Label Black Box Setting	Dec 29, 2020	Adversarial TextSemantic Similarity	CodeCode Available	1
Intrinsic Dimensionality Explains the Effectiveness of Language Model Fine-Tuning	Dec 22, 2020	Generalization BoundsLanguage Modeling	CodeCode Available	1
RealFormer: Transformer Likes Residual Attention	Dec 21, 2020	Language ModelingLanguage Modelling	CodeCode Available	1
MASKER: Masked Keyword Regularization for Reliable Text Classification	Dec 17, 2020	ClassificationDomain Generalization	CodeCode Available	1
Extended Few-Shot Learning: Exploiting Existing Resources for Novel Tasks	Dec 13, 2020	Few-Shot Image ClassificationFew-Shot Learning	CodeCode Available	1
SemMT: A Semantic-based Testing Approach for Machine Translation Systems	Dec 3, 2020	Machine TranslationSemantic Similarity	CodeCode Available	1
DeepSim: Semantic similarity metrics for learned image registration	Nov 11, 2020	Image RegistrationSemantic Similarity	CodeCode Available	1
CODER: Knowledge infused cross-lingual medical term embedding for term normalization	Nov 5, 2020	Contrastive LearningKnowledge Graphs	CodeCode Available	1
On the Sentence Embeddings from Pre-trained Language Models	Nov 2, 2020	Language ModelingLanguage Modelling	CodeCode Available	1
A Statistical Framework for Low-bitwidth Training of Deep Neural Networks	Oct 27, 2020	Linguistic AcceptabilityNatural Language Inference	CodeCode Available	1
Unsupervised Image-to-Image Translation via Pre-trained StyleGAN2 Network	Oct 12, 2020	ColorizationDiversity	CodeCode Available	1
ComStreamClust: a communicative multi-agent approach to text clustering in streaming data	Oct 11, 2020	ClusteringSemantic Similarity	CodeCode Available	1
Retrieve and Refine: Exemplar-based Neural Comment Generation	Oct 9, 2020	Code Comment GenerationComment Generation	CodeCode Available	1
An Unsupervised Sentence Embedding Method by Mutual Information Maximization	Sep 25, 2020	ClusteringSelf-Supervised Learning	CodeCode Available	1
Weak-shot Fine-grained Classification via Similarity Transfer	Sep 19, 2020	ClassificationGeneral Classification	CodeCode Available	1

Show:10 25 50

← PrevPage 5 of 48Next →

All datasets STS Benchmark MTEB MRPC SICK STS13 STS14 STS12 STS15 STS16 MRPC Dev SentEval SICK-R

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	SMARTRoBERTa	Dev Pearson Correlation	92.8	—	Unverified
2	DeBERTa (large)	Accuracy	92.5	—	Unverified
3	SMART-BERT	Dev Pearson Correlation	90	—	Unverified
4	MT-DNN-SMART	Pearson Correlation	0.93	—	Unverified
5	StructBERTRoBERTa ensemble	Pearson Correlation	0.93	—	Unverified
6	Mnet-Sim	Pearson Correlation	0.93	—	Unverified
7	XLNet (single model)	Pearson Correlation	0.93	—	Unverified
8	ALBERT	Pearson Correlation	0.93	—	Unverified
9	T5-11B	Pearson Correlation	0.93	—	Unverified
10	RoBERTa	Pearson Correlation	0.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AnglE-UAE	Spearman Correlation	84.54	—	Unverified
2	ST5-XXL	Spearman Correlation	82.63	—	Unverified
3	ST5-Large	Spearman Correlation	81.83	—	Unverified
4	ST5-XL	Spearman Correlation	81.66	—	Unverified
5	ST5-Base	Spearman Correlation	81.14	—	Unverified
6	MPNet-multilingual	Spearman Correlation	80.73	—	Unverified
7	SGPT-5.8B-nli	Spearman Correlation	80.53	—	Unverified
8	MPNet	Spearman Correlation	80.28	—	Unverified
9	MiniLM-L12	Spearman Correlation	79.8	—	Unverified
10	SimCSE-BERT-sup	Spearman Correlation	79.12	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MT-DNN-SMART	Accuracy	93.7	—	Unverified
2	ALBERT	Accuracy	93.4	—	Unverified
3	RoBERTa (ensemble)	Accuracy	92.3	—	Unverified
4	BigBird	F1	91.5	—	Unverified
5	StructBERTRoBERTa ensemble	Accuracy	91.5	—	Unverified
6	FLOATER-large	Accuracy	91.4	—	Unverified
7	SMART	Accuracy	91.3	—	Unverified
8	RoBERTa-large 355M (MLP quantized vector-wise, fine-tuned)	Accuracy	91	—	Unverified
9	RoBERTa-large 355M + Entailment as Few-shot Learner	F1	91	—	Unverified
10	SpanBERT	Accuracy	90.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromCSE-RoBERTa-large (0.355B)	Spearman Correlation	0.82	—	Unverified
2	PromptEOL+CSE+LLaMA-30B	Spearman Correlation	0.82	—	Unverified
3	PromptEOL+CSE+OPT-13B	Spearman Correlation	0.82	—	Unverified
4	SimCSE-RoBERTalarge	Spearman Correlation	0.82	—	Unverified
5	PromptEOL+CSE+OPT-2.7B	Spearman Correlation	0.81	—	Unverified
6	SentenceBERT	Spearman Correlation	0.75	—	Unverified
7	SRoBERTa-NLI-base	Spearman Correlation	0.74	—	Unverified
8	SRoBERTa-NLI-large	Spearman Correlation	0.74	—	Unverified
9	Dino (STS/̄🦕)	Spearman Correlation	0.74	—	Unverified
10	SBERT-NLI-large	Spearman Correlation	0.74	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AnglE-LLaMA-7B	Spearman Correlation	0.91	—	Unverified
2	AnglE-LLaMA-7B-v2	Spearman Correlation	0.91	—	Unverified
3	PromptEOL+CSE+LLaMA-30B	Spearman Correlation	0.9	—	Unverified
4	PromptEOL+CSE+OPT-13B	Spearman Correlation	0.9	—	Unverified
5	PromptEOL+CSE+OPT-2.7B	Spearman Correlation	0.9	—	Unverified
6	PromCSE-RoBERTa-large (0.355B)	Spearman Correlation	0.89	—	Unverified
7	Trans-Encoder-BERT-large-bi (unsup.)	Spearman Correlation	0.89	—	Unverified
8	Trans-Encoder-BERT-large-cross (unsup.)	Spearman Correlation	0.88	—	Unverified
9	Trans-Encoder-RoBERTa-large-cross (unsup.)	Spearman Correlation	0.88	—	Unverified
10	SimCSE-RoBERTa-large	Spearman Correlation	0.87	—	Unverified