Semantic Textual Similarity

Semantic textual similarity deals with determining how similar two pieces of texts are. This can take the form of assigning a score from 1 to 5. Related tasks are paraphrase or duplicate identification.

Image source: Learning Semantic Textual Similarity from Conversations

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1201–1250 of 2381 papers

Title	Date	Tasks	Status	Hype
Effective Transfer Learning for Identifying Similar Questions: Matching User Questions to COVID-19 FAQs	Aug 4, 2020	Question AnsweringQuestion Similarity	—Unverified	0
Measuring prominence of scientific work in online news as a proxy for impact	Jul 28, 2020	ArticlesSemantic Similarity	—Unverified	0
Big Bird: Transformers for Longer Sequences	Jul 28, 2020	Linguistic AcceptabilityNatural Language Inference	CodeCode Available	1
Hard negative examples are hard, but useful	Jul 24, 2020	Image RetrievalMetric Learning	CodeCode Available	1
Check_square at CheckThat! 2020: Claim Detection in Social Media via Fusion of Transformer and Syntactic Features	Jul 21, 2020	Fact CheckingRetrieval	CodeCode Available	0
Mono vs Multilingual Transformer-based Models: a Comparison across Several Language Tasks	Jul 19, 2020	Fake News DetectionLanguage Modeling	CodeCode Available	0
Logic Constrained Pointer Networks for Interpretable Textual Similarity	Jul 15, 2020	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	0
CORD19STS: COVID-19 Semantic Textual Similarity Dataset	Jul 5, 2020	Information RetrievalLanguage Modelling	—Unverified	0
Unsupervised Paraphrasing via Deep Reinforcement Learning	Jul 5, 2020	Deep Reinforcement LearningDiversity	—Unverified	0
Language-agnostic BERT Sentence Embedding	Jul 3, 2020	Language ModelingLanguage Modelling	CodeCode Available	1
Unsupervised Semantic Hashing with Pairwise Reconstruction	Jul 1, 2020	DecoderSemantic Similarity	CodeCode Available	0
DeSpin: a prototype system for detecting spin in biomedical publications	Jul 1, 2020	ArticlesRelation Extraction	—Unverified	0
Evaluating the Utility of Model Configurations and Data Augmentation on Clinical Semantic Textual Similarity	Jul 1, 2020	Data AugmentationSemantic Textual Similarity	—Unverified	0
Estimating Mutual Information Between Dense Word Embeddings	Jul 1, 2020	Semantic Textual SimilaritySTS	—Unverified	0
Text Classification with Negative Supervision	Jul 1, 2020	ClassificationGeneral Classification	—Unverified	0
tBERT: Topic Models and BERT Joining Forces for Semantic Similarity Detection	Jul 1, 2020	Natural Language UnderstandingSemantic Similarity	CodeCode Available	1
A Deep Reinforced Model for Zero-Shot Cross-Lingual Summarization with Bilingual Semantic Similarity Rewards	Jun 27, 2020	Machine Translationreinforcement-learning	CodeCode Available	1
Class-Similarity Based Label Smoothing for Confidence Calibration	Jun 24, 2020	Decision MakingSemantic Similarity	—Unverified	0
Exploiting Non-Taxonomic Relations for Measuring Semantic Similarity and Relatedness in WordNet	Jun 22, 2020	ClusteringInformation Retrieval	—Unverified	0
SqueezeBERT: What can computer vision teach NLP about efficient neural networks?	Jun 19, 2020	Linguistic AcceptabilityNatural Language Inference	CodeCode Available	0
Canonicalizing Open Knowledge Bases with Multi-Layered Meta-Graph Neural Network	Jun 17, 2020	Graph Neural NetworkNoun Phrase Canonicalization	—Unverified	0
MixMOOD: A systematic approach to class distribution mismatch in semi-supervised learning using deep dataset dissimilarity measures	Jun 14, 2020	Multi-class ClassificationSemantic Similarity	CodeCode Available	0
DeBERTa: Decoding-enhanced BERT with Disentangled Attention	Jun 5, 2020	Common Sense ReasoningCoreference Resolution	CodeCode Available	2
Approche supervis\'ee de calcul de similarit\'e s\'emantique entre paires de phrases (Supervised approach to compute semantic similarity between sentence pairs)	Jun 1, 2020	Semantic SimilaritySemantic Textual Similarity	—Unverified	0
Shoestring: Graph-Based Semi-Supervised Classification With Severely Limited Labeled Data	Jun 1, 2020	ClassificationClustering	—Unverified	0
Multi-Modality Cross Attention Network for Image and Sentence Matching	Jun 1, 2020	Semantic SimilaritySemantic Textual Similarity	—Unverified	0
Automatic Generation of Topic Labels	May 29, 2020	DescriptiveInformation Retrieval	CodeCode Available	1
Boosting Few-Shot Learning With Adaptive Margin Loss	May 28, 2020	Few-Shot Image ClassificationFew-Shot Learning	—Unverified	0
Learning Tversky Similarity	May 27, 2020	Semantic SimilaritySemantic Textual Similarity	—Unverified	0
SueNes: A Weakly Supervised Approach to Evaluating Single-Document Summarization via Negative Sampling	May 13, 2020	Abstractive Text SummarizationDocument Embedding	CodeCode Available	0
Learning to hash with semantic similarity metrics and empirical KL divergence	May 11, 2020	Image RetrievalRetrieval	—Unverified	0
SUPERT: Towards New Frontiers in Unsupervised Evaluation Metrics for Multi-Document Summarization	May 7, 2020	Document SummarizationMulti-Document Summarization	CodeCode Available	1
Autoencoding Pixies: Amortised Variational Inference with Graph Convolutions for Functional Distributional Semantics	May 6, 2020	Language ModelingLanguage Modelling	CodeCode Available	0
Neural CRF Model for Sentence Alignment in Text Simplification	May 5, 2020	ArticlesSemantic Similarity	CodeCode Available	1
Semi-supervised lung nodule retrieval	May 4, 2020	Binary ClassificationContent-Based Image Retrieval	—Unverified	0
Discrete Optimization for Unsupervised Sentence Summarization with Word-Level Extraction	May 4, 2020	Language ModelingLanguage Modelling	CodeCode Available	1
On the Limitations of Cross-lingual Encoders as Exposed by Reference-Free Machine Translation Evaluation	May 3, 2020	Cross-Lingual TransferLanguage Modeling	CodeCode Available	1
Synthesizer: Rethinking Self-Attention in Transformer Models	May 2, 2020	Abstractive Text SummarizationDialogue Generation	CodeCode Available	1
Figure Me Out: A Gold Standard Dataset for Metaphor Interpretation	May 1, 2020	RetrievalSemantic Similarity	—Unverified	0
MSD-1030: A Well-built Multi-Sense Evaluation Dataset for Sense Representation Models	May 1, 2020	Semantic SimilaritySemantic Textual Similarity	—Unverified	0
SAPPHIRE: Simple Aligner for Phrasal Paraphrase with Hierarchical Representation	May 1, 2020	Natural Language InferenceNatural Language Understanding	—Unverified	0
Spatial Multi-Arrangement for Clustering and Multi-way Similarity Dataset Construction	May 1, 2020	ClusteringSemantic Similarity	—Unverified	0
Towards a Gold Standard for Evaluating Danish Word Embeddings	May 1, 2020	Semantic SimilaritySemantic Textual Similarity	—Unverified	0
Representing Verbs with Visual Argument Vectors	May 1, 2020	Semantic SimilaritySemantic Textual Similarity	—Unverified	0
Word Embedding Evaluation in Downstream Tasks and Semantic Analogies	May 1, 2020	named-entity-recognitionNamed Entity Recognition	—Unverified	0
A French Corpus for Semantic Similarity	May 1, 2020	Information RetrievalMachine Translation	—Unverified	0
Urban Dictionary Embeddings for Slang NLP Applications	May 1, 2020	ClusteringSarcasm Detection	—Unverified	0
Building Semantic Grams of Human Knowledge	May 1, 2020	Semantic SimilaritySemantic Textual Similarity	—Unverified	0
Multilingual Corpus Creation for Multilingual Semantic Similarity Task	May 1, 2020	Semantic SimilaritySemantic Textual Similarity	—Unverified	0
Extrapolating Binder Style Word Embeddings to New Words	May 1, 2020	Semantic SimilaritySemantic Textual Similarity	—Unverified	0

Show:10 25 50

← PrevPage 25 of 48Next →

All datasets STS Benchmark MTEB MRPC SICK STS13 STS14 STS12 STS15 STS16 MRPC Dev SentEval SICK-R

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	SMARTRoBERTa	Dev Pearson Correlation	92.8	—	Unverified
2	DeBERTa (large)	Accuracy	92.5	—	Unverified
3	SMART-BERT	Dev Pearson Correlation	90	—	Unverified
4	MT-DNN-SMART	Pearson Correlation	0.93	—	Unverified
5	StructBERTRoBERTa ensemble	Pearson Correlation	0.93	—	Unverified
6	Mnet-Sim	Pearson Correlation	0.93	—	Unverified
7	XLNet (single model)	Pearson Correlation	0.93	—	Unverified
8	ALBERT	Pearson Correlation	0.93	—	Unverified
9	T5-11B	Pearson Correlation	0.93	—	Unverified
10	RoBERTa	Pearson Correlation	0.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AnglE-UAE	Spearman Correlation	84.54	—	Unverified
2	ST5-XXL	Spearman Correlation	82.63	—	Unverified
3	ST5-Large	Spearman Correlation	81.83	—	Unverified
4	ST5-XL	Spearman Correlation	81.66	—	Unverified
5	ST5-Base	Spearman Correlation	81.14	—	Unverified
6	MPNet-multilingual	Spearman Correlation	80.73	—	Unverified
7	SGPT-5.8B-nli	Spearman Correlation	80.53	—	Unverified
8	MPNet	Spearman Correlation	80.28	—	Unverified
9	MiniLM-L12	Spearman Correlation	79.8	—	Unverified
10	SimCSE-BERT-sup	Spearman Correlation	79.12	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MT-DNN-SMART	Accuracy	93.7	—	Unverified
2	ALBERT	Accuracy	93.4	—	Unverified
3	RoBERTa (ensemble)	Accuracy	92.3	—	Unverified
4	BigBird	F1	91.5	—	Unverified
5	StructBERTRoBERTa ensemble	Accuracy	91.5	—	Unverified
6	FLOATER-large	Accuracy	91.4	—	Unverified
7	SMART	Accuracy	91.3	—	Unverified
8	RoBERTa-large 355M (MLP quantized vector-wise, fine-tuned)	Accuracy	91	—	Unverified
9	RoBERTa-large 355M + Entailment as Few-shot Learner	F1	91	—	Unverified
10	SpanBERT	Accuracy	90.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromCSE-RoBERTa-large (0.355B)	Spearman Correlation	0.82	—	Unverified
2	PromptEOL+CSE+LLaMA-30B	Spearman Correlation	0.82	—	Unverified
3	PromptEOL+CSE+OPT-13B	Spearman Correlation	0.82	—	Unverified
4	SimCSE-RoBERTalarge	Spearman Correlation	0.82	—	Unverified
5	PromptEOL+CSE+OPT-2.7B	Spearman Correlation	0.81	—	Unverified
6	SentenceBERT	Spearman Correlation	0.75	—	Unverified
7	SRoBERTa-NLI-base	Spearman Correlation	0.74	—	Unverified
8	SRoBERTa-NLI-large	Spearman Correlation	0.74	—	Unverified
9	Dino (STS/̄🦕)	Spearman Correlation	0.74	—	Unverified
10	SBERT-NLI-large	Spearman Correlation	0.74	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AnglE-LLaMA-7B	Spearman Correlation	0.91	—	Unverified
2	AnglE-LLaMA-7B-v2	Spearman Correlation	0.91	—	Unverified
3	PromptEOL+CSE+LLaMA-30B	Spearman Correlation	0.9	—	Unverified
4	PromptEOL+CSE+OPT-13B	Spearman Correlation	0.9	—	Unverified
5	PromptEOL+CSE+OPT-2.7B	Spearman Correlation	0.9	—	Unverified
6	PromCSE-RoBERTa-large (0.355B)	Spearman Correlation	0.89	—	Unverified
7	Trans-Encoder-BERT-large-bi (unsup.)	Spearman Correlation	0.89	—	Unverified
8	Trans-Encoder-BERT-large-cross (unsup.)	Spearman Correlation	0.88	—	Unverified
9	Trans-Encoder-RoBERTa-large-cross (unsup.)	Spearman Correlation	0.88	—	Unverified
10	SimCSE-RoBERTa-large	Spearman Correlation	0.87	—	Unverified