Semantic Textual Similarity

Semantic textual similarity deals with determining how similar two pieces of texts are. This can take the form of assigning a score from 1 to 5. Related tasks are paraphrase or duplicate identification.

Image source: Learning Semantic Textual Similarity from Conversations

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1276–1300 of 2381 papers

Title	Date	Tasks	Status
Towards a Gold Standard for Evaluating Danish Word Embeddings	May 1, 2020	Semantic SimilaritySemantic Textual Similarity	—Unverified
Multilingual Corpus Creation for Multilingual Semantic Similarity Task	May 1, 2020	Semantic SimilaritySemantic Textual Similarity	—Unverified
Towards Automatic Thesaurus Construction and Enrichment.	May 1, 2020	Semantic SimilaritySemantic Textual Similarity	—Unverified
A French Corpus for Semantic Similarity	May 1, 2020	Information RetrievalMachine Translation	—Unverified
MSD-1030: A Well-built Multi-Sense Evaluation Dataset for Sense Representation Models	May 1, 2020	Semantic SimilaritySemantic Textual Similarity	—Unverified
Spatial Multi-Arrangement for Clustering and Multi-way Similarity Dataset Construction	May 1, 2020	ClusteringSemantic Similarity	—Unverified
A Thesaurus for Biblical Hebrew	May 1, 2020	Semantic SimilaritySemantic Textual Similarity	—Unverified
Urban Dictionary Embeddings for Slang NLP Applications	May 1, 2020	ClusteringSarcasm Detection	—Unverified
Legal-ES: A Set of Large Scale Resources for Spanish Legal Text Processing	May 1, 2020	NavigateSemantic Similarity	—Unverified
Extrapolating Binder Style Word Embeddings to New Words	May 1, 2020	Semantic SimilaritySemantic Textual Similarity	—Unverified
Representing Verbs with Visual Argument Vectors	May 1, 2020	Semantic SimilaritySemantic Textual Similarity	—Unverified
Word Embedding Evaluation in Downstream Tasks and Semantic Analogies	May 1, 2020	named-entity-recognitionNamed Entity Recognition	—Unverified
Combining Word Embeddings and N-grams for Unsupervised Document Summarization	Apr 25, 2020	DiversityDocument Summarization	—Unverified
On Adversarial Examples for Biomedical NLP Tasks	Apr 23, 2020	Language ModelingLanguage Modelling	—Unverified
Evolution of Semantic Similarity -- A Survey	Apr 19, 2020	Semantic SimilaritySemantic Textual Similarity	—Unverified
Style-transfer and Paraphrase: Looking for a Sensible Semantic Similarity Metric	Apr 10, 2020	Machine TranslationSemantic Similarity	—Unverified
MobileBERT: a Compact Task-Agnostic BERT for Resource-Limited Devices	Apr 6, 2020	Natural Language InferenceQuestion Answering	CodeCode Available
Beyond Background-Aware Correlation Filters: Adaptive Context Modeling by Hand-Crafted and Deep RGB Features for Visual Tracking	Apr 6, 2020	Semantic SimilaritySemantic Textual Similarity	—Unverified
A random forest based computational model for predicting novel lncRNA-disease associations	Mar 27, 2020	feature selectionPrediction	CodeCode Available
Multi-SimLex: A Large-Scale Evaluation of Multilingual and Cross-Lingual Lexical Semantic Similarity	Mar 10, 2020	Cross-Lingual Word EmbeddingsRepresentation Learning	—Unverified
Unifying Specialist Image Embedding into Universal Image Embedding	Mar 8, 2020	Face VerificationImage Retrieval	—Unverified
Friend Recommendation based on Hashtags Analysis	Mar 7, 2020	ClusteringRecommendation Systems	—Unverified
Comment Ranking Diversification in Forum Discussions	Feb 27, 2020	Re-RankingSemantic Similarity	CodeCode Available
A Quadruplet Loss for Enforcing Semantically Coherent Embeddings in Multi-output Classification Problems	Feb 26, 2020	General ClassificationRetrieval	CodeCode Available
Language-Independent Tokenisation Rivals Language-Specific Tokenisation for Word Similarity Prediction	Feb 25, 2020	Semantic SimilaritySemantic Textual Similarity	—Unverified

Show:10 25 50

← PrevPage 52 of 96Next →

All datasets STS Benchmark MTEB MRPC SICK STS13 STS14 STS12 STS15 STS16 MRPC Dev SentEval SICK-R

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	SMARTRoBERTa	Dev Pearson Correlation	92.8	—	Unverified
2	DeBERTa (large)	Accuracy	92.5	—	Unverified
3	SMART-BERT	Dev Pearson Correlation	90	—	Unverified
4	MT-DNN-SMART	Pearson Correlation	0.93	—	Unverified
5	StructBERTRoBERTa ensemble	Pearson Correlation	0.93	—	Unverified
6	Mnet-Sim	Pearson Correlation	0.93	—	Unverified
7	XLNet (single model)	Pearson Correlation	0.93	—	Unverified
8	ALBERT	Pearson Correlation	0.93	—	Unverified
9	T5-11B	Pearson Correlation	0.93	—	Unverified
10	RoBERTa	Pearson Correlation	0.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AnglE-UAE	Spearman Correlation	84.54	—	Unverified
2	ST5-XXL	Spearman Correlation	82.63	—	Unverified
3	ST5-Large	Spearman Correlation	81.83	—	Unverified
4	ST5-XL	Spearman Correlation	81.66	—	Unverified
5	ST5-Base	Spearman Correlation	81.14	—	Unverified
6	MPNet-multilingual	Spearman Correlation	80.73	—	Unverified
7	SGPT-5.8B-nli	Spearman Correlation	80.53	—	Unverified
8	MPNet	Spearman Correlation	80.28	—	Unverified
9	MiniLM-L12	Spearman Correlation	79.8	—	Unverified
10	SimCSE-BERT-sup	Spearman Correlation	79.12	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MT-DNN-SMART	Accuracy	93.7	—	Unverified
2	ALBERT	Accuracy	93.4	—	Unverified
3	RoBERTa (ensemble)	Accuracy	92.3	—	Unverified
4	BigBird	F1	91.5	—	Unverified
5	StructBERTRoBERTa ensemble	Accuracy	91.5	—	Unverified
6	FLOATER-large	Accuracy	91.4	—	Unverified
7	SMART	Accuracy	91.3	—	Unverified
8	RoBERTa-large 355M (MLP quantized vector-wise, fine-tuned)	Accuracy	91	—	Unverified
9	RoBERTa-large 355M + Entailment as Few-shot Learner	F1	91	—	Unverified
10	SpanBERT	Accuracy	90.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromCSE-RoBERTa-large (0.355B)	Spearman Correlation	0.82	—	Unverified
2	PromptEOL+CSE+LLaMA-30B	Spearman Correlation	0.82	—	Unverified
3	PromptEOL+CSE+OPT-13B	Spearman Correlation	0.82	—	Unverified
4	SimCSE-RoBERTalarge	Spearman Correlation	0.82	—	Unverified
5	PromptEOL+CSE+OPT-2.7B	Spearman Correlation	0.81	—	Unverified
6	SentenceBERT	Spearman Correlation	0.75	—	Unverified
7	SRoBERTa-NLI-base	Spearman Correlation	0.74	—	Unverified
8	SRoBERTa-NLI-large	Spearman Correlation	0.74	—	Unverified
9	Dino (STS/̄🦕)	Spearman Correlation	0.74	—	Unverified
10	SBERT-NLI-large	Spearman Correlation	0.74	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AnglE-LLaMA-7B	Spearman Correlation	0.91	—	Unverified
2	AnglE-LLaMA-7B-v2	Spearman Correlation	0.91	—	Unverified
3	PromptEOL+CSE+LLaMA-30B	Spearman Correlation	0.9	—	Unverified
4	PromptEOL+CSE+OPT-13B	Spearman Correlation	0.9	—	Unverified
5	PromptEOL+CSE+OPT-2.7B	Spearman Correlation	0.9	—	Unverified
6	PromCSE-RoBERTa-large (0.355B)	Spearman Correlation	0.89	—	Unverified
7	Trans-Encoder-BERT-large-bi (unsup.)	Spearman Correlation	0.89	—	Unverified
8	Trans-Encoder-BERT-large-cross (unsup.)	Spearman Correlation	0.88	—	Unverified
9	Trans-Encoder-RoBERTa-large-cross (unsup.)	Spearman Correlation	0.88	—	Unverified
10	SimCSE-RoBERTa-large	Spearman Correlation	0.87	—	Unverified