Semantic Textual Similarity

Semantic textual similarity deals with determining how similar two pieces of texts are. This can take the form of assigning a score from 1 to 5. Related tasks are paraphrase or duplicate identification.

Image source: Learning Semantic Textual Similarity from Conversations

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1551–1575 of 2381 papers

Title	Date	Tasks	Status
A Rank-Based Similarity Metric for Word Embeddings	May 4, 2018	ClusteringOutlier Detection	—Unverified
Semantic Structure-based Unsupervised Deep Hashing	May 1, 2018	Deep HashingSemantic Similarity	CodeCode Available
KIT-Multi: A Translation-Oriented Multilingual Embedding Corpus	May 1, 2018	Cross-Lingual Document ClassificationDocument Classification	—Unverified
Analyzing Citation-Distance Networks for Evaluating Publication Impact	May 1, 2018	Semantic Textual Similarity	—Unverified
A Multilingual Dataset for Evaluating Parallel Sentence Extraction from Comparable Corpora	May 1, 2018	Machine TranslationSemantic Textual Similarity	—Unverified
Creating Large-Scale Multilingual Cognate Tables	May 1, 2018	Machine TranslationSemantic Textual Similarity	CodeCode Available
Metaphor Suggestions based on a Semantic Metaphor Repository	May 1, 2018	Semantic Textual SimilarityTopic Models	—Unverified
SemR-11: A Multi-Lingual Gold-Standard for Semantic Similarity and Relatedness for Eleven Languages	May 1, 2018	Information RetrievalMachine Translation	—Unverified
Indra: A Word Embedding and Semantic Relatedness Server	May 1, 2018	Semantic Textual Similarity	CodeCode Available
Retrofitting Word Representations for Unsupervised Sense Aware Word Similarities	May 1, 2018	Named Entity Recognition (NER)Question Answering	—Unverified
A Survey on Automatically-Constructed WordNets and their Evaluation: Lexical and Word Embedding-based Approaches	May 1, 2018	Semantic Textual SimilarityText Summarization	—Unverified
A Large Resource of Patterns for Verbal Paraphrases	May 1, 2018	Natural Language InferenceSemantic Textual Similarity	—Unverified
Acquiring Verb Classes Through Bottom-Up Semantic Verb Clustering	May 1, 2018	ClusteringSemantic Textual Similarity	—Unverified
Knowing the Author by the Company His Words Keep	May 1, 2018	Semantic Textual SimilarityWord Embeddings	—Unverified
Lexical and Semantic Features for Cross-lingual Text Reuse Classification: an Experiment in English and Latin Paraphrases	May 1, 2018	General ClassificationSemantic Textual Similarity	—Unverified
Towards a Gold Standard Corpus for Variable Detection and Linking in Social Science Publications	May 1, 2018	Entity LinkingNatural Language Inference	—Unverified
ETPC - A Paraphrase Identification Corpus Annotated with Extended Paraphrase Typology and Negation	May 1, 2018	Natural Language InferenceNegation	CodeCode Available
Fine-grained Semantic Textual Similarity for Serbian	May 1, 2018	Information RetrievalMachine Translation	—Unverified
Urdu Word Embeddings	May 1, 2018	Semantic Textual SimilarityWord Embeddings	CodeCode Available
Contextualized Usage-Based Material Selection	May 1, 2018	Language AcquisitionSemantic Textual Similarity	—Unverified
FrNewsLink : a corpus linking TV Broadcast News Segments and Press Articles	May 1, 2018	ArticlesQuestion Similarity	—Unverified
Social Image Tags as a Source of Word Embeddings: A Task-oriented Evaluation	May 1, 2018	Semantic Textual SimilarityWord Embeddings	—Unverified
A Multilingual Wikified Data Set of Educational Material	May 1, 2018	Cross-Lingual Semantic Textual SimilarityMachine Translation	—Unverified
Automatic Thesaurus Construction for Modern Hebrew	May 1, 2018	Machine TranslationQuestion Answering	—Unverified
OPA2Vec: combining formal and informal content of biomedical ontologies to improve similarity-based prediction	Apr 29, 2018	Semantic SimilaritySemantic Textual Similarity	CodeCode Available

Show:10 25 50

← PrevPage 63 of 96Next →

All datasets STS Benchmark MTEB MRPC SICK STS13 STS14 STS12 STS15 STS16 MRPC Dev SentEval SICK-R

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	SMARTRoBERTa	Dev Pearson Correlation	92.8	—	Unverified
2	DeBERTa (large)	Accuracy	92.5	—	Unverified
3	SMART-BERT	Dev Pearson Correlation	90	—	Unverified
4	MT-DNN-SMART	Pearson Correlation	0.93	—	Unverified
5	StructBERTRoBERTa ensemble	Pearson Correlation	0.93	—	Unverified
6	Mnet-Sim	Pearson Correlation	0.93	—	Unverified
7	XLNet (single model)	Pearson Correlation	0.93	—	Unverified
8	ALBERT	Pearson Correlation	0.93	—	Unverified
9	T5-11B	Pearson Correlation	0.93	—	Unverified
10	RoBERTa	Pearson Correlation	0.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AnglE-UAE	Spearman Correlation	84.54	—	Unverified
2	ST5-XXL	Spearman Correlation	82.63	—	Unverified
3	ST5-Large	Spearman Correlation	81.83	—	Unverified
4	ST5-XL	Spearman Correlation	81.66	—	Unverified
5	ST5-Base	Spearman Correlation	81.14	—	Unverified
6	MPNet-multilingual	Spearman Correlation	80.73	—	Unverified
7	SGPT-5.8B-nli	Spearman Correlation	80.53	—	Unverified
8	MPNet	Spearman Correlation	80.28	—	Unverified
9	MiniLM-L12	Spearman Correlation	79.8	—	Unverified
10	SimCSE-BERT-sup	Spearman Correlation	79.12	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MT-DNN-SMART	Accuracy	93.7	—	Unverified
2	ALBERT	Accuracy	93.4	—	Unverified
3	RoBERTa (ensemble)	Accuracy	92.3	—	Unverified
4	BigBird	F1	91.5	—	Unverified
5	StructBERTRoBERTa ensemble	Accuracy	91.5	—	Unverified
6	FLOATER-large	Accuracy	91.4	—	Unverified
7	SMART	Accuracy	91.3	—	Unverified
8	RoBERTa-large 355M (MLP quantized vector-wise, fine-tuned)	Accuracy	91	—	Unverified
9	RoBERTa-large 355M + Entailment as Few-shot Learner	F1	91	—	Unverified
10	SpanBERT	Accuracy	90.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromCSE-RoBERTa-large (0.355B)	Spearman Correlation	0.82	—	Unverified
2	PromptEOL+CSE+LLaMA-30B	Spearman Correlation	0.82	—	Unverified
3	PromptEOL+CSE+OPT-13B	Spearman Correlation	0.82	—	Unverified
4	SimCSE-RoBERTalarge	Spearman Correlation	0.82	—	Unverified
5	PromptEOL+CSE+OPT-2.7B	Spearman Correlation	0.81	—	Unverified
6	SentenceBERT	Spearman Correlation	0.75	—	Unverified
7	SRoBERTa-NLI-base	Spearman Correlation	0.74	—	Unverified
8	SRoBERTa-NLI-large	Spearman Correlation	0.74	—	Unverified
9	Dino (STS/̄🦕)	Spearman Correlation	0.74	—	Unverified
10	SBERT-NLI-large	Spearman Correlation	0.74	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AnglE-LLaMA-7B	Spearman Correlation	0.91	—	Unverified
2	AnglE-LLaMA-7B-v2	Spearman Correlation	0.91	—	Unverified
3	PromptEOL+CSE+LLaMA-30B	Spearman Correlation	0.9	—	Unverified
4	PromptEOL+CSE+OPT-13B	Spearman Correlation	0.9	—	Unverified
5	PromptEOL+CSE+OPT-2.7B	Spearman Correlation	0.9	—	Unverified
6	PromCSE-RoBERTa-large (0.355B)	Spearman Correlation	0.89	—	Unverified
7	Trans-Encoder-BERT-large-bi (unsup.)	Spearman Correlation	0.89	—	Unverified
8	Trans-Encoder-BERT-large-cross (unsup.)	Spearman Correlation	0.88	—	Unverified
9	Trans-Encoder-RoBERTa-large-cross (unsup.)	Spearman Correlation	0.88	—	Unverified
10	SimCSE-RoBERTa-large	Spearman Correlation	0.87	—	Unverified