Semantic Textual Similarity

Semantic textual similarity deals with determining how similar two pieces of texts are. This can take the form of assigning a score from 1 to 5. Related tasks are paraphrase or duplicate identification.

Image source: Learning Semantic Textual Similarity from Conversations

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1551–1600 of 2381 papers

Title	Date	Tasks	Status	Hype
A Rank-Based Similarity Metric for Word Embeddings	May 4, 2018	ClusteringOutlier Detection	—Unverified	0
Semantic Structure-based Unsupervised Deep Hashing	May 1, 2018	Deep HashingSemantic Similarity	CodeCode Available	0
KIT-Multi: A Translation-Oriented Multilingual Embedding Corpus	May 1, 2018	Cross-Lingual Document ClassificationDocument Classification	—Unverified	0
Analyzing Citation-Distance Networks for Evaluating Publication Impact	May 1, 2018	Semantic Textual Similarity	—Unverified	0
A Multilingual Dataset for Evaluating Parallel Sentence Extraction from Comparable Corpora	May 1, 2018	Machine TranslationSemantic Textual Similarity	—Unverified	0
Creating Large-Scale Multilingual Cognate Tables	May 1, 2018	Machine TranslationSemantic Textual Similarity	CodeCode Available	0
Metaphor Suggestions based on a Semantic Metaphor Repository	May 1, 2018	Semantic Textual SimilarityTopic Models	—Unverified	0
SemR-11: A Multi-Lingual Gold-Standard for Semantic Similarity and Relatedness for Eleven Languages	May 1, 2018	Information RetrievalMachine Translation	—Unverified	0
Indra: A Word Embedding and Semantic Relatedness Server	May 1, 2018	Semantic Textual Similarity	CodeCode Available	0
Retrofitting Word Representations for Unsupervised Sense Aware Word Similarities	May 1, 2018	Named Entity Recognition (NER)Question Answering	—Unverified	0
A Survey on Automatically-Constructed WordNets and their Evaluation: Lexical and Word Embedding-based Approaches	May 1, 2018	Semantic Textual SimilarityText Summarization	—Unverified	0
A Large Resource of Patterns for Verbal Paraphrases	May 1, 2018	Natural Language InferenceSemantic Textual Similarity	—Unverified	0
Acquiring Verb Classes Through Bottom-Up Semantic Verb Clustering	May 1, 2018	ClusteringSemantic Textual Similarity	—Unverified	0
Knowing the Author by the Company His Words Keep	May 1, 2018	Semantic Textual SimilarityWord Embeddings	—Unverified	0
Lexical and Semantic Features for Cross-lingual Text Reuse Classification: an Experiment in English and Latin Paraphrases	May 1, 2018	General ClassificationSemantic Textual Similarity	—Unverified	0
Towards a Gold Standard Corpus for Variable Detection and Linking in Social Science Publications	May 1, 2018	Entity LinkingNatural Language Inference	—Unverified	0
ETPC - A Paraphrase Identification Corpus Annotated with Extended Paraphrase Typology and Negation	May 1, 2018	Natural Language InferenceNegation	CodeCode Available	0
Fine-grained Semantic Textual Similarity for Serbian	May 1, 2018	Information RetrievalMachine Translation	—Unverified	0
Urdu Word Embeddings	May 1, 2018	Semantic Textual SimilarityWord Embeddings	CodeCode Available	0
Contextualized Usage-Based Material Selection	May 1, 2018	Language AcquisitionSemantic Textual Similarity	—Unverified	0
FrNewsLink : a corpus linking TV Broadcast News Segments and Press Articles	May 1, 2018	ArticlesQuestion Similarity	—Unverified	0
Social Image Tags as a Source of Word Embeddings: A Task-oriented Evaluation	May 1, 2018	Semantic Textual SimilarityWord Embeddings	—Unverified	0
A Multilingual Wikified Data Set of Educational Material	May 1, 2018	Cross-Lingual Semantic Textual SimilarityMachine Translation	—Unverified	0
Automatic Thesaurus Construction for Modern Hebrew	May 1, 2018	Machine TranslationQuestion Answering	—Unverified	0
OPA2Vec: combining formal and informal content of biomedical ontologies to improve similarity-based prediction	Apr 29, 2018	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	0
An Unsupervised Word Sense Disambiguation System for Under-Resourced Languages	Apr 27, 2018	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	0
Learning Semantic Textual Similarity from Conversations	Apr 20, 2018	Community Question AnsweringNatural Language Inference	CodeCode Available	0
Direct Network Transfer: Transfer Learning of Sentence Embeddings for Semantic Similarity	Apr 20, 2018	Natural Language UnderstandingSemantic Similarity	—Unverified	0
Similarity between Learning Outcomes from Course Objectives using Semantic Analysis, Blooms taxonomy and Corpus statistics	Apr 17, 2018	Semantic SimilaritySemantic Textual Similarity	—Unverified	0
Introducing two Vietnamese Datasets for Evaluating Semantic Models of (Dis-)Similarity and Relatedness	Apr 15, 2018	Semantic SimilaritySemantic Textual Similarity	—Unverified	0
Training a Ranking Function for Open-Domain Question Answering	Apr 12, 2018	Information RetrievalOpen-Domain Question Answering	—Unverified	0
Viewpoint-aware Video Summarization	Apr 9, 2018	Semantic SimilaritySemantic Textual Similarity	—Unverified	0
Incorporating Word Embeddings into Open Directory Project based Large-scale Classification	Apr 3, 2018	ClassificationGeneral Classification	—Unverified	0
DOCK: Detecting Objects by transferring Common-sense Knowledge	Apr 3, 2018	AttributeCommon Sense Reasoning	—Unverified	0
Learning General Purpose Distributed Sentence Representations via Large Scale Multi-task Learning	Mar 30, 2018	Multi-Task LearningNatural Language Inference	CodeCode Available	0
Identifying Semantic Divergences in Parallel Text without Annotations	Mar 29, 2018	Machine TranslationSemantic Similarity	CodeCode Available	0
Universal Sentence Encoder	Mar 29, 2018	Conversational Response SelectionSemantic Textual Similarity	CodeCode Available	1
Neural Network Architecture for Credibility Assessment of Textual Claims	Mar 28, 2018	ArticlesSemantic Similarity	—Unverified	0
Equation Embeddings	Mar 24, 2018	ArticlesSemantic Similarity	—Unverified	0
Near-lossless Binarization of Word Embeddings	Mar 24, 2018	BinarizationSemantic Similarity	CodeCode Available	0
RUSSE: The First Workshop on Russian Semantic Similarity	Mar 15, 2018	Semantic SimilaritySemantic Textual Similarity	—Unverified	0
Enhanced Word Representations for Bridging Anaphora Resolution	Mar 13, 2018	Bridging Anaphora ResolutionSemantic Similarity	—Unverified	0
Beyond Context: Exploring Semantic Similarity for Tiny Face Detection	Mar 5, 2018	Face DetectionMetric Learning	—Unverified	0
Photographic Text-to-Image Synthesis with a Hierarchically-nested Adversarial Network	Feb 26, 2018	Image GenerationSemantic Similarity	CodeCode Available	0
Ad Hoc Table Retrieval using Semantic Similarity	Feb 16, 2018	RetrievalSemantic Similarity	CodeCode Available	0
Calculating the similarity between words and sentences using a lexical database and corpus statistics	Feb 15, 2018	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	0
An Attention-Based Word-Level Interaction Model: Relation Detection for Knowledge Base Question Answering	Jan 30, 2018	Knowledge Base Question AnsweringQuestion Answering	—Unverified	0
Size vs. Structure in Training Corpora for Word Embedding Models: Araneum Russicum Maximum and Russian National Corpus	Jan 19, 2018	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	0
A Resource-Light Method for Cross-Lingual Semantic Textual Similarity	Jan 19, 2018	Cross-Lingual Information RetrievalCross-Lingual Semantic Textual Similarity	CodeCode Available	0
Comparison of Paragram and GloVe Results for Similarity Benchmarks	Jan 1, 2018	Semantic SimilaritySemantic Textual Similarity	—Unverified	0

Show:10 25 50

← PrevPage 32 of 48Next →

All datasets STS Benchmark MTEB MRPC SICK STS13 STS14 STS12 STS15 STS16 MRPC Dev SentEval SICK-R

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	SMARTRoBERTa	Dev Pearson Correlation	92.8	—	Unverified
2	DeBERTa (large)	Accuracy	92.5	—	Unverified
3	SMART-BERT	Dev Pearson Correlation	90	—	Unverified
4	MT-DNN-SMART	Pearson Correlation	0.93	—	Unverified
5	StructBERTRoBERTa ensemble	Pearson Correlation	0.93	—	Unverified
6	Mnet-Sim	Pearson Correlation	0.93	—	Unverified
7	XLNet (single model)	Pearson Correlation	0.93	—	Unverified
8	ALBERT	Pearson Correlation	0.93	—	Unverified
9	T5-11B	Pearson Correlation	0.93	—	Unverified
10	RoBERTa	Pearson Correlation	0.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AnglE-UAE	Spearman Correlation	84.54	—	Unverified
2	ST5-XXL	Spearman Correlation	82.63	—	Unverified
3	ST5-Large	Spearman Correlation	81.83	—	Unverified
4	ST5-XL	Spearman Correlation	81.66	—	Unverified
5	ST5-Base	Spearman Correlation	81.14	—	Unverified
6	MPNet-multilingual	Spearman Correlation	80.73	—	Unverified
7	SGPT-5.8B-nli	Spearman Correlation	80.53	—	Unverified
8	MPNet	Spearman Correlation	80.28	—	Unverified
9	MiniLM-L12	Spearman Correlation	79.8	—	Unverified
10	SimCSE-BERT-sup	Spearman Correlation	79.12	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MT-DNN-SMART	Accuracy	93.7	—	Unverified
2	ALBERT	Accuracy	93.4	—	Unverified
3	RoBERTa (ensemble)	Accuracy	92.3	—	Unverified
4	BigBird	F1	91.5	—	Unverified
5	StructBERTRoBERTa ensemble	Accuracy	91.5	—	Unverified
6	FLOATER-large	Accuracy	91.4	—	Unverified
7	SMART	Accuracy	91.3	—	Unverified
8	RoBERTa-large 355M (MLP quantized vector-wise, fine-tuned)	Accuracy	91	—	Unverified
9	RoBERTa-large 355M + Entailment as Few-shot Learner	F1	91	—	Unverified
10	SpanBERT	Accuracy	90.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromCSE-RoBERTa-large (0.355B)	Spearman Correlation	0.82	—	Unverified
2	PromptEOL+CSE+LLaMA-30B	Spearman Correlation	0.82	—	Unverified
3	PromptEOL+CSE+OPT-13B	Spearman Correlation	0.82	—	Unverified
4	SimCSE-RoBERTalarge	Spearman Correlation	0.82	—	Unverified
5	PromptEOL+CSE+OPT-2.7B	Spearman Correlation	0.81	—	Unverified
6	SentenceBERT	Spearman Correlation	0.75	—	Unverified
7	SRoBERTa-NLI-base	Spearman Correlation	0.74	—	Unverified
8	SRoBERTa-NLI-large	Spearman Correlation	0.74	—	Unverified
9	Dino (STS/̄🦕)	Spearman Correlation	0.74	—	Unverified
10	SBERT-NLI-large	Spearman Correlation	0.74	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AnglE-LLaMA-7B	Spearman Correlation	0.91	—	Unverified
2	AnglE-LLaMA-7B-v2	Spearman Correlation	0.91	—	Unverified
3	PromptEOL+CSE+LLaMA-30B	Spearman Correlation	0.9	—	Unverified
4	PromptEOL+CSE+OPT-13B	Spearman Correlation	0.9	—	Unverified
5	PromptEOL+CSE+OPT-2.7B	Spearman Correlation	0.9	—	Unverified
6	PromCSE-RoBERTa-large (0.355B)	Spearman Correlation	0.89	—	Unverified
7	Trans-Encoder-BERT-large-bi (unsup.)	Spearman Correlation	0.89	—	Unverified
8	Trans-Encoder-BERT-large-cross (unsup.)	Spearman Correlation	0.88	—	Unverified
9	Trans-Encoder-RoBERTa-large-cross (unsup.)	Spearman Correlation	0.88	—	Unverified
10	SimCSE-RoBERTa-large	Spearman Correlation	0.87	—	Unverified