Semantic Similarity

The main objective Semantic Similarity is to measure the distance between the semantic meanings of a pair of words, phrases, sentences, or documents. For example, the word “car” is more similar to “bus” than it is to “cat”. The two main approaches to measuring Semantic Similarity are knowledge-based approaches and corpus-based, distributional methods.

Source: Visual and Semantic Knowledge Transfer for Large Scale Semi-supervised Object Detection

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 201–250 of 1564 papers

Title	Date	Tasks	Status	Hype
SUPERT: Towards New Frontiers in Unsupervised Evaluation Metrics for Multi-Document Summarization	May 7, 2020	Document SummarizationMulti-Document Summarization	CodeCode Available	1
Neural CRF Model for Sentence Alignment in Text Simplification	May 5, 2020	ArticlesSemantic Similarity	CodeCode Available	1
Discrete Optimization for Unsupervised Sentence Summarization with Word-Level Extraction	May 4, 2020	Language ModelingLanguage Modelling	CodeCode Available	1
On the Limitations of Cross-lingual Encoders as Exposed by Reference-Free Machine Translation Evaluation	May 3, 2020	Cross-Lingual TransferLanguage Modeling	CodeCode Available	1
Word Rotator's Distance	Apr 30, 2020	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	1
Crisscrossed Captions: Extended Intramodal and Intermodal Semantic Similarity Judgments for MS-COCO	Apr 30, 2020	Image CaptioningRepresentation Learning	CodeCode Available	1
Fast and Accurate Deep Bidirectional Language Representations for Unsupervised Learning	Apr 17, 2020	CPULanguage Modeling	CodeCode Available	1
Attentive Normalization for Conditional Image Generation	Apr 8, 2020	Conditional Image GenerationImage Generation	CodeCode Available	1
Text-Guided Neural Image Inpainting	Apr 7, 2020	DescriptiveImage Generation	CodeCode Available	1
Semantic Pyramid for Image Generation	Mar 13, 2020	General ClassificationImage Generation	CodeCode Available	1
Generalized Product Quantization Network for Semi-supervised Image Retrieval	Feb 26, 2020	Image RetrievalMetric Learning	CodeCode Available	1
Learning by Semantic Similarity Makes Abstractive Summarization Better	Feb 18, 2020	Abstractive Text SummarizationSemantic Similarity	CodeCode Available	1
Symmetrical Synthesis for Deep Metric Learning	Jan 31, 2020	ClusteringImage Retrieval	CodeCode Available	1
Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks	Aug 27, 2019	ClusteringLinear-Probe Classification	CodeCode Available	1
Transfer Learning in Biomedical Natural Language Processing: An Evaluation of BERT and ELMo on Ten Benchmarking Datasets	Jun 13, 2019	BenchmarkingDocument Classification	CodeCode Available	1
Deep Metric Learning by Online Soft Mining and Class-Aware Attention	Nov 4, 2018	Metric LearningPerson Re-Identification	CodeCode Available	1
MedSTS: A Resource for Clinical Semantic Textual Similarity	Aug 28, 2018	Decision MakingSemantic Similarity	CodeCode Available	1
Improving Language Understanding by Generative Pre-Training	Jun 11, 2018	Cloze TestDocument Classification	CodeCode Available	1
R-VQA: Learning Visual Relation Facts with Semantic Attention for Visual Question Answering	May 24, 2018	Question AnsweringRelation	CodeCode Available	1
No Fuss Distance Metric Learning using Proxies	Mar 21, 2017	Metric LearningSemantic Similarity	CodeCode Available	1
Label Noise Reduction in Entity Typing by Heterogeneous Partial-Label Embedding	Feb 17, 2016	Entity TypingSemantic Similarity	CodeCode Available	1
Semantic Similarity Based on Corpus Statistics and Lexical Taxonomy	Sep 20, 1997	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	1
SemCSE: Semantic Contrastive Sentence Embeddings Using LLM-Generated Summaries For Scientific Abstracts	Jul 17, 2025	Contrastive LearningSemantic Similarity	—Unverified	0
SARA: Selective and Adaptive Retrieval-augmented Generation with Context Compression	Jul 8, 2025	Evidence SelectionRAG	—Unverified	0
FA: Forced Prompt Learning of Vision-Language Models for Out-of-Distribution Detection	Jul 6, 2025	Out-of-Distribution DetectionOut of Distribution (OOD) Detection	CodeCode Available	0
LineRetriever: Planning-Aware Observation Reduction for Web Agents	Jun 30, 2025	RetrievalSemantic Similarity	—Unverified	0
DALR: Dual-level Alignment Learning for Multimodal Sentence Representation Learning	Jun 26, 2025	cross-modal alignmentRepresentation Learning	—Unverified	0
Enhancing Automatic Term Extraction with Large Language Models via Syntactic Retrieval	Jun 26, 2025	Information RetrievalMachine Translation	—Unverified	0
Intrinsic vs. Extrinsic Evaluation of Czech Sentence Embeddings: Semantic Relevance Doesn't Help with MT Evaluation	Jun 25, 2025	Machine TranslationSemantic Similarity	—Unverified	0
Leveraging Vision-Language Models to Select Trustworthy Super-Resolution Samples Generated by Diffusion Models	Jun 25, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified	0
PrivacyXray: Detecting Privacy Breaches in LLMs through Semantic Consistency and Probability Certainty	Jun 24, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified	0
Semantic similarity estimation for domain specific data using BERT and other techniques	Jun 23, 2025	Information RetrievalMachine Translation	—Unverified	0
ImpliRet: Benchmarking the Implicit Fact Retrieval Challenge	Jun 17, 2025	BenchmarkingRetrieval	CodeCode Available	0
GrFormer: A Novel Transformer on Grassmann Manifold for Infrared and Visible Image Fusion	Jun 17, 2025	Infrared And Visible Image FusionSemantic Similarity	—Unverified	0
Similarity = Value? Consultation Value Assessment and Alignment for Personalized Search	Jun 17, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified	0
InsertRank: LLMs can reason over BM25 scores to Improve Listwise Reranking	Jun 17, 2025	Information RetrievalReranking	—Unverified	0
FindMeIfYouCan: Bringing Open Set metrics to near , far and farther Out-of-Distribution Object Detection	Jun 16, 2025	Autonomous Drivingobject-detection	—Unverified	0
Statistical Hypothesis Testing for Auditing Robustness in Language Models	Jun 9, 2025	FairnessLarge Language Model	—Unverified	0
Trend-Aware Fashion Recommendation with Visual Segmentation and Semantic Similarity	Jun 9, 2025	Semantic SegmentationSemantic Similarity	CodeCode Available	0
Hierarchical Scoring with 3D Gaussian Splatting for Instance Image-Goal Navigation	Jun 9, 2025	3DGSNavigate	—Unverified	0
Conservative Bias in Large Language Models: Measuring Relation Predictions	Jun 9, 2025	HallucinationRelation	—Unverified	0
Denoising Programming Knowledge Tracing with a Code Graph-based Tuning Adaptor	Jun 7, 2025	DenoisingKnowledge Tracing	—Unverified	0
KNN-Defense: Defense against 3D Adversarial Point Clouds using Nearest-Neighbor Search	Jun 7, 2025	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	0
Plugging Schema Graph into Multi-Table QA: A Human-Guided Framework for Reducing LLM Reliance	Jun 4, 2025	Question AnsweringSemantic Similarity	—Unverified	0
MCP-Zero: Active Tool Discovery for Autonomous LLM Agents	Jun 1, 2025	RetrievalSemantic Similarity	—Unverified	0
PRISM: A Framework for Producing Interpretable Political Bias Embeddings with Political-Aware Cross-Encoder	May 30, 2025	ArticlesSemantic Similarity	CodeCode Available	0
Category-aware EEG image generation based on wavelet transform and contrast semantic loss	May 30, 2025	EEGImage Generation	CodeCode Available	0
VUDG: A Dataset for Video Understanding Domain Generalization	May 30, 2025	Domain GeneralizationMultiple-choice	—Unverified	0
GATE: General Arabic Text Embedding for Enhanced Semantic Textual Similarity with Matryoshka Representation Learning and Hybrid Loss Training	May 30, 2025	MTEB BenchmarkNatural Language Inference	—Unverified	0
Document Valuation in LLM Summaries: A Cluster Shapley Approach	May 28, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified	0

Show:10 25 50

← PrevPage 5 of 32Next →

All datasets Annotated corpus for semantic similarity of clinical trial outcomes (expanded corpus)Annotated corpus for semantic similarity of clinical trial outcomes (original corpus)SICK BIOSSES CHIP-STS ClinicalSTS MedSTS

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	BioBERT (pre-trained on PubMed abstracts + PMC, fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, expanded corpus")	F1	93.38	—	Unverified
2	SciBERT uncased (SciVocab, fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, expanded corpus")	F1	91.51	—	Unverified
3	SciBERT cased (SciVocab, fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, expanded corpus")	F1	90.69	—	Unverified
4	BERT-Base uncased (fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, expanded corpus")	F1	89.16	—	Unverified
5	BERT-Base cased (fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, expanded corpus")	F1	89.12	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BioBERT (pre-trained on PubMed abstracts + PMC, fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, original corpus")	F1	89.75	—	Unverified
2	SciBERT cased (SciVocab, fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, original corpus")	F1	89.3	—	Unverified
3	SciBERT uncased (SciVocab, fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, original corpus")	F1	89.3	—	Unverified
4	BERT-Base uncased (fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, original corpus")	F1	86.8	—	Unverified
5	BERT-Base cased (fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, original corpus")	F1	84.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Doc2VecC	MSE	0.31	—	Unverified
2	LSTM (Tai et al., 2015)	MSE	0.28	—	Unverified
3	Bidirectional LSTM (Tai et al., 2015)	MSE	0.27	—	Unverified
4	combine-skip (Kiros et al., 2015)	MSE	0.27	—	Unverified
5	Dependency Tree-LSTM (Tai et al., 2015)	MSE	0.25	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BioLinkBERT (large)	Pearson Correlation	0.94	—	Unverified
2	BioLinkBERT (base)	Pearson Correlation	0.93	—	Unverified
3	NCBI_BERT(base) (P+M)	Pearson Correlation	0.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MacBERT-large	Macro F1	85.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CharacterBERT (base, medical, ensemble)	Pearson Correlation	85.62	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	NCBI_BERT(base) (P+M)	Pearson Correlation	0.85	—	Unverified