Semantic Similarity

The main objective Semantic Similarity is to measure the distance between the semantic meanings of a pair of words, phrases, sentences, or documents. For example, the word “car” is more similar to “bus” than it is to “cat”. The two main approaches to measuring Semantic Similarity are knowledge-based approaches and corpus-based, distributional methods.

Source: Visual and Semantic Knowledge Transfer for Large Scale Semi-supervised Object Detection

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–125 of 1564 papers

Title	Date	Tasks	Status	Hype	Score
CBLUE: A Chinese Biomedical Language Understanding Evaluation Benchmark	Jun 15, 2021	Intent ClassificationMedical Concept Normalization	CodeCode Available	1	5
CDF-RAG: Causal Dynamic Feedback for Adaptive Retrieval-Augmented Generation	Apr 17, 2025	RAGRetrieval	CodeCode Available	1	5
CmdCaliper: A Semantic-Aware Command-Line Embedding Model and Dataset for Security Research	Nov 2, 2024	Line DetectionSemantic Similarity	CodeCode Available	1	5
Class-relation Knowledge Distillation for Novel Class Discovery	Jul 18, 2023	Knowledge DistillationNovel Class Discovery	CodeCode Available	1	5
Improving word mover's distance by leveraging self-attention matrix	Nov 11, 2022	Paraphrase IdentificationSemantic Similarity	CodeCode Available	1	5
Explicitly Integrating Judgment Prediction with Legal Document Retrieval: A Law-Guided Generative Approach	Dec 15, 2023	PredictionRetrieval	CodeCode Available	1	5
CODER: Knowledge infused cross-lingual medical term embedding for term normalization	Nov 5, 2020	Contrastive LearningKnowledge Graphs	CodeCode Available	1	5
DiffSim: Taming Diffusion Models for Evaluating Visual Similarity	Dec 19, 2024	Contrastive LearningDenoising	CodeCode Available	1	5
ComStreamClust: a communicative multi-agent approach to text clustering in streaming data	Oct 11, 2020	ClusteringSemantic Similarity	CodeCode Available	1	5
IRT-Router: Effective and Interpretable Multi-LLM Routing via Item Response Theory	Jun 1, 2025	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	1	5
Discrete Optimization for Unsupervised Sentence Summarization with Word-Level Extraction	May 4, 2020	Language ModelingLanguage Modelling	CodeCode Available	1	5
Crisscrossed Captions: Extended Intramodal and Intermodal Semantic Similarity Judgments for MS-COCO	Apr 30, 2020	Image CaptioningRepresentation Learning	CodeCode Available	1	5
Benchmarking large language models for biomedical natural language processing applications and recommendations	May 10, 2023	BenchmarkingDocument Classification	CodeCode Available	1	5
Learning by Semantic Similarity Makes Abstractive Summarization Better	Feb 18, 2020	Abstractive Text SummarizationSemantic Similarity	CodeCode Available	1	5
Distilling Coarse-to-Fine Semantic Matching Knowledge for Weakly Supervised 3D Visual Grounding	Jul 18, 2023	3D visual groundingObject	CodeCode Available	1	5
Reconstruct Your Previous Conversations! Comprehensively Investigating Privacy Leakage Risks in Conversations with GPT Models	Feb 5, 2024	Reconstruction AttackSemantic Similarity	CodeCode Available	1	5
COPNER: Contrastive Learning with Prompt Guiding for Few-shot Named Entity Recognition	Oct 1, 2022	Contrastive Learningfew-shot-ner	CodeCode Available	1	5
DeepSim: Semantic similarity metrics for learned image registration	Nov 11, 2020	Image RegistrationSemantic Similarity	CodeCode Available	1	5
DECAF: Deep Extreme Classification with Label Features	Aug 1, 2021	ClassificationExtreme Multi-Label Classification	CodeCode Available	1	5
Cross-lingual Text Classification with Heterogeneous Graph Neural Network	May 24, 2021	ClassificationGraph Neural Network	CodeCode Available	1	5
C-STS: Conditional Semantic Textual Similarity	May 24, 2023	Information RetrievalLanguage Model Evaluation	CodeCode Available	1	5
DataSculpt: Crafting Data Landscapes for Long-Context LLMs through Multi-Objective Partitioning	Sep 2, 2024	Code CompletionCombinatorial Optimization	CodeCode Available	1	5
Deep Fusion Transformer Network with Weighted Vector-Wise Keypoints Voting for Robust 6D Object Pose Estimation	Aug 10, 2023	6D Pose Estimation using RGBglobal-optimization	CodeCode Available	1	5
MarkBERT: Marking Word Boundaries Improves Chinese BERT	Mar 12, 2022	Chinese Named Entity Recognitionnamed-entity-recognition	CodeCode Available	1	5
Deep Representational Re-tuning using Contrastive Tension	Jan 1, 2021	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	1	5

Show:10 25 50

← PrevPage 5 of 63Next →

All datasets Annotated corpus for semantic similarity of clinical trial outcomes (expanded corpus)Annotated corpus for semantic similarity of clinical trial outcomes (original corpus)SICK BIOSSES CHIP-STS ClinicalSTS MedSTS

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	BioBERT (pre-trained on PubMed abstracts + PMC, fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, expanded corpus")	F1	93.38	—	Unverified
2	SciBERT uncased (SciVocab, fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, expanded corpus")	F1	91.51	—	Unverified
3	SciBERT cased (SciVocab, fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, expanded corpus")	F1	90.69	—	Unverified
4	BERT-Base uncased (fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, expanded corpus")	F1	89.16	—	Unverified
5	BERT-Base cased (fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, expanded corpus")	F1	89.12	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BioBERT (pre-trained on PubMed abstracts + PMC, fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, original corpus")	F1	89.75	—	Unverified
2	SciBERT uncased (SciVocab, fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, original corpus")	F1	89.3	—	Unverified
3	SciBERT cased (SciVocab, fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, original corpus")	F1	89.3	—	Unverified
4	BERT-Base uncased (fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, original corpus")	F1	86.8	—	Unverified
5	BERT-Base cased (fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, original corpus")	F1	84.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Doc2VecC	MSE	0.31	—	Unverified
2	LSTM (Tai et al., 2015)	MSE	0.28	—	Unverified
3	Bidirectional LSTM (Tai et al., 2015)	MSE	0.27	—	Unverified
4	combine-skip (Kiros et al., 2015)	MSE	0.27	—	Unverified
5	Dependency Tree-LSTM (Tai et al., 2015)	MSE	0.25	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BioLinkBERT (large)	Pearson Correlation	0.94	—	Unverified
2	BioLinkBERT (base)	Pearson Correlation	0.93	—	Unverified
3	NCBI_BERT(base) (P+M)	Pearson Correlation	0.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MacBERT-large	Macro F1	85.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CharacterBERT (base, medical, ensemble)	Pearson Correlation	85.62	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	NCBI_BERT(base) (P+M)	Pearson Correlation	0.85	—	Unverified