Semantic Similarity

The main objective Semantic Similarity is to measure the distance between the semantic meanings of a pair of words, phrases, sentences, or documents. For example, the word “car” is more similar to “bus” than it is to “cat”. The two main approaches to measuring Semantic Similarity are knowledge-based approaches and corpus-based, distributional methods.

Source: Visual and Semantic Knowledge Transfer for Large Scale Semi-supervised Object Detection

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 151–200 of 1564 papers

Title	Date	Tasks	Status	Hype
A Comprehensive Framework for Semantic Similarity Analysis of Human and AI-Generated Text Using Transformer Architectures and Ensemble Techniques	Jan 24, 2025	Data AugmentationDomain Adaptation	—Unverified	0
Rethinking the Sample Relations for Few-Shot Classification	Jan 23, 2025	ClassificationContrastive Learning	CodeCode Available	7
Sequence Spreading-Based Semantic Communication Under High RF Interference	Jan 21, 2025	Semantic CommunicationSemantic Similarity	—Unverified	0
LegalGuardian: A Privacy-Preserving Framework for Secure Integration of Large Language Models in Legal Practice	Jan 19, 2025	named-entity-recognitionNamed Entity Recognition	—Unverified	0
MedFILIP: Medical Fine-grained Language-Image Pre-training	Jan 18, 2025	Contrastive LearningDiagnostic	CodeCode Available	1
Evaluating GenAI for Simplifying Texts for Education: Improving Accuracy and Consistency for Enhanced Readability	Jan 15, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified	0
Consistency of Responses and Continuations Generated by Large Language Models on Social Media	Jan 14, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified	0
Contextual ASR Error Handling with LLMs Augmentation for Goal-Oriented Conversational AI	Jan 10, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
GeAR: Generation Augmented Retrieval	Jan 6, 2025	RetrievalSemantic Similarity	—Unverified	0
Universal Features Guided Zero-Shot Category-Level Object Pose Estimation	Jan 6, 2025	DiversityPose Estimation	—Unverified	0
Harnessing Frozen Unimodal Encoders for Flexible Multimodal Alignment	Jan 1, 2025	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	0
Anchor-Aware Similarity Cohesion in Target Frames Enables Predicting Temporal Moment Boundaries in 2D	Jan 1, 2025	Moment RetrievalSemantic Similarity	CodeCode Available	0
ProtCLIP: Function-Informed Protein Multi-Modal Learning	Dec 28, 2024	Protein Function PredictionSemantic Similarity	—Unverified	0
Multiple References with Meaningful Variations Improve Literary Machine Translation	Dec 24, 2024	Machine TranslationSemantic Similarity	—Unverified	0
Reasoning to Attend: Try to Understand How <SEG> Token Works	Dec 23, 2024	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	2
DiffSim: Taming Diffusion Models for Evaluating Visual Similarity	Dec 19, 2024	Contrastive LearningDenoising	CodeCode Available	1
HashAttention: Semantic Sparsity for Faster Inference	Dec 19, 2024	GPUSemantic Similarity	—Unverified	0
DuSSS: Dual Semantic Similarity-Supervised Vision-Language Model for Semi-Supervised Medical Image Segmentation	Dec 17, 2024	Contrastive LearningImage Segmentation	CodeCode Available	1
Quantifying Positional Biases in Text Embedding Models	Dec 13, 2024	Information RetrievalPosition	CodeCode Available	0
Familiarity: Better Evaluation of Zero-Shot Named Entity Recognition by Quantifying Label Shifts in Synthetic Training Data	Dec 13, 2024	named-entity-recognitionNamed Entity Recognition	CodeCode Available	1
Single-View Graph Contrastive Learning with Soft Neighborhood Awareness	Dec 12, 2024	Contrastive LearningSemantic Similarity	CodeCode Available	0
Multilingual LLMs Inherently Reward In-Language Time-Sensitive Semantic Alignment for Low-Resource Languages	Dec 11, 2024	In-Context LearningSemantic Similarity	CodeCode Available	0
Generating Knowledge Graphs from Large Language Models: A Comparative Study of GPT-4, LLaMA 2, and BERT	Dec 10, 2024	Knowledge GraphsSemantic Similarity	—Unverified	0
SiReRAG: Indexing Similar and Related Information for Multihop Reasoning	Dec 9, 2024	RAGReranking	—Unverified	0
Detecting Redundant Health Survey Questions Using Language-agnostic BERT Sentence Embedding (LaBSE)	Dec 5, 2024	Computational EfficiencyQuestion Similarity	—Unverified	0
Human Variability vs. Machine Consistency: A Linguistic Analysis of Texts Generated by Humans and Large Language Models	Dec 4, 2024	Semantic SimilaritySemantic Textual Similarity	—Unverified	0
VidHalluc: Evaluating Temporal Hallucinations in Multimodal Large Language Models for Video Understanding	Dec 4, 2024	HallucinationInstruction Following	—Unverified	0
Interpretable Company Similarity with Sparse Autoencoders	Dec 3, 2024	Large Language ModelSemantic Similarity	—Unverified	0
TSCheater: Generating High-Quality Tibetan Adversarial Texts via Visual Similarity	Dec 3, 2024	Adversarial RobustnessAdversarial Text	CodeCode Available	0
Quantifying perturbation impacts for large language models	Dec 1, 2024	Semantic SimilaritySemantic Textual Similarity	—Unverified	0
Vid-Morp: Video Moment Retrieval Pretraining from Unlabeled Videos in the Wild	Dec 1, 2024	Moment RetrievalRetrieval	CodeCode Available	1
RelCon: Relative Contrastive Learning for a Motion Foundation Model for Wearable Data	Nov 27, 2024	Activity RecognitionContrastive Learning	CodeCode Available	1
Generative Semantic Communication for Joint Image Transmission and Segmentation	Nov 27, 2024	feature selectionImage Reconstruction	—Unverified	0
Isolating authorship from content with semantic embeddings and contrastive learning	Nov 27, 2024	Contrastive LearningDisentanglement	—Unverified	0
In-Context Experience Replay Facilitates Safety Red-Teaming of Text-to-Image Diffusion Models	Nov 25, 2024	Red TeamingSemantic Similarity	—Unverified	0
FAST-Splat: Fast, Ambiguity-Free Semantics Transfer in Gaussian Splatting	Nov 20, 2024	Dimensionality ReductionGPU	—Unverified	0
Advancing Large Language Models for Spatiotemporal and Semantic Association Mining of Similar Environmental Events	Nov 19, 2024	ArticlesReranking	—Unverified	0
Membership Inference Attack against Long-Context Large Language Models	Nov 18, 2024	Inference AttackMembership Inference Attack	—Unverified	0
Everyone deserves their voice to be heard: Analyzing Predictive Gender Bias in ASR Models Applied to Dutch Speech Data	Nov 14, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Squeezed Attention: Accelerating Long Context Length LLM Inference	Nov 14, 2024	Code GenerationLarge Language Model	CodeCode Available	2
Securing from Unseen: Connected Pattern Kernels (CoPaK) for Zero-Day Intrusion Detection	Nov 7, 2024	Intrusion DetectionSemantic Similarity	—Unverified	0
Leveraging LLMs to Enable Natural Language Search on Go-to-market Platforms	Nov 7, 2024	Natural Language QueriesPrompt Engineering	—Unverified	0
Semantic-Aware Resource Management for C-V2X Platooning via Multi-Agent Reinforcement Learning	Nov 7, 2024	Decision MakingFairness	CodeCode Available	1
A Comparative Study of Recent Large Language Models on Generating Hospital Discharge Summaries for Lung Cancer Patients	Nov 6, 2024	Semantic SimilaritySemantic Textual Similarity	—Unverified	0
Fine-Grained Guidance for Retrievers: Leveraging LLMs' Feedback in Retrieval-Augmented Generation	Nov 6, 2024	HallucinationRAG	—Unverified	0
Continual Audio-Visual Sound Separation	Nov 5, 2024	Continual LearningSemantic Similarity	CodeCode Available	0
HACD: Harnessing Attribute Semantics and Mesoscopic Structure for Community Detection	Nov 4, 2024	Anomaly DetectionAttribute	CodeCode Available	0
NLP and Education: using semantic similarity to evaluate filled gaps in a large-scale Cloze test in the classroom	Nov 2, 2024	Cloze TestReading Comprehension	—Unverified	0
CmdCaliper: A Semantic-Aware Command-Line Embedding Model and Dataset for Security Research	Nov 2, 2024	Line DetectionSemantic Similarity	CodeCode Available	1
FedDTPT: Federated Discrete and Transferable Prompt Tuning for Black-Box Large Language Models	Nov 1, 2024	Federated LearningSemantic Similarity	—Unverified	0

Show:10 25 50

← PrevPage 4 of 32Next →

All datasets Annotated corpus for semantic similarity of clinical trial outcomes (expanded corpus)Annotated corpus for semantic similarity of clinical trial outcomes (original corpus)SICK BIOSSES CHIP-STS ClinicalSTS MedSTS

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	BioBERT (pre-trained on PubMed abstracts + PMC, fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, expanded corpus")	F1	93.38	—	Unverified
2	SciBERT uncased (SciVocab, fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, expanded corpus")	F1	91.51	—	Unverified
3	SciBERT cased (SciVocab, fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, expanded corpus")	F1	90.69	—	Unverified
4	BERT-Base uncased (fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, expanded corpus")	F1	89.16	—	Unverified
5	BERT-Base cased (fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, expanded corpus")	F1	89.12	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BioBERT (pre-trained on PubMed abstracts + PMC, fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, original corpus")	F1	89.75	—	Unverified
2	SciBERT uncased (SciVocab, fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, original corpus")	F1	89.3	—	Unverified
3	SciBERT cased (SciVocab, fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, original corpus")	F1	89.3	—	Unverified
4	BERT-Base uncased (fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, original corpus")	F1	86.8	—	Unverified
5	BERT-Base cased (fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, original corpus")	F1	84.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Doc2VecC	MSE	0.31	—	Unverified
2	LSTM (Tai et al., 2015)	MSE	0.28	—	Unverified
3	Bidirectional LSTM (Tai et al., 2015)	MSE	0.27	—	Unverified
4	combine-skip (Kiros et al., 2015)	MSE	0.27	—	Unverified
5	Dependency Tree-LSTM (Tai et al., 2015)	MSE	0.25	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BioLinkBERT (large)	Pearson Correlation	0.94	—	Unverified
2	BioLinkBERT (base)	Pearson Correlation	0.93	—	Unverified
3	NCBI_BERT(base) (P+M)	Pearson Correlation	0.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MacBERT-large	Macro F1	85.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CharacterBERT (base, medical, ensemble)	Pearson Correlation	85.62	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	NCBI_BERT(base) (P+M)	Pearson Correlation	0.85	—	Unverified