Semantic Similarity

The main objective Semantic Similarity is to measure the distance between the semantic meanings of a pair of words, phrases, sentences, or documents. For example, the word “car” is more similar to “bus” than it is to “cat”. The two main approaches to measuring Semantic Similarity are knowledge-based approaches and corpus-based, distributional methods.

Source: Visual and Semantic Knowledge Transfer for Large Scale Semi-supervised Object Detection

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1501–1550 of 1564 papers

Title	Date	Tasks	Status
Accidental Misalignment: Fine-Tuning Language Models Induces Unexpected Vulnerability	May 22, 2025	Adversarial DefenseSemantic Similarity	CodeCode Available
Evaluating Open-Domain Dialogues in Latent Space with Next Sentence Prediction and Mutual Information	May 26, 2023	Semantic SimilaritySemantic Textual Similarity	CodeCode Available
MixMOOD: A systematic approach to class distribution mismatch in semi-supervised learning using deep dataset dissimilarity measures	Jun 14, 2020	Multi-class ClassificationSemantic Similarity	CodeCode Available
Using Information Content to Evaluate Semantic Similarity in a Taxonomy	Nov 29, 1995	Semantic SimilaritySemantic Textual Similarity	CodeCode Available
Size vs. Structure in Training Corpora for Word Embedding Models: Araneum Russicum Maximum and Russian National Corpus	Jan 19, 2018	Semantic SimilaritySemantic Textual Similarity	CodeCode Available
Model Comparison for Semantic Grouping	Apr 30, 2019	modelSemantic Similarity	CodeCode Available
Modeling Adversarial Attack on Pre-trained Language Models as Sequential Decision Making	May 27, 2023	Adversarial AttackDecision Making	CodeCode Available
SLPL SHROOM at SemEval2024 Task 06: A comprehensive study on models ability to detect hallucination	Apr 7, 2024	HallucinationMachine Translation	CodeCode Available
SMARAGD: Learning SMatch for Accurate and Rapid Approximate Graph Distance	Mar 24, 2022	ClusteringData Augmentation	CodeCode Available
Chinese Word Sense Embedding with SememeWSD and Synonym Set	Jun 29, 2022	Semantic SimilaritySemantic Textual Similarity	CodeCode Available
Modelling Sentence Pairs with Tree-structured Attentive Encoder	Oct 10, 2016	Paraphrase IdentificationQuestion Selection	CodeCode Available
A Semantic Relevance Based Neural Network for Text Summarization and Text Simplification	Oct 6, 2017	DecoderSemantic Similarity	CodeCode Available
Are you tough enough? Framework for Robustness Validation of Machine Comprehension Systems	Dec 5, 2018	Question AnsweringReading Comprehension	CodeCode Available
MoralStrength: Exploiting a Moral Lexicon and Embedding Similarity for Moral Foundations Prediction	Apr 17, 2019	Decision MakingLEMMA	CodeCode Available
More Than Meets The Eye: Semi-supervised Learning Under Non-IID Data	Apr 20, 2021	Semantic SimilaritySemantic Textual Similarity	CodeCode Available
Are we describing the same sound? An analysis of word embedding spaces of expressive piano performance	Dec 31, 2023	Information RetrievalRetrieval	CodeCode Available
Saliency Suppressed, Semantics Surfaced: Visual Transformations in Neural Networks and the Brain	Apr 29, 2024	Semantic SimilaritySemantic Textual Similarity	CodeCode Available
MSnet: A BERT-based Network for Gendered Pronoun Resolution	Aug 1, 2019	Semantic SimilaritySemantic Textual Similarity	CodeCode Available
A Resource-Light Method for Cross-Lingual Semantic Textual Similarity	Jan 19, 2018	Cross-Lingual Information RetrievalCross-Lingual Semantic Textual Similarity	CodeCode Available
SAM-PD: How Far Can SAM Take Us in Tracking and Segmenting Anything in Videos by Prompt Denoising	Mar 7, 2024	DenoisingInstance Segmentation	CodeCode Available
MultiHal: Multilingual Dataset for Knowledge-Graph Grounded Evaluation of LLM Hallucinations	May 20, 2025	Fact CheckingHallucination	CodeCode Available
Causal Graphs Meet Thoughts: Enhancing Complex Reasoning in Graph-Augmented LLMs	Jan 24, 2025	Knowledge GraphsMedical Question Answering	CodeCode Available
Think Globally, Embed Locally --- Locally Linear Meta-embedding of Words	Sep 19, 2017	General ClassificationRelation Classification	CodeCode Available
Category-aware EEG image generation based on wavelet transform and contrast semantic loss	May 30, 2025	EEGImage Generation	CodeCode Available
Capturing Semantic Similarity for Entity Linking with Convolutional Neural Networks	Apr 4, 2016	Entity LinkingSemantic correspondence	CodeCode Available
Soft Alignment Objectives for Robust Adaptation of Language Generation	Nov 29, 2022	Domain AdaptationMachine Translation	CodeCode Available
Scalable Attentive Sentence-Pair Modeling via Distilled Sentence Embedding	Aug 14, 2019	Knowledge DistillationNatural Language Understanding	CodeCode Available
Multilingual LLMs Inherently Reward In-Language Time-Sensitive Semantic Alignment for Low-Resource Languages	Dec 11, 2024	In-Context LearningSemantic Similarity	CodeCode Available
A mathematical theory of semantic development in deep neural networks	Oct 23, 2018	Semantic SimilaritySemantic Textual Similarity	CodeCode Available
EffEval: A Comprehensive Evaluation of Efficiency for MT Evaluation Metrics	Sep 20, 2022	CPUGPU	CodeCode Available
Eval-GCSC: A New Metric for Evaluating ChatGPT's Performance in Chinese Spelling Correction	Nov 14, 2023	Semantic SimilaritySemantic Textual Similarity	CodeCode Available
Uncovering the Semantics of Wikipedia Categories	Jun 28, 2019	Entity DisambiguationKnowledge Graphs	CodeCode Available
What If: Generating Code to Answer Simulation Questions	Apr 16, 2022	Program SynthesisSemantic Similarity	CodeCode Available
You can't pick your neighbors, or can you? When and how to rely on retrieval in the kNN-LM	Oct 28, 2022	Language ModelingLanguage Modelling	CodeCode Available
Estimating Semantic Similarity between In-Domain and Out-of-Domain Samples	Jun 1, 2023	Semantic SimilaritySemantic Textual Similarity	CodeCode Available
Multimodal Visual Concept Learning with Weakly Supervised Techniques	Dec 3, 2017	Action RecognitionDescriptive	CodeCode Available
Contract Discovery: Dataset and a Few-Shot Semantic Retrieval Challenge with Competitive Baselines	Nov 10, 2019	Few-Shot LearningLanguage Modeling	CodeCode Available
TLAC: Two-stage LMM Augmented CLIP for Zero-Shot Classification	Mar 15, 2025	Domain Generalizationimage-classification	CodeCode Available
SEA: Sentence Encoder Assembly for Video Retrieval by Textual Queries	Nov 24, 2020	Ad-hoc video searchManagement	CodeCode Available
Second-Order NLP Adversarial Examples	Oct 5, 2020	Adversarial AttackSemantic Similarity	CodeCode Available
Import2vec - Learning Embeddings for Software Libraries	Mar 27, 2019	Semantic SimilaritySemantic Textual Similarity	CodeCode Available
WordNet Embeddings	Jul 1, 2018	Representation LearningSemantic Similarity	CodeCode Available
Multi-stage Distillation Framework for Cross-Lingual Semantic Similarity Matching	Sep 13, 2022	Contrastive LearningKnowledge Distillation	CodeCode Available
Are LLMs complicated ethical dilemma analyzers?	May 12, 2025	Semantic SimilaritySemantic Textual Similarity	CodeCode Available
A Large-Scale Sensitivity Analysis on Latent Embeddings and Dimensionality Reductions for Text Spatializations	Jul 25, 2024	DescriptiveDimensionality Reduction	CodeCode Available
Specialising Word Vectors for Lexical Entailment	Jun 1, 2018	Dialogue State TrackingLexical Entailment	CodeCode Available
Specialising Word Vectors for Lexical Entailment	Oct 17, 2017	Lexical EntailmentRelation	CodeCode Available
NapSS: Paragraph-level Medical Text Simplification via Narrative Prompting and Sentence-matching Summarization	Feb 11, 2023	Semantic SimilaritySemantic Textual Similarity	CodeCode Available
SeFNet: Bridging Tabular Datasets with Semantic Feature Nets	Jun 20, 2023	Meta-LearningSemantic Similarity	CodeCode Available
Near-lossless Binarization of Word Embeddings	Mar 24, 2018	BinarizationSemantic Similarity	CodeCode Available

Show:10 25 50

← PrevPage 31 of 32Next →

All datasets Annotated corpus for semantic similarity of clinical trial outcomes (expanded corpus)Annotated corpus for semantic similarity of clinical trial outcomes (original corpus)SICK BIOSSES CHIP-STS ClinicalSTS MedSTS

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	BioBERT (pre-trained on PubMed abstracts + PMC, fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, expanded corpus")	F1	93.38	—	Unverified
2	SciBERT uncased (SciVocab, fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, expanded corpus")	F1	91.51	—	Unverified
3	SciBERT cased (SciVocab, fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, expanded corpus")	F1	90.69	—	Unverified
4	BERT-Base uncased (fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, expanded corpus")	F1	89.16	—	Unverified
5	BERT-Base cased (fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, expanded corpus")	F1	89.12	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BioBERT (pre-trained on PubMed abstracts + PMC, fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, original corpus")	F1	89.75	—	Unverified
2	SciBERT uncased (SciVocab, fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, original corpus")	F1	89.3	—	Unverified
3	SciBERT cased (SciVocab, fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, original corpus")	F1	89.3	—	Unverified
4	BERT-Base uncased (fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, original corpus")	F1	86.8	—	Unverified
5	BERT-Base cased (fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, original corpus")	F1	84.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Doc2VecC	MSE	0.31	—	Unverified
2	LSTM (Tai et al., 2015)	MSE	0.28	—	Unverified
3	Bidirectional LSTM (Tai et al., 2015)	MSE	0.27	—	Unverified
4	combine-skip (Kiros et al., 2015)	MSE	0.27	—	Unverified
5	Dependency Tree-LSTM (Tai et al., 2015)	MSE	0.25	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BioLinkBERT (large)	Pearson Correlation	0.94	—	Unverified
2	BioLinkBERT (base)	Pearson Correlation	0.93	—	Unverified
3	NCBI_BERT(base) (P+M)	Pearson Correlation	0.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MacBERT-large	Macro F1	85.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CharacterBERT (base, medical, ensemble)	Pearson Correlation	85.62	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	NCBI_BERT(base) (P+M)	Pearson Correlation	0.85	—	Unverified