Semantic Similarity

The main objective Semantic Similarity is to measure the distance between the semantic meanings of a pair of words, phrases, sentences, or documents. For example, the word “car” is more similar to “bus” than it is to “cat”. The two main approaches to measuring Semantic Similarity are knowledge-based approaches and corpus-based, distributional methods.

Source: Visual and Semantic Knowledge Transfer for Large Scale Semi-supervised Object Detection

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 651–700 of 1564 papers

Title	Date	Tasks	Status
Supervised Knowledge May Hurt Novel Class Discovery Performance	Jun 6, 2023	Novel Class DiscoverySemantic Similarity	CodeCode Available
LyricSIM: A novel Dataset and Benchmark for Similarity Detection in Spanish Song LyricS	Jun 2, 2023	Semantic SimilaritySemantic Textual Similarity	CodeCode Available
Estimating Semantic Similarity between In-Domain and Out-of-Domain Samples	Jun 1, 2023	Semantic SimilaritySemantic Textual Similarity	CodeCode Available
Exploring Anisotropy and Outliers in Multilingual Language Models for Cross-Lingual Semantic Sentence Similarity	Jun 1, 2023	Semantic SimilaritySemantic Textual Similarity	CodeCode Available
RealignDiff: Boosting Text-to-Image Diffusion Model with Coarse-to-fine Semantic Re-alignment	May 31, 2023	Caption GenerationLanguage Modelling	—Unverified
Datasets for Portuguese Legal Semantic Textual Similarity: Comparing weak supervision and an annotation process approaches	May 29, 2023	Semantic SimilaritySemantic Textual Similarity	CodeCode Available
Modeling Adversarial Attack on Pre-trained Language Models as Sequential Decision Making	May 27, 2023	Adversarial AttackDecision Making	CodeCode Available
Evaluating Open-Domain Dialogues in Latent Space with Next Sentence Prediction and Mutual Information	May 26, 2023	Semantic SimilaritySemantic Textual Similarity	CodeCode Available
RAMP: Retrieval and Attribute-Marking Enhanced Prompting for Attribute-Controlled Translation	May 26, 2023	AttributeMachine Translation	—Unverified
ParaAMR: A Large-Scale Syntactically Diverse Paraphrase Dataset by AMR Back-Translation	May 26, 2023	Abstract Meaning RepresentationData Augmentation	CodeCode Available
Bridging Continuous and Discrete Spaces: Interpretable Sentence Representation Learning via Compositional Operations	May 24, 2023	DecoderRepresentation Learning	CodeCode Available
Modeling Empathic Similarity in Personal Narratives	May 23, 2023	RetrievalSemantic Similarity	—Unverified
Interpretable Word Sense Representations via Definition Generation: The Case of Semantic Change Analysis	May 19, 2023	Language ModelingLanguage Modelling	CodeCode Available
Semantic Similarity Measure of Natural Language Text through Machine Learning and a Keyword-Aware Cross-Encoder-Ranking Summarizer -- A Case Study Using UCGIS GIS&T Body of Knowledge	May 17, 2023	Semantic SimilaritySemantic Textual Similarity	—Unverified
PESTS: Persian_English Cross Lingual Corpus for Semantic Textual Similarity	May 13, 2023	Machine TranslationSemantic Similarity	—Unverified
Instance Smoothed Contrastive Learning for Unsupervised Sentence Embedding	May 12, 2023	Contrastive LearningSemantic Similarity	CodeCode Available
REINFOREST: Reinforcing Semantic Code Similarity for Cross-Lingual Code Search Models	May 5, 2023	Code SearchContrastive Learning	CodeCode Available
Unsupervised Dialogue Topic Segmentation with Topic-aware Utterance Representation	May 4, 2023	SegmentationSemantic Similarity	—Unverified
Neural Keyphrase Generation: Analysis and Evaluation	Apr 27, 2023	DecoderKeyphrase Generation	—Unverified
Deep Lifelong Cross-modal Hashing	Apr 26, 2023	Cross-Modal RetrievalLifelong learning	—Unverified
Bridging Natural Language Processing and Psycholinguistics: computationally grounded semantic similarity datasets for Basque and Spanish	Apr 19, 2023	Semantic SimilaritySemantic Textual Similarity	—Unverified
Low-resource Bilingual Dialect Lexicon Induction with Large Language Models	Apr 19, 2023	Bilingual Lexicon InductionMachine Translation	CodeCode Available
Learning Geometry-aware Representations by Sketching	Apr 17, 2023	AttributeSemantic Similarity	—Unverified
A Clustering Framework for Unsupervised and Semi-supervised New Intent Discovery	Apr 16, 2023	ClusteringIntent Discovery	—Unverified
Semantic Feature Verification in FLAN-T5	Apr 12, 2023	Language ModelingLanguage Modelling	—Unverified
Efficient Audio Captioning Transformer with Patchout and Text Guidance	Apr 6, 2023	Audio captioningCaption Generation	—Unverified
SuperDisco: Super-Class Discovery Improves Visual Recognition for the Long-Tail	Mar 31, 2023	Representation LearningSemantic Similarity	—Unverified
Using Semantic Similarity and Text Embedding to Measure the Social Media Echo of Strategic Communications	Mar 29, 2023	DiversitySemantic Similarity	—Unverified
LEURN: Learning Explainable Univariate Rules with Neural Networks	Mar 27, 2023	Feature ImportanceSemantic Similarity	—Unverified
A Novel Patent Similarity Measurement Methodology: Semantic Distance and Technological Distance	Mar 23, 2023	Patent classificationSemantic Similarity	CodeCode Available
Micro-video Tagging via Jointly Modeling Social Influence and Tag Relation	Mar 15, 2023	Link PredictionRelation	CodeCode Available
INO at Factify 2: Structure Coherence based Multi-Modal Fact Verification	Mar 2, 2023	Claim VerificationFact Verification	CodeCode Available
AdapterSoup: Weight Averaging to Improve Generalization of Pretrained Language Models	Feb 14, 2023	ClusteringLanguage Modeling	—Unverified
NapSS: Paragraph-level Medical Text Simplification via Narrative Prompting and Sentence-matching Summarization	Feb 11, 2023	Semantic SimilaritySemantic Textual Similarity	CodeCode Available
A Parametric Similarity Method: Comparative Experiments based on Semantically Annotated Large Datasets	Feb 8, 2023	Semantic SimilaritySemantic Textual Similarity	—Unverified
Analyzing the impact of climate change on critical infrastructure from the scientific literature: A weakly supervised NLP approach	Feb 3, 2023	ArticlesDecision Making	—Unverified
How to choose "Good" Samples for Text Data Augmentation	Feb 2, 2023	Data AugmentationSemantic Similarity	—Unverified
TransFool: An Adversarial Attack against Neural Machine Translation Models	Feb 2, 2023	Adversarial AttackLanguage Modelling	CodeCode Available
KNNs of Semantic Encodings for Rating Prediction	Feb 1, 2023	Collaborative FilteringPrediction	—Unverified
uHelp: intelligent volunteer search for mutual help communities	Jan 26, 2023	Semantic SimilaritySemantic Textual Similarity	—Unverified
ClusterLog: Clustering Logs for Effective Log-based Anomaly Detection	Jan 19, 2023	Anomaly DetectionClustering	—Unverified
Syntactically Robust Training on Partially-Observed Data for Open Information Extraction	Jan 17, 2023	Open Information ExtractionParaphrase Generation	CodeCode Available
Prompting Large Language Model for Machine Translation: A Case Study	Jan 17, 2023	Language ModelingLanguage Modelling	—Unverified
USER: Unified Semantic Enhancement with Momentum Contrast for Image-Text Retrieval	Jan 17, 2023	Contrastive LearningImage-text Retrieval	CodeCode Available
Language-Informed Transfer Learning for Embodied Household Activities	Jan 12, 2023	Semantic SimilaritySemantic Textual Similarity	—Unverified
Self-Supervised Image-to-Point Distillation via Semantically Tolerant Contrastive Loss	Jan 12, 2023	3D Semantic SegmentationAutonomous Driving	—Unverified
Universal Multimodal Representation for Language Understanding	Jan 9, 2023	Machine TranslationNatural Language Inference	—Unverified
The Undesirable Dependence on Frequency of Gender Bias Metrics Based on Word Embeddings	Jan 2, 2023	Semantic SimilaritySemantic Textual Similarity	CodeCode Available
Scene-Aware Label Graph Learning for Multi-Label Image Classification	Jan 1, 2023	Graph Learningimage-classification	—Unverified
Text-Guided Unsupervised Latent Transformation for Multi-Attribute Image Manipulation	Jan 1, 2023	AttributeImage Manipulation	—Unverified

Show:10 25 50

← PrevPage 14 of 32Next →

All datasets Annotated corpus for semantic similarity of clinical trial outcomes (expanded corpus)Annotated corpus for semantic similarity of clinical trial outcomes (original corpus)SICK BIOSSES CHIP-STS ClinicalSTS MedSTS

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	BioBERT (pre-trained on PubMed abstracts + PMC, fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, expanded corpus")	F1	93.38	—	Unverified
2	SciBERT uncased (SciVocab, fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, expanded corpus")	F1	91.51	—	Unverified
3	SciBERT cased (SciVocab, fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, expanded corpus")	F1	90.69	—	Unverified
4	BERT-Base uncased (fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, expanded corpus")	F1	89.16	—	Unverified
5	BERT-Base cased (fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, expanded corpus")	F1	89.12	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BioBERT (pre-trained on PubMed abstracts + PMC, fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, original corpus")	F1	89.75	—	Unverified
2	SciBERT cased (SciVocab, fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, original corpus")	F1	89.3	—	Unverified
3	SciBERT uncased (SciVocab, fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, original corpus")	F1	89.3	—	Unverified
4	BERT-Base uncased (fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, original corpus")	F1	86.8	—	Unverified
5	BERT-Base cased (fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, original corpus")	F1	84.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Doc2VecC	MSE	0.31	—	Unverified
2	LSTM (Tai et al., 2015)	MSE	0.28	—	Unverified
3	Bidirectional LSTM (Tai et al., 2015)	MSE	0.27	—	Unverified
4	combine-skip (Kiros et al., 2015)	MSE	0.27	—	Unverified
5	Dependency Tree-LSTM (Tai et al., 2015)	MSE	0.25	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BioLinkBERT (large)	Pearson Correlation	0.94	—	Unverified
2	BioLinkBERT (base)	Pearson Correlation	0.93	—	Unverified
3	NCBI_BERT(base) (P+M)	Pearson Correlation	0.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MacBERT-large	Macro F1	85.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CharacterBERT (base, medical, ensemble)	Pearson Correlation	85.62	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	NCBI_BERT(base) (P+M)	Pearson Correlation	0.85	—	Unverified