Semantic Similarity

The main objective Semantic Similarity is to measure the distance between the semantic meanings of a pair of words, phrases, sentences, or documents. For example, the word “car” is more similar to “bus” than it is to “cat”. The two main approaches to measuring Semantic Similarity are knowledge-based approaches and corpus-based, distributional methods.

Source: Visual and Semantic Knowledge Transfer for Large Scale Semi-supervised Object Detection

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 501–550 of 1564 papers

Title	Date	Tasks	Status	Hype
Automatic Design of Semantic Similarity Ensembles Using Grammatical Evolution	Jul 3, 2023	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	0
Transfer learning for semantic similarity measures based on symbolic regression	Jul 2, 2023	regressionSemantic Similarity	CodeCode Available	0
A Massive Scale Semantic Similarity Dataset of Historical English	Jun 30, 2023	ArticlesSemantic Similarity	—Unverified	0
DialoGPS: Dialogue Path Sampling in Continuous Semantic Space for Data Augmentation in Multi-Turn Conversations	Jun 29, 2023	Data AugmentationDialogue Generation	—Unverified	0
Large Language Models as Annotators: Enhancing Generalization of NLP Models at Minimal Cost	Jun 27, 2023	Active LearningSemantic Similarity	—Unverified	0
Full Automation of Goal-driven LLM Dialog Threads with And-Or Recursors and Refiner Oracles	Jun 24, 2023	Recommendation SystemsSemantic Similarity	CodeCode Available	1
SeFNet: Bridging Tabular Datasets with Semantic Feature Nets	Jun 20, 2023	Meta-LearningSemantic Similarity	CodeCode Available	0
A Relaxed Optimization Approach for Adversarial Attacks against Neural Machine Translation Models	Jun 14, 2023	Adversarial AttackMachine Translation	—Unverified	0
Unbalanced Optimal Transport for Unbalanced Word Alignment	Jun 7, 2023	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	1
Supervised Knowledge May Hurt Novel Class Discovery Performance	Jun 6, 2023	Novel Class DiscoverySemantic Similarity	CodeCode Available	0
Augmenting Reddit Posts to Determine Wellness Dimensions impacting Mental Health	Jun 6, 2023	Data AugmentationSemantic Similarity	CodeCode Available	0
LyricSIM: A novel Dataset and Benchmark for Similarity Detection in Spanish Song LyricS	Jun 2, 2023	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	0
Vocabulary-free Image Classification	Jun 1, 2023	Classificationimage-classification	CodeCode Available	1
Estimating Semantic Similarity between In-Domain and Out-of-Domain Samples	Jun 1, 2023	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	0
Exploring Anisotropy and Outliers in Multilingual Language Models for Cross-Lingual Semantic Sentence Similarity	Jun 1, 2023	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	0
RealignDiff: Boosting Text-to-Image Diffusion Model with Coarse-to-fine Semantic Re-alignment	May 31, 2023	Caption GenerationLanguage Modelling	—Unverified	0
Real-World Image Variation by Aligning Diffusion Inversion Chain	May 30, 2023	Image GenerationImage-Variation	CodeCode Available	1
Datasets for Portuguese Legal Semantic Textual Similarity: Comparing weak supervision and an annotation process approaches	May 29, 2023	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	0
Modeling Adversarial Attack on Pre-trained Language Models as Sequential Decision Making	May 27, 2023	Adversarial AttackDecision Making	CodeCode Available	0
Evaluating Open-Domain Dialogues in Latent Space with Next Sentence Prediction and Mutual Information	May 26, 2023	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	0
RAMP: Retrieval and Attribute-Marking Enhanced Prompting for Attribute-Controlled Translation	May 26, 2023	AttributeMachine Translation	—Unverified	0
ParaAMR: A Large-Scale Syntactically Diverse Paraphrase Dataset by AMR Back-Translation	May 26, 2023	Abstract Meaning RepresentationData Augmentation	CodeCode Available	0
AlignScore: Evaluating Factual Consistency with a Unified Alignment Function	May 26, 2023	Fact VerificationInformation Retrieval	CodeCode Available	4
Bridging Continuous and Discrete Spaces: Interpretable Sentence Representation Learning via Compositional Operations	May 24, 2023	DecoderRepresentation Learning	CodeCode Available	0
SAMScore: A Content Structural Similarity Metric for Image Translation Evaluation	May 24, 2023	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	1
C-STS: Conditional Semantic Textual Similarity	May 24, 2023	Information RetrievalLanguage Model Evaluation	CodeCode Available	1
FOCUS: Effective Embedding Initialization for Monolingual Specialization of Multilingual Models	May 23, 2023	Language ModelingLanguage Modelling	CodeCode Available	1
Modeling Empathic Similarity in Personal Narratives	May 23, 2023	RetrievalSemantic Similarity	—Unverified	0
SneakyPrompt: Jailbreaking Text-to-image Generative Models	May 20, 2023	Reinforcement Learning (RL)Semantic Similarity	CodeCode Available	1
Interpretable Word Sense Representations via Definition Generation: The Case of Semantic Change Analysis	May 19, 2023	Language ModelingLanguage Modelling	CodeCode Available	0
Cue-CoT: Chain-of-thought Prompting for Responding to In-depth Dialogue Questions with LLMs	May 19, 2023	Question AnsweringSemantic Similarity	CodeCode Available	1
Balancing Lexical and Semantic Quality in Abstractive Summarization	May 17, 2023	Abstractive Text SummarizationRe-Ranking	CodeCode Available	1
Semantic Similarity Measure of Natural Language Text through Machine Learning and a Keyword-Aware Cross-Encoder-Ranking Summarizer -- A Case Study Using UCGIS GIS&T Body of Knowledge	May 17, 2023	Semantic SimilaritySemantic Textual Similarity	—Unverified	0
Similarity-weighted Construction of Contextualized Commonsense Knowledge Graphs for Knowledge-intense Argumentation Tasks	May 15, 2023	Knowledge GraphsSemantic Similarity	CodeCode Available	1
PESTS: Persian_English Cross Lingual Corpus for Semantic Textual Similarity	May 13, 2023	Machine TranslationSemantic Similarity	—Unverified	0
Instance Smoothed Contrastive Learning for Unsupervised Sentence Embedding	May 12, 2023	Contrastive LearningSemantic Similarity	CodeCode Available	0
SMATCH++: Standardized and Extended Evaluation of Semantic Graphs	May 11, 2023	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	1
Benchmarking large language models for biomedical natural language processing applications and recommendations	May 10, 2023	BenchmarkingDocument Classification	CodeCode Available	1
REINFOREST: Reinforcing Semantic Code Similarity for Cross-Lingual Code Search Models	May 5, 2023	Code SearchContrastive Learning	CodeCode Available	0
Context-Aware Semantic Similarity Measurement for Unsupervised Word Sense Disambiguation	May 5, 2023	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	1
Unsupervised Dialogue Topic Segmentation with Topic-aware Utterance Representation	May 4, 2023	SegmentationSemantic Similarity	—Unverified	0
Neural Keyphrase Generation: Analysis and Evaluation	Apr 27, 2023	DecoderKeyphrase Generation	—Unverified	0
Deep Lifelong Cross-modal Hashing	Apr 26, 2023	Cross-Modal RetrievalLifelong learning	—Unverified	0
Low-resource Bilingual Dialect Lexicon Induction with Large Language Models	Apr 19, 2023	Bilingual Lexicon InductionMachine Translation	CodeCode Available	0
Bridging Natural Language Processing and Psycholinguistics: computationally grounded semantic similarity datasets for Basque and Spanish	Apr 19, 2023	Semantic SimilaritySemantic Textual Similarity	—Unverified	0
Learning Geometry-aware Representations by Sketching	Apr 17, 2023	AttributeSemantic Similarity	—Unverified	0
PCPNet: An Efficient and Semantic-Enhanced Transformer Network for Point Cloud Prediction	Apr 16, 2023	Autonomous VehiclesDecision Making	CodeCode Available	1
A Clustering Framework for Unsupervised and Semi-supervised New Intent Discovery	Apr 16, 2023	ClusteringIntent Discovery	—Unverified	0
Semantic Feature Verification in FLAN-T5	Apr 12, 2023	Language ModelingLanguage Modelling	—Unverified	0
Efficient Audio Captioning Transformer with Patchout and Text Guidance	Apr 6, 2023	Audio captioningCaption Generation	—Unverified	0

Show:10 25 50

← PrevPage 11 of 32Next →

All datasets Annotated corpus for semantic similarity of clinical trial outcomes (expanded corpus)Annotated corpus for semantic similarity of clinical trial outcomes (original corpus)SICK BIOSSES CHIP-STS ClinicalSTS MedSTS

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	BioBERT (pre-trained on PubMed abstracts + PMC, fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, expanded corpus")	F1	93.38	—	Unverified
2	SciBERT uncased (SciVocab, fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, expanded corpus")	F1	91.51	—	Unverified
3	SciBERT cased (SciVocab, fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, expanded corpus")	F1	90.69	—	Unverified
4	BERT-Base uncased (fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, expanded corpus")	F1	89.16	—	Unverified
5	BERT-Base cased (fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, expanded corpus")	F1	89.12	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BioBERT (pre-trained on PubMed abstracts + PMC, fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, original corpus")	F1	89.75	—	Unverified
2	SciBERT cased (SciVocab, fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, original corpus")	F1	89.3	—	Unverified
3	SciBERT uncased (SciVocab, fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, original corpus")	F1	89.3	—	Unverified
4	BERT-Base uncased (fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, original corpus")	F1	86.8	—	Unverified
5	BERT-Base cased (fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, original corpus")	F1	84.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Doc2VecC	MSE	0.31	—	Unverified
2	LSTM (Tai et al., 2015)	MSE	0.28	—	Unverified
3	Bidirectional LSTM (Tai et al., 2015)	MSE	0.27	—	Unverified
4	combine-skip (Kiros et al., 2015)	MSE	0.27	—	Unverified
5	Dependency Tree-LSTM (Tai et al., 2015)	MSE	0.25	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BioLinkBERT (large)	Pearson Correlation	0.94	—	Unverified
2	BioLinkBERT (base)	Pearson Correlation	0.93	—	Unverified
3	NCBI_BERT(base) (P+M)	Pearson Correlation	0.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MacBERT-large	Macro F1	85.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CharacterBERT (base, medical, ensemble)	Pearson Correlation	85.62	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	NCBI_BERT(base) (P+M)	Pearson Correlation	0.85	—	Unverified