Semantic Similarity

The main objective Semantic Similarity is to measure the distance between the semantic meanings of a pair of words, phrases, sentences, or documents. For example, the word “car” is more similar to “bus” than it is to “cat”. The two main approaches to measuring Semantic Similarity are knowledge-based approaches and corpus-based, distributional methods.

Source: Visual and Semantic Knowledge Transfer for Large Scale Semi-supervised Object Detection

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 201–250 of 1564 papers

Title	Date	Tasks	Status	Hype
EF-LLM: Energy Forecasting LLM with AI-assisted Automation, Enhanced Sparse Prediction, Hallucination Detection	Oct 30, 2024	Continual LearningHallucination	—Unverified	0
Phonology-Guided Speech-to-Speech Translation for African Languages	Oct 30, 2024	Semantic SimilaritySemantic Textual Similarity	—Unverified	0
BIS: NL2SQL Service Evaluation Benchmark for Business Intelligence Scenarios	Oct 30, 2024	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	0
Decoupling Semantic Similarity from Spatial Alignment for Neural Networks	Oct 30, 2024	Image RetrievalSemantic Similarity	CodeCode Available	0
Emotional RAG: Enhancing Role-Playing Agents through Emotional Retrieval	Oct 30, 2024	RAGResponse Generation	CodeCode Available	1
Conjuring Semantic Similarity	Oct 21, 2024	Semantic SimilaritySemantic Textual Similarity	—Unverified	0
Optimizing Retrieval-Augmented Generation with Elasticsearch for Enhanced Question-Answering Systems	Oct 18, 2024	Question AnsweringRAG	—Unverified	0
Few-Shot Joint Multimodal Entity-Relation Extraction via Knowledge-Enhanced Cross-modal Prompt Model	Oct 18, 2024	Language ModelingLanguage Modelling	—Unverified	0
Automatically Interpreting Millions of Features in Large Language Models	Oct 17, 2024	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	3
Boosting Imperceptibility of Stable Diffusion-based Adversarial Examples Generation with Momentum	Oct 17, 2024	Image GenerationSemantic Similarity	CodeCode Available	0
SemSim: Revisiting Weak-to-Strong Consistency from a Semantic Similarity Perspective for Semi-supervised Medical Image Segmentation	Oct 17, 2024	Image SegmentationMedical Image Segmentation	—Unverified	0
PromptExp: Multi-granularity Prompt Explanation of Large Language Models	Oct 16, 2024	Natural Language UnderstandingPrompt Engineering	—Unverified	0
Back-of-the-Book Index Automation for Arabic Documents	Oct 14, 2024	Semantic SimilaritySemantic Textual Similarity	—Unverified	0
Improving Legal Entity Recognition Using a Hybrid Transformer Model and Semantic Filtering Approach	Oct 11, 2024	Semantic SimilaritySemantic Textual Similarity	—Unverified	0
Large Continual Instruction Assistant	Oct 8, 2024	Question AnsweringSemantic Similarity	CodeCode Available	2
VLM2Vec: Training Vision-Language Models for Massive Multimodal Embedding Tasks	Oct 7, 2024	Information RetrievalLanguage Modeling	—Unverified	0
Graded Suspiciousness of Adversarial Texts to Human	Oct 6, 2024	Adversarial AttackAdversarial Text	—Unverified	0
Metadata-based Data Exploration with Retrieval-Augmented Generation for Large Language Models	Oct 5, 2024	RAGRetrieval	—Unverified	0
Evaluating Deduplication Techniques for Economic Research Paper Titles with a Focus on Semantic Similarity using NLP and LLMs	Oct 2, 2024	Semantic SimilaritySemantic Textual Similarity	—Unverified	0
UniAdapt: A Universal Adapter for Knowledge Calibration	Oct 1, 2024	Mixture-of-ExpertsModel Editing	—Unverified	0
Semantic-Driven Topic Modeling Using Transformer-Based Embeddings and Clustering Algorithms	Sep 30, 2024	ClusteringSemantic Similarity	—Unverified	0
From Unimodal to Multimodal: Scaling up Projectors to Align Modalities	Sep 28, 2024	Image-text RetrievalSemantic Similarity	CodeCode Available	0
T3: A Novel Zero-shot Transfer Learning Framework Iteratively Training on an Assistant Task for a Target Task	Sep 26, 2024	Question AnsweringSemantic Similarity	—Unverified	0
Exploring Semantic Clustering in Deep Reinforcement Learning for Video Games	Sep 25, 2024	ClusteringDeep Reinforcement Learning	—Unverified	0
Unveiling Ontological Commitment in Multi-Modal Foundation Models	Sep 25, 2024	Semantic SimilaritySemantic Textual Similarity	—Unverified	0
Brotherhood at WMT 2024: Leveraging LLM-Generated Contextual Conversations for Cross-Lingual Image Captioning	Sep 23, 2024	Image CaptioningSemantic Similarity	—Unverified	0
Learning to Localize Actions in Instructional Videos with LLM-Based Multi-Pathway Text-Video Alignment	Sep 22, 2024	Contrastive Learningcross-modal alignment	—Unverified	0
Towards Automated Patent Workflows: AI-Orchestrated Multi-Agent Framework for Intellectual Property Management and Analysis	Sep 21, 2024	Abstractive Text SummarizationKnowledge Graphs	—Unverified	0
Demystifying and Extracting Fault-indicating Information from Logs for Failure Diagnosis	Sep 20, 2024	Anomaly DetectionFault Diagnosis	CodeCode Available	1
Linguistic Minimal Pairs Elicit Linguistic Similarity in Large Language Models	Sep 19, 2024	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	2
Reasoning Graph Enhanced Exemplars Retrieval for In-Context Learning	Sep 17, 2024	Few-Shot LearningIn-Context Learning	CodeCode Available	0
Prompt Obfuscation for Large Language Models	Sep 17, 2024	Large Language ModelSemantic Similarity	—Unverified	0
beeFormer: Bridging the Gap Between Semantic and Interaction Similarity in Recommender Systems	Sep 16, 2024	Collaborative FilteringRecommendation Systems	CodeCode Available	2
Retro-li: Small-Scale Retrieval Augmented Generation Supporting Noisy Similarity Searches and Domain Shift Generalization	Sep 12, 2024	Language ModelingLanguage Modelling	CodeCode Available	0
An Unsupervised Dialogue Topic Segmentation Model Based on Utterance Rewriting	Sep 12, 2024	Representation LearningSegmentation	—Unverified	0
Ethereum Fraud Detection via Joint Transaction Language Model and Graph Representation Learning	Sep 9, 2024	AttributeFraud Detection	—Unverified	0
Self-Judge: Selective Instruction Following with Alignment Self-Evaluation	Sep 2, 2024	Instruction FollowingSemantic Similarity	CodeCode Available	0
DataSculpt: Crafting Data Landscapes for Long-Context LLMs through Multi-Objective Partitioning	Sep 2, 2024	Code CompletionCombinatorial Optimization	CodeCode Available	1
LanguaShrink: Reducing Token Overhead with Psycholinguistics	Sep 1, 2024	ArticlesSemantic Similarity	—Unverified	0
GMFL-Net: A Global Multi-geometric Feature Learning Network for Repetitive Action Counting	Aug 31, 2024	Pose EstimationRepetitive Action Counting	CodeCode Available	0
FlowRetrieval: Flow-Guided Data Retrieval for Few-Shot Imitation Learning	Aug 29, 2024	Few-Shot Imitation LearningImitation Learning	CodeCode Available	0
Contrastive Learning Subspace for Text Clustering	Aug 26, 2024	ClusteringContrastive Learning	—Unverified	0
HTS-Attack: Heuristic Token Search for Jailbreaking Text-to-Image Models	Aug 25, 2024	Heuristic SearchImage Generation	—Unverified	0
GSTran: Joint Geometric and Semantic Coherence for Point Cloud Segmentation	Aug 21, 2024	Point Cloud SegmentationSemantic Similarity	CodeCode Available	0
Distinguish Confusion in Legal Judgment Prediction via Revised Relation Knowledge	Aug 18, 2024	ArticlesInductive Bias	CodeCode Available	1
KGV: Integrating Large Language Models with Knowledge Graphs for Cyber Threat Intelligence Credibility Assessment	Aug 15, 2024	Fact CheckingKnowledge Graphs	—Unverified	0
Unsupervised Episode Detection for Large-Scale News Events	Aug 9, 2024	ArticlesEvent Detection	CodeCode Available	1
reCSE: Portable Reshaping Features for Sentence Embedding in Self-supervised Contrastive Learning	Aug 9, 2024	Contrastive LearningData Augmentation	CodeCode Available	0
Semantics or spelling? Probing contextual word embeddings with orthographic noise	Aug 8, 2024	Language ModelingLanguage Modelling	CodeCode Available	0
A Semi-supervised Multi-channel Graph Convolutional Network for Query Classification in E-commerce	Aug 4, 2024	intent-classificationIntent Classification	—Unverified	0

Show:10 25 50

← PrevPage 5 of 32Next →

All datasets Annotated corpus for semantic similarity of clinical trial outcomes (expanded corpus)Annotated corpus for semantic similarity of clinical trial outcomes (original corpus)SICK BIOSSES CHIP-STS ClinicalSTS MedSTS

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	BioBERT (pre-trained on PubMed abstracts + PMC, fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, expanded corpus")	F1	93.38	—	Unverified
2	SciBERT uncased (SciVocab, fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, expanded corpus")	F1	91.51	—	Unverified
3	SciBERT cased (SciVocab, fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, expanded corpus")	F1	90.69	—	Unverified
4	BERT-Base uncased (fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, expanded corpus")	F1	89.16	—	Unverified
5	BERT-Base cased (fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, expanded corpus")	F1	89.12	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BioBERT (pre-trained on PubMed abstracts + PMC, fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, original corpus")	F1	89.75	—	Unverified
2	SciBERT uncased (SciVocab, fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, original corpus")	F1	89.3	—	Unverified
3	SciBERT cased (SciVocab, fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, original corpus")	F1	89.3	—	Unverified
4	BERT-Base uncased (fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, original corpus")	F1	86.8	—	Unverified
5	BERT-Base cased (fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, original corpus")	F1	84.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Doc2VecC	MSE	0.31	—	Unverified
2	LSTM (Tai et al., 2015)	MSE	0.28	—	Unverified
3	Bidirectional LSTM (Tai et al., 2015)	MSE	0.27	—	Unverified
4	combine-skip (Kiros et al., 2015)	MSE	0.27	—	Unverified
5	Dependency Tree-LSTM (Tai et al., 2015)	MSE	0.25	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BioLinkBERT (large)	Pearson Correlation	0.94	—	Unverified
2	BioLinkBERT (base)	Pearson Correlation	0.93	—	Unverified
3	NCBI_BERT(base) (P+M)	Pearson Correlation	0.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MacBERT-large	Macro F1	85.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CharacterBERT (base, medical, ensemble)	Pearson Correlation	85.62	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	NCBI_BERT(base) (P+M)	Pearson Correlation	0.85	—	Unverified