Semantic Similarity

The main objective Semantic Similarity is to measure the distance between the semantic meanings of a pair of words, phrases, sentences, or documents. For example, the word “car” is more similar to “bus” than it is to “cat”. The two main approaches to measuring Semantic Similarity are knowledge-based approaches and corpus-based, distributional methods.

Source: Visual and Semantic Knowledge Transfer for Large Scale Semi-supervised Object Detection

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 251–300 of 1564 papers

Title	Date	Tasks	Status
Document Valuation in LLM Summaries: A Cluster Shapley Approach	May 28, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified
LLMs as Better Recommenders with Natural Language Collaborative Signals: A Self-Assessing Retrieval Approach	May 26, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified
Position: Mechanistic Interpretability Should Prioritize Feature Consistency in SAEs	May 26, 2025	PositionSemantic Similarity	CodeCode Available
Hypercube-RAG: Hypercube-Based Retrieval-Augmented Generation for In-domain Scientific Question-Answering	May 25, 2025	Question AnsweringRAG	CodeCode Available
CrosGrpsABS: Cross-Attention over Syntactic and Semantic Graphs for Aspect-Based Sentiment Analysis in a Low-Resource Language	May 25, 2025	Aspect-Based Sentiment AnalysisAspect-Based Sentiment Analysis (ABSA)	—Unverified
Sparse VideoGen2: Accelerate Video Generation with Sparse Attention via Semantic-Aware Permutation	May 24, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified
Omni TM-AE: A Scalable and Interpretable Embedding Model Using the Full Tsetlin Machine State Space	May 22, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified
LLMs Are Not Scorers: Rethinking MT Evaluation with Generation-Based Methods	May 22, 2025	DecoderMachine Translation	CodeCode Available
EquivPruner: Boosting Efficiency and Quality in LLM-Based Search via Action Pruning	May 22, 2025	GSM8KMath	CodeCode Available
Automated Feedback Loops to Protect Text Simplification with Generative AI from Information Loss	May 22, 2025	Missing ElementsSemantic Similarity	—Unverified
Accidental Misalignment: Fine-Tuning Language Models Induces Unexpected Vulnerability	May 22, 2025	Adversarial DefenseSemantic Similarity	CodeCode Available
Language Specific Knowledge: Do Models Know Better in X than in English?	May 21, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified
EcomScriptBench: A Multi-task Benchmark for E-commerce Script Planning via Step-wise Intention-Driven Product Association	May 21, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified
Leveraging the Powerful Attention of a Pre-trained Diffusion Model for Exemplar-based Image Colorization	May 21, 2025	ColorizationImage Colorization	CodeCode Available
MultiHal: Multilingual Dataset for Knowledge-Graph Grounded Evaluation of LLM Hallucinations	May 20, 2025	Fact CheckingHallucination	CodeCode Available
Efficient Heuristics Generation for Solving Combinatorial Optimization Problems Using Large Language Models	May 19, 2025	Combinatorial OptimizationSemantic Similarity	CodeCode Available
Community Search in Time-dependent Road-social Attributed Networks	May 18, 2025	AttributeCommunity Search	—Unverified
Fine-Grained ECG-Text Contrastive Learning via Waveform Understanding Enhancement	May 17, 2025	Contrastive LearningDiagnostic	—Unverified
Temporally-Grounded Language Generation: A Benchmark for Real-Time Vision-Language Models	May 16, 2025	Image CaptioningQuestion Answering	CodeCode Available
Evaluations at Work: Measuring the Capabilities of GenAI in Use	May 15, 2025	DiversitySemantic Similarity	—Unverified
AI-enhanced semantic feature norms for 786 concepts	May 15, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified
FlowDreamer: A RGB-D World Model with Flow-based Motion Representations for Robot Manipulation	May 15, 2025	Robot ManipulationSemantic Similarity	—Unverified
Towards Automated Situation Awareness: A RAG-Based Framework for Peacebuilding Reports	May 14, 2025	ArticlesDecision Making	—Unverified
A 2D Semantic-Aware Position Encoding for Vision Transformers	May 14, 2025	PositionSemantic Similarity	—Unverified
TrialMatchAI: An End-to-End AI-powered Clinical Trial Recommendation System to Streamline Patient-to-Trial Matching	May 13, 2025	Lightweight DeploymentRetrieval-augmented Generation	—Unverified
Concept-Level Explainability for Auditing & Steering LLM Responses	May 12, 2025	Prompt EngineeringSemantic Similarity	CodeCode Available
Hypernym Mercury: Token Optimization Through Semantic Field Constriction And Reconstruction From Hypernyms. A New Text Compression Method	May 12, 2025	Semantic CompressionSemantic Similarity	—Unverified
Are LLMs complicated ethical dilemma analyzers?	May 12, 2025	Semantic SimilaritySemantic Textual Similarity	CodeCode Available
Jailbreaking the Text-to-Video Generative Models	May 10, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified
Sparse Attention Remapping with Clustering for Efficient LLM Decoding on PIM	May 9, 2025	ClusteringSemantic Similarity	—Unverified
Estimating Quality in Therapeutic Conversations: A Multi-Dimensional Natural Language Processing Framework	May 9, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified
Stealthy LLM-Driven Data Poisoning Attacks Against Embedding-Based Retrieval-Augmented Recommender Systems	May 8, 2025	Data PoisoningLanguage Modeling	—Unverified
R&B: Domain Regrouping and Data Mixture Balancing for Efficient Foundation Model Training	May 1, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified
Homa at SemEval-2025 Task 5: Aligning Librarian Records with OntoAligner for Subject Tagging	Apr 30, 2025	RAGRetrieval	—Unverified
20min-XD: A Comparable Corpus of Swiss News Articles	Apr 30, 2025	ArticlesSemantic Similarity	CodeCode Available
Retrieval-Enhanced Few-Shot Prompting for Speech Event Extraction	Apr 30, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
ReCellTy: Domain-specific knowledge graph retrieval-augmented LLMs workflow for single-cell annotation	Apr 24, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified
Stay Hungry, Stay Foolish: On the Extended Reading Articles Generation with LLMs	Apr 21, 2025	ArticlesSemantic Similarity	—Unverified
Cyc3D: Fine-grained Controllable 3D Generation via Cycle Consistency Regularization	Apr 21, 2025	3D GenerationSemantic Similarity	—Unverified
Exploring Language Patterns of Prompts in Text-to-Image Generation and Their Impact on Visual Diversity	Apr 19, 2025	DiversityImage Generation	—Unverified
Towards a Multi-Agent Vision-Language System for Zero-Shot Novel Hazardous Object Detection for Autonomous Driving Safety	Apr 18, 2025	Anomaly DetectionAutonomous Driving	CodeCode Available
Semantic Similarity-Informed Bayesian Borrowing for Quantitative Signal Detection of Adverse Events	Apr 16, 2025	Bayesian InferenceMarketing	—Unverified
Self-Controlled Dynamic Expansion Model for Continual Learning	Apr 14, 2025	Continual Learningmodel	—Unverified
HD-RAG: Retrieval-Augmented Generation for Hybrid Documents Containing Text and Hierarchical Tables	Apr 13, 2025	Question AnsweringRAG	—Unverified
Embodied Image Captioning: Self-supervised Learning Agents for Spatially Coherent Image Descriptions	Apr 11, 2025	Contrastive LearningImage Captioning	—Unverified
Evaluating Retrieval Augmented Generative Models for Document Queries in Transportation Safety	Apr 9, 2025	Information RetrievalRAG	—Unverified
Balancing Complexity and Informativeness in LLM-Based Clustering: Finding the Goldilocks Zone	Apr 6, 2025	ClusteringInformativeness	—Unverified
Horizon Scans can be accelerated using novel information retrieval and artificial intelligence tools	Apr 2, 2025	Active LearningArticles	—Unverified
ProtoGuard-guided PROPEL: Class-Aware Prototype Enhancement and Progressive Labeling for Incremental 3D Point Cloud Segmentation	Apr 2, 2025	class-incremental learningClass Incremental Learning	—Unverified
Context-Aware Human Behavior Prediction Using Multimodal Large Language Models: Challenges and Insights	Apr 1, 2025	Activity PredictionDomain Generalization	—Unverified

Show:10 25 50

← PrevPage 6 of 32Next →

All datasets Annotated corpus for semantic similarity of clinical trial outcomes (expanded corpus)Annotated corpus for semantic similarity of clinical trial outcomes (original corpus)SICK BIOSSES CHIP-STS ClinicalSTS MedSTS

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	BioBERT (pre-trained on PubMed abstracts + PMC, fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, expanded corpus")	F1	93.38	—	Unverified
2	SciBERT uncased (SciVocab, fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, expanded corpus")	F1	91.51	—	Unverified
3	SciBERT cased (SciVocab, fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, expanded corpus")	F1	90.69	—	Unverified
4	BERT-Base uncased (fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, expanded corpus")	F1	89.16	—	Unverified
5	BERT-Base cased (fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, expanded corpus")	F1	89.12	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BioBERT (pre-trained on PubMed abstracts + PMC, fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, original corpus")	F1	89.75	—	Unverified
2	SciBERT cased (SciVocab, fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, original corpus")	F1	89.3	—	Unverified
3	SciBERT uncased (SciVocab, fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, original corpus")	F1	89.3	—	Unverified
4	BERT-Base uncased (fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, original corpus")	F1	86.8	—	Unverified
5	BERT-Base cased (fine-tuned on "Annotated corpus for semantic similarity of clinical trial outcomes, original corpus")	F1	84.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Doc2VecC	MSE	0.31	—	Unverified
2	LSTM (Tai et al., 2015)	MSE	0.28	—	Unverified
3	Bidirectional LSTM (Tai et al., 2015)	MSE	0.27	—	Unverified
4	combine-skip (Kiros et al., 2015)	MSE	0.27	—	Unverified
5	Dependency Tree-LSTM (Tai et al., 2015)	MSE	0.25	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BioLinkBERT (large)	Pearson Correlation	0.94	—	Unverified
2	BioLinkBERT (base)	Pearson Correlation	0.93	—	Unverified
3	NCBI_BERT(base) (P+M)	Pearson Correlation	0.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MacBERT-large	Macro F1	85.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CharacterBERT (base, medical, ensemble)	Pearson Correlation	85.62	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	NCBI_BERT(base) (P+M)	Pearson Correlation	0.85	—	Unverified