cross-modal alignment

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 126–150 of 342 papers

Title	Date	Tasks	Status
DiSa: Directional Saliency-Aware Prompt Learning for Generalizable Vision-Language Models	May 26, 2025	cross-modal alignmentDomain Generalization	—Unverified
ViTaPEs: Visuotactile Position Encodings for Cross-Modal Alignment in Multimodal Transformers	May 26, 2025	cross-modal alignmentPosition	—Unverified
From Alignment to Advancement: Bootstrapping Audio-Language Alignment with Synthetic Data	May 26, 2025	cross-modal alignmentInstruction Following	—Unverified
Co-AttenDWG: Co-Attentive Dimension-Wise Gating and Expert Fusion for Multi-Modal Offensive Content Detection	May 25, 2025	cross-modal alignmentScene Understanding	—Unverified
Deformable Attentive Visual Enhancement for Referring Segmentation Using Vision-Language Model	May 25, 2025	cross-modal alignmentImage Segmentation	—Unverified
MLLMs are Deeply Affected by Modality Bias	May 24, 2025	cross-modal alignment	—Unverified
Clip4Retrofit: Enabling Real-Time Image Labeling on Edge Devices via Cross-Architecture CLIP Distillation	May 23, 2025	Autonomous Drivingcross-modal alignment	—Unverified
ICPL-ReID: Identity-Conditional Prompt Learning for Multi-Spectral Object Re-Identification	May 23, 2025	cross-modal alignmentPrompt Learning	CodeCode Available
Representation Discrepancy Bridging Method for Remote Sensing Image-Text Retrieval	May 22, 2025	cross-modal alignmentImage-text Retrieval	—Unverified
ALN-P3: Unified Language Alignment for Perception, Prediction, and Planning in Autonomous Driving	May 21, 2025	Autonomous Drivingcross-modal alignment	—Unverified
CAD: A General Multimodal Framework for Video Deepfake Detection via Cross-Modal Alignment and Distillation	May 21, 2025	cross-modal alignmentDeepFake Detection	—Unverified
Enhancing LLMs for Time Series Forecasting via Structure-Guided Cross-Modal Alignment	May 19, 2025	cross-modal alignmentTime Series	—Unverified
FALCON: False-Negative Aware Learning of Contrastive Negatives in Vision-Language Pretraining	May 16, 2025	cross-modal alignment	—Unverified
Beyond Modality Collapse: Representations Blending for Multimodal Dataset Distillation	May 16, 2025	cross-modal alignmentDataset Distillation	—Unverified
VISTA: Enhancing Vision-Text Alignment in MLLMs via Cross-Modal Mutual Information Maximization	May 16, 2025	cross-modal alignmentMME	—Unverified
Adaptive Spatial Transcriptomics Interpolation via Cross-modal Cross-slice Modeling	May 15, 2025	cross-modal alignment	CodeCode Available
Denoising and Alignment: Rethinking Domain Generalization for Multimodal Face Anti-Spoofing	May 14, 2025	cross-modal alignmentDenoising	—Unverified
Anatomical Attention Alignment representation for Radiology Report Generation	May 12, 2025	cross-modal alignmentDecoder	CodeCode Available
HCMA: Hierarchical Cross-model Alignment for Grounded Text-to-Image Generation	May 10, 2025	cross-modal alignmentImage Generation	CodeCode Available
Semantic-Space-Intervened Diffusive Alignment for Visual Classification	May 9, 2025	Classificationcross-modal alignment	—Unverified
Task-Adapter++: Task-specific Adaptation with Order-aware Alignment for Few-shot Action Recognition	May 9, 2025	Action Recognitioncross-modal alignment	CodeCode Available
Probabilistic Embeddings for Frozen Vision-Language Models: Uncertainty Quantification with Gaussian Process Latent Variable Models	May 8, 2025	Active Learningcross-modal alignment	CodeCode Available
DenseGrounding: Improving Dense Language-Vision Semantics for Ego-Centric 3D Visual Grounding	May 8, 2025	3D visual groundingcross-modal alignment	—Unverified
PhysLLM: Harnessing Large Language Models for Cross-Modal Remote Physiological Sensing	May 6, 2025	cross-modal alignment	—Unverified
MicarVLMoE: A Modern Gated Cross-Aligned Vision-Language Mixture of Experts Model for Medical Image Captioning and Report Generation	Apr 29, 2025	cross-modal alignmentDecoder	CodeCode Available

Show:10 25 50

← PrevPage 6 of 14Next →

No leaderboard results yet.