cross-modal alignment

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 151–200 of 342 papers

Title	Date	Tasks	Status
Coarse-to-fine Alignment Makes Better Speech-image Retrieval	Aug 15, 2024	cross-modal alignmentImage Retrieval	—Unverified
Co-AttenDWG: Co-Attentive Dimension-Wise Gating and Expert Fusion for Multi-Modal Offensive Content Detection	May 25, 2025	cross-modal alignmentScene Understanding	—Unverified
Context-Enhanced Video Moment Retrieval with Large Language Models	May 21, 2024	cross-modal alignmentLanguage Modeling	—Unverified
Continual learning in cross-modal retrieval	Apr 14, 2021	Continual Learningcross-modal alignment	—Unverified
Continuous Sign Language Recognition Through Cross-Modal Alignment of Video and Text Embeddings in a Joint-Latent Space	May 11, 2020	cross-modal alignmentDecoder	—Unverified
COST: Contrastive One-Stage Transformer for Vision-Language Small Object Tracking	Apr 2, 2025	cross-modal alignmentObject	—Unverified
CoVLR: Coordinating Cross-Modal Consistency and Intra-Modal Structure for Vision-Language Retrieval	Apr 15, 2023	cross-modal alignmentCross-Modal Retrieval	—Unverified
Cross-attention for State-based model RWKV-7	Apr 19, 2025	cross-modal alignmentImage Generation	—Unverified
Cross-aware Early Fusion with Stage-divided Vision and Language Transformer Encoders for Referring Image Segmentation	Aug 14, 2024	cross-modal alignmentImage Segmentation	—Unverified
Cross-Modal Alignment Learning of Vision-Language Conceptual Systems	Jul 31, 2022	cross-modal alignmentRepresentation Learning	—Unverified
Cross-Modal Alignment with Mixture Experts Neural Network for Intral-City Retail Recommendation	Sep 17, 2020	cross-modal alignmentImage to text	—Unverified
Cross-modal Alignment with Optimal Transport for CTC-based ASR	Sep 24, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Cross-Modal Attention Alignment Network with Auxiliary Text Description for zero-shot sketch-based image retrieval	Jul 1, 2024	cross-modal alignmentImage Retrieval	—Unverified
Cross-modal Context Fusion and Adaptive Graph Convolutional Network for Multimodal Conversational Emotion Recognition	Jan 25, 2025	cross-modal alignmentEmotion Classification	—Unverified
Cross-Modal Cross-Domain Moment Alignment Network for Person Search	Jun 1, 2020	cross-modal alignmentPerson Search	—Unverified
Cross-Modal Denoising: A Novel Training Paradigm for Enhancing Speech-Image Retrieval	Aug 15, 2024	cross-modal alignmentDenoising	—Unverified
Cross-Modal Prototype based Multimodal Federated Learning under Severely Missing Modality	Jan 25, 2024	cross-modal alignmentFederated Learning	—Unverified
Cross-modal Semantic Enhanced Interaction for Image-Sentence Retrieval	Oct 17, 2022	cross-modal alignmentObject	—Unverified
CTPD: Cross-Modal Temporal Pattern Discovery for Enhanced Multimodal Electronic Health Records Analysis	Nov 1, 2024	cross-modal alignmentPhenotype classification	—Unverified
Curriculum Audiovisual Learning	Jan 26, 2020	Clusteringcross-modal alignment	—Unverified
DALR: Dual-level Alignment Learning for Multimodal Sentence Representation Learning	Jun 26, 2025	cross-modal alignmentRepresentation Learning	—Unverified
DAP: Domain-aware Prompt Learning for Vision-and-Language Navigation	Nov 29, 2023	cross-modal alignmentNavigate	—Unverified
Towards Brain Passage Retrieval -- An Investigation of EEG Query Representations	Dec 9, 2024	cross-modal alignmentEEG	—Unverified
Deformable Attentive Visual Enhancement for Referring Segmentation Using Vision-Language Model	May 25, 2025	cross-modal alignmentImage Segmentation	—Unverified
Denoising and Alignment: Rethinking Domain Generalization for Multimodal Face Anti-Spoofing	May 14, 2025	cross-modal alignmentDenoising	—Unverified
DenseGrounding: Improving Dense Language-Vision Semantics for Ego-Centric 3D Visual Grounding	May 8, 2025	3D visual groundingcross-modal alignment	—Unverified
Detection-based Intermediate Supervision for Visual Question Answering	Dec 26, 2023	cross-modal alignmentLogical Reasoning	—Unverified
DF-Calib: Targetless LiDAR-Camera Calibration via Depth Flow	Apr 2, 2025	Autonomous DrivingCamera Calibration	—Unverified
DiffCloth: Diffusion Based Garment Synthesis and Manipulation via Structural Cross-modal Semantic Alignment	Aug 22, 2023	AttributeConstituency Parsing	—Unverified
DiSa: Directional Saliency-Aware Prompt Learning for Generalizable Vision-Language Models	May 26, 2025	cross-modal alignmentDomain Generalization	—Unverified
Disentangled Noisy Correspondence Learning	Aug 10, 2024	cross-modal alignmentCross-Modal Retrieval	—Unverified
Does Vision Accelerate Hierarchical Generalization in Neural Language Learners?	Feb 1, 2023	cross-modal alignmentLanguage Acquisition	—Unverified
Does Your 3D Encoder Really Work? When Pretrain-SFT from 2D VLMs Meets 3D VLMs	Jun 5, 2025	cross-modal alignmentDense Captioning	—Unverified
Technical Approach for the EMI Challenge in the 8th Affective Behavior Analysis in-the-Wild Competition	Mar 13, 2025	Contrastive Learningcross-modal alignment	—Unverified
DUNIA: Pixel-Sized Embeddings via Cross-Modal Alignment for Earth Observation Applications	Feb 24, 2025	cross-modal alignmentEarth Observation	—Unverified
Dynamic Cross-Modal Alignment for Robust Semantic Location Prediction	Dec 13, 2024	cross-modal alignmentPrediction	—Unverified
EA-VTR: Event-Aware Video-Text Retrieval	Jul 10, 2024	Action RecognitionContrastive Learning	—Unverified
EMMA: Empowering Multi-modal Mamba with Structural and Hierarchical Alignment	Oct 8, 2024	cross-modal alignmentHallucination	—Unverified
EmotionRankCLAP: Bridging Natural Language Speaking Styles and Ordinal Speech Emotion via Rank-N-Contrast	May 29, 2025	Contrastive Learningcross-modal alignment	—Unverified
End-to-end Semantic Object Detection with Cross-Modal Alignment	Feb 10, 2023	Contrastive Learningcross-modal alignment	—Unverified
Enhancing Emotion Recognition in Incomplete Data: A Novel Cross-Modal Alignment, Reconstruction, and Refinement Framework	Jul 12, 2024	Contrastive Learningcross-modal alignment	—Unverified
Enhancing LLMs for Time Series Forecasting via Structure-Guided Cross-Modal Alignment	May 19, 2025	cross-modal alignmentTime Series	—Unverified
Enhancing Modality Representation and Alignment for Multimodal Cold-start Active Learning	Dec 12, 2024	Active Learningcross-modal alignment	—Unverified
Enhancing Multimodal Emotion Recognition through Multi-Granularity Cross-Modal Alignment	Dec 30, 2024	cross-modal alignmentEmotion Recognition	—Unverified
Enhancing Vision-Language Compositional Understanding with Multimodal Synthetic Data	Mar 3, 2025	cross-modal alignmentStyle Transfer	—Unverified
Evaluating Attribute Confusion in Fashion Text-to-Image Generation	Jul 9, 2025	Attributecross-modal alignment	—Unverified
Exploring Information-Theoretic Metrics Associated with Neural Collapse in Supervised Training	Sep 25, 2024	Classificationcross-modal alignment	—Unverified
Fine-grained Semantic Alignment Network for Weakly Supervised Temporal Language Grounding	Oct 21, 2022	cross-modal alignmentSentence	—Unverified
FineLIP: Extending CLIP's Reach via Fine-Grained Alignment with Longer Text Inputs	Apr 2, 2025	cross-modal alignmentCross-Modal Retrieval	—Unverified
From Alignment to Advancement: Bootstrapping Audio-Language Alignment with Synthetic Data	May 26, 2025	cross-modal alignmentInstruction Following	—Unverified

Show:10 25 50

← PrevPage 4 of 7Next →

No leaderboard results yet.