cross-modal alignment

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 201–225 of 342 papers

Title	Date	Tasks	Status	Hype
MMA-DFER: MultiModal Adaptation of unimodal models for Dynamic Facial Expression Recognition in-the-wild	Apr 13, 2024	cross-modal alignmentDynamic Facial Expression Recognition	CodeCode Available	2
Distributionally Robust Alignment for Medical Federated Vision-Language Pre-training Under Data Heterogeneity	Apr 5, 2024	cross-modal alignmentFederated Learning	—Unverified	0
CIRP: Cross-Item Relational Pre-training for Multimodal Product Bundling	Apr 2, 2024	cross-modal alignmentGraph Learning	—Unverified	0
SeCG: Semantic-Enhanced 3D Visual Grounding via Cross-modal Graph Attention	Mar 13, 2024	3D visual groundingcross-modal alignment	CodeCode Available	0
Multi-Grained Cross-modal Alignment for Learning Open-vocabulary Semantic Segmentation from Text Supervision	Mar 6, 2024	Contrastive Learningcross-modal alignment	—Unverified	0
A Cross-Modal Approach to Silent Speech with LLM-Enhanced Recognition	Mar 2, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
Multi-modal Attribute Prompting for Vision-Language Models	Mar 1, 2024	Attributecross-modal alignment	—Unverified	0
Semantics-enhanced Cross-modal Masked Image Modeling for Vision-Language Pre-training	Mar 1, 2024	cross-modal alignmentRepresentation Learning	—Unverified	0
MENTOR: Multi-level Self-supervised Learning for Multimodal Recommendation	Feb 29, 2024	cross-modal alignmentMultimodal Recommendation	CodeCode Available	1
Mind the Modality Gap: Towards a Remote Sensing Vision-Language Model via Cross-modal Alignment	Feb 15, 2024	cross-modal alignmentCross-Modal Retrieval	—Unverified	0
Cross-Modal Prototype based Multimodal Federated Learning under Severely Missing Modality	Jan 25, 2024	cross-modal alignmentFederated Learning	—Unverified	0
Multi-level Cross-modal Alignment for Image Clustering	Jan 22, 2024	Clusteringcross-modal alignment	—Unverified	0
The Devil is in the Details: Boosting Guided Depth Super-Resolution via Rethinking Cross-Modal Alignment and Aggregation	Jan 16, 2024	cross-modal alignmentfeature selection	CodeCode Available	1
Self-supervised Feature Adaptation for 3D Industrial Anomaly Detection	Jan 6, 2024	Anomaly Detectioncross-modal alignment	—Unverified	0
Auffusion: Leveraging the Power of Diffusion and Large Language Models for Text-to-Audio Generation	Jan 2, 2024	Audio Generationcross-modal alignment	CodeCode Available	2
Linguistic-Aware Patch Slimming Framework for Fine-grained Cross-Modal Alignment	Jan 1, 2024	cross-modal alignmentCross-Modal Retrieval	CodeCode Available	2
Multi-Prompts Learning with Cross-Modal Alignment for Attribute-based Person Re-Identification	Dec 28, 2023	Attributecross-modal alignment	—Unverified	0
Detection-based Intermediate Supervision for Visual Question Answering	Dec 26, 2023	cross-modal alignmentLogical Reasoning	—Unverified	0
Conditional Variational Autoencoder for Sign Language Translation with Cross-Modal Alignment	Dec 25, 2023	cross-modal alignmentDecoder	CodeCode Available	1
BrainVis: Exploring the Bridge between Brain and Visual Signals via Image Reconstruction	Dec 22, 2023	cross-modal alignmentEEG	CodeCode Available	1
Towards Balanced Alignment: Modal-Enhanced Semantic Modeling for Video Moment Retrieval	Dec 19, 2023	cross-modal alignmentMoment Retrieval	CodeCode Available	1
Mask Grounding for Referring Image Segmentation	Dec 19, 2023	cross-modal alignmentImage Segmentation	CodeCode Available	1
M^2ConceptBase: A Fine-Grained Aligned Concept-Centric Multimodal Knowledge Base	Dec 16, 2023	cross-modal alignmentKnowledge Graphs	CodeCode Available	0
Improving Cross-modal Alignment with Synthetic Pairs for Text-only Image Captioning	Dec 14, 2023	cross-modal alignmentDecoder	—Unverified	0
ViLA: Efficient Video-Language Alignment for Video Question Answering	Dec 13, 2023	cross-modal alignmentLanguage Modeling	CodeCode Available	1

Show:10 25 50

← PrevPage 9 of 14Next →

No leaderboard results yet.