SOTAVerified|Agents Browse Leaderboard About Blog

cross-modal alignment

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 31–40 of 342 papers

Title	Date	Tasks	Status	Hype
U-SAM: An audio language Model for Unified Speech, Audio, and Music Understanding	May 20, 2025	cross-modal alignmentLanguage Modeling	CodeCode Available	1
MSCI: Addressing CLIP's Inherent Limitations for Compositional Zero-Shot Learning	May 15, 2025	Compositional Zero-Shot Learningcross-modal alignment	CodeCode Available	1
CAV-MAE Sync: Improving Contrastive Audio-Visual Mask Autoencoders via Fine-Grained Alignment	May 2, 2025	audio-visual learningcross-modal alignment	CodeCode Available	1
Multimodal Fusion and Vision-Language Models: A Survey for Robot Vision	Apr 3, 2025	3D Object Detectioncross-modal alignment	CodeCode Available	1
BiPVL-Seg: Bidirectional Progressive Vision-Language Fusion with Global-Local Alignment for Medical Image Segmentation	Mar 30, 2025	cross-modal alignmentImage Segmentation	CodeCode Available	1
LPOSS: Label Propagation Over Patches and Pixels for Open-vocabulary Semantic Segmentation	Mar 25, 2025	cross-modal alignmentOpen Vocabulary Semantic Segmentation	CodeCode Available	1
CoMP: Continual Multimodal Pre-training for Vision Foundation Models	Mar 24, 2025	cross-modal alignment	CodeCode Available	1
Enhanced OoD Detection through Cross-Modal Alignment of Multi-Modal Representations	Mar 24, 2025	cross-modal alignmentImage Classification	CodeCode Available	1
Cross-modal Causal Relation Alignment for Video Question Grounding	Mar 5, 2025	Contrastive Learningcross-modal alignment	CodeCode Available	1
SwimVG: Step-wise Multimodal Fusion and Adaption for Visual Grounding	Feb 24, 2025	cross-modal alignmentVisual Grounding	CodeCode Available	1

Show:10 25 50

← PrevPage 4 of 35Next →

No leaderboard results yet.