SOTAVerified|Agents Browse Leaderboard About Blog

cross-modal alignment

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 31–40 of 342 papers

Title	Date	Tasks	Status	Hype	Score
Conditional Variational Autoencoder for Sign Language Translation with Cross-Modal Alignment	Dec 25, 2023	cross-modal alignmentDecoder	CodeCode Available	1	5
ASAP: Advancing Semantic Alignment Promotes Multi-Modal Manipulation Detecting and Grounding	Dec 17, 2024	cross-modal alignment	CodeCode Available	1	5
DSGN++: Exploiting Visual-Spatial Relation for Stereo-based 3D Detectors	Apr 6, 2022	3D geometry3D Object Detection	CodeCode Available	1	5
Dynamic Modality Interaction Modeling for Image-Text Retrieval	Jul 11, 2021	cross-modal alignmentCross-Modal Retrieval	CodeCode Available	1	5
Diffusion Bridge: Leveraging Diffusion Model to Reduce the Modality Gap Between Text and Vision for Zero-Shot Image Captioning	Jan 1, 2025	cross-modal alignmentDenoising	CodeCode Available	1	5
Advancing Multi-grained Alignment for Contrastive Language-Audio Pre-training	Aug 15, 2024	cross-modal alignment	CodeCode Available	1	5
CoMP: Continual Multimodal Pre-training for Vision Foundation Models	Mar 24, 2025	cross-modal alignment	CodeCode Available	1	5
Distractors-Immune Representation Learning with Cross-modal Contrastive Regularization for Change Captioning	Jul 16, 2024	Caption Generationcross-modal alignment	CodeCode Available	1	5
Efficient Vision-Language Pretraining with Visual Concepts and Hierarchical Alignment	Aug 29, 2022	cross-modal alignmentImage-text Retrieval	CodeCode Available	1	5
AlignVSR: Audio-Visual Cross-Modal Alignment for Visual Speech Recognition	Oct 21, 2024	cross-modal alignmentspeech-recognition	CodeCode Available	1	5

Show:10 25 50

← PrevPage 4 of 35Next →

No leaderboard results yet.