SOTAVerified|Agents Browse Leaderboard About

cross-modal alignment

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–110 of 342 papers

Title	Date	Tasks	Status	Hype
Grounded Entity-Landmark Adaptive Pre-training for Vision-and-Language Navigation	Aug 24, 2023	cross-modal alignmentDescriptive	CodeCode Available	1
RSRefSeg 2: Decoupling Referring Remote Sensing Image Segmentation with Foundation Models	Jul 8, 2025	cross-modal alignmentImage Segmentation	CodeCode Available	1
Mask Grounding for Referring Image Segmentation	Dec 19, 2023	cross-modal alignmentImage Segmentation	CodeCode Available	1
Diffusion Bridge: Leveraging Diffusion Model to Reduce the Modality Gap Between Text and Vision for Zero-Shot Image Captioning	Jan 1, 2025	cross-modal alignmentDenoising	CodeCode Available	1
EPMF: Efficient Perception-aware Multi-sensor Fusion for 3D Semantic Segmentation	Jun 21, 2021	3D Semantic SegmentationAutonomous Driving	CodeCode Available	1
SOC: Semantic-Assisted Object Cluster for Referring Video Object Segmentation	May 26, 2023	cross-modal alignmentObject	CodeCode Available	1
Co-AttenDWG: Co-Attentive Dimension-Wise Gating and Expert Fusion for Multi-Modal Offensive Content Detection	May 25, 2025	cross-modal alignmentScene Understanding	—Unverified	0
Coarse-to-fine Alignment Makes Better Speech-image Retrieval	Aug 15, 2024	cross-modal alignmentImage Retrieval	—Unverified	0
A Survey of Automatic Prompt Engineering: An Optimization Perspective	Feb 17, 2025	cross-modal alignmentPrompt Engineering	—Unverified	0
CLIP-PING: Boosting Lightweight Vision-Language Models with Proximus Intrinsic Neighbors Guidance	Dec 5, 2024	Contrastive Learningcross-modal alignment	—Unverified	0

Show:10 25 50

← PrevPage 11 of 35Next →

No leaderboard results yet.