cross-modal alignment

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 301–325 of 342 papers

Title	Date	Tasks	Status
Fine-grained Semantic Alignment Network for Weakly Supervised Temporal Language Grounding	Oct 21, 2022	cross-modal alignmentSentence	—Unverified
Discrete Cross-Modal Alignment Enables Zero-Shot Speech Translation	Oct 18, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Cross-modal Semantic Enhanced Interaction for Image-Sentence Retrieval	Oct 17, 2022	cross-modal alignmentObject	—Unverified
Video Referring Expression Comprehension via Transformer with Content-aware Query	Oct 6, 2022	cross-modal alignmentReferring Expression	—Unverified
JPG - Jointly Learn to Align: Automated Disease Prediction and Radiology Report Generation	Oct 1, 2022	cross-modal alignmentDisease Prediction	—Unverified
TokenFlow: Rethinking Fine-grained Cross-modal Alignment in Vision-Language Retrieval	Sep 28, 2022	cross-modal alignmentRetrieval	—Unverified
Translation, Scale and Rotation: Cross-Modal Alignment Meets RGB-Infrared Vehicle Detection	Sep 28, 2022	2D Object Detectioncross-modal alignment	—Unverified
Multi-Modal Cross-Domain Alignment Network for Video Moment Retrieval	Sep 23, 2022	cross-modal alignmentInformation Retrieval	—Unverified
OmniVL:One Foundation Model for Image-Language and Video-Language Tasks	Sep 15, 2022	Action ClassificationAction Recognition	—Unverified
See What You See: Self-supervised Cross-modal Retrieval of Visual Stimuli from Brain Activity	Aug 7, 2022	cross-modal alignmentCross-Modal Retrieval	—Unverified
Masked Vision and Language Modeling for Multi-modal Representation Learning	Aug 3, 2022	cross-modal alignmentLanguage Modeling	—Unverified
Cross-Modal Alignment Learning of Vision-Language Conceptual Systems	Jul 31, 2022	cross-modal alignmentRepresentation Learning	—Unverified
A Priority Map for Vision-and-Language Navigation with Trajectory Plans and Feature-Location Cues	Jul 24, 2022	cross-modal alignmentTrajectory Planning	CodeCode Available
VLMixer: Unpaired Vision-Language Pre-training via Cross-Modal CutMix	Jun 17, 2022	Contrastive Learningcross-modal alignment	—Unverified
Reinforced Cross-modal Alignment for Radiology Report Generation	May 1, 2022	cross-modal alignmentDecision Making	CodeCode Available
LayoutLMv3: Pre-training for Document AI with Unified Text and Image Masking	Apr 18, 2022	cross-modal alignmentDocument AI	CodeCode Available
mSLAM: Massively multilingual joint pre-training for speech and text	Feb 3, 2022	cross-modal alignmentintent-classification	—Unverified
ERNIE-Layout: Layout-Knowledge Enhanced Multi-modal Pre-training for Document Understanding	Jan 16, 2022	cross-modal alignmentDocument Classification	CodeCode Available
KD-VLP: Improving End-to-End Vision-and-Language Pretraining with Object Knowledge Distillation	Jan 16, 2022	cross-modal alignmentKnowledge Distillation	—Unverified
Learning Better Visual Representations for Weakly-Supervised Object Detection Using Natural Language Supervision	Sep 29, 2021	cross-modal alignmentobject-detection	—Unverified
KD-VLP: Improving End-to-End Vision-and-Language Pretraining with Object Knowledge Distillation	Sep 22, 2021	cross-modal alignmentKnowledge Distillation	CodeCode Available
Learning Joint Embedding with Modality Alignments for Cross-Modal Retrieval of Recipes and Food Images	Aug 9, 2021	cross-modal alignmentCross-Modal Retrieval	—Unverified
Structured Multi-modal Feature Embedding and Alignment for Image-Sentence Retrieval	Aug 5, 2021	cross-modal alignmentRetrieval	—Unverified
Improving Cross-Modal Alignment in Vision Language Navigation via Syntactic Information	Apr 19, 2021	cross-modal alignmentNavigate	CodeCode Available
Continual learning in cross-modal retrieval	Apr 14, 2021	Continual Learningcross-modal alignment	—Unverified

Show:10 25 50

← PrevPage 13 of 14Next →

No leaderboard results yet.