cross-modal alignment

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 251–275 of 342 papers

Title	Date	Tasks	Status	Hype
Contrast-augmented Diffusion Model with Fine-grained Sequence Alignment for Markup-to-Image Generation	Aug 2, 2023	cross-modal alignmentDenoising	CodeCode Available	0
Text-guided Image Restoration and Semantic Enhancement for Text-to-Image Person Retrieval	Jul 18, 2023	cross-modal alignmentData Augmentation	CodeCode Available	1
WiCo: Win-win Cooperation of Bottom-up and Top-down Referring Image Segmentation	Jun 19, 2023	cross-modal alignmentImage Segmentation	—Unverified	0
Retrieving-to-Answer: Zero-Shot Video Question Answering with Frozen Large Language Models	Jun 15, 2023	cross-modal alignmentDomain Generalization	—Unverified	0
Global and Local Semantic Completion Learning for Vision-Language Pre-training	Jun 12, 2023	cross-modal alignmentImage-text Retrieval	CodeCode Available	1
ManagerTower: Aggregating the Insights of Uni-Modal Experts for Vision-Language Representation Learning	May 31, 2023	cross-modal alignmentRepresentation Learning	CodeCode Available	1
SOC: Semantic-Assisted Object Cluster for Referring Video Object Segmentation	May 26, 2023	cross-modal alignmentObject	CodeCode Available	1
Improving speech translation by fusing speech and text	May 23, 2023	cross-modal alignmentMachine Translation	—Unverified	0
Speech-Text Dialog Pre-training for Spoken Dialog Understanding with Explicit Cross-Modal Alignment	May 19, 2023	cross-modal alignmentEmotion Recognition in Conversation	—Unverified	0
Multi-task Paired Masking with Alignment Modeling for Medical Vision-Language Pre-training	May 13, 2023	cross-modal alignment	—Unverified	0
AlignSTS: Speech-to-Singing Conversion via Cross-Modal Alignment	May 8, 2023	cross-modal alignmentRhythm	—Unverified	0
Towards Medical Artificial General Intelligence via Knowledge-Enhanced Multimodal Pretraining	Apr 26, 2023	cross-modal alignmentMedical Visual Question Answering	CodeCode Available	1
CoVLR: Coordinating Cross-Modal Consistency and Intra-Modal Structure for Vision-Language Retrieval	Apr 15, 2023	cross-modal alignmentCross-Modal Retrieval	—Unverified	0
Unraveling Instance Associations: A Closer Look for Audio-Visual Segmentation	Apr 6, 2023	audio-visual learningContrastive Learning	CodeCode Available	1
SoftCLIP: Softer Cross-modal Alignment Makes CLIP Stronger	Mar 30, 2023	cross-modal alignmentzero-shot-classification	—Unverified	0
Unmasked Teacher: Towards Training-Efficient Video Foundation Models	Mar 28, 2023	Action ClassificationAction Recognition	CodeCode Available	0
Revisiting Multimodal Representation in Contrastive Learning: From Patch and Token Embeddings to Finite Discrete Tokens	Mar 27, 2023	Contrastive Learningcross-modal alignment	CodeCode Available	1
CVT-SLR: Contrastive Visual-Textual Transformation for Sign Language Recognition with Variational Alignment	Mar 10, 2023	cross-modal alignmentSign Language Recognition	CodeCode Available	1
LoGoNet: Towards Accurate 3D Object Detection with Local-to-Global Cross-Modal Fusion	Mar 7, 2023	3D Object Detectioncross-modal alignment	CodeCode Available	0
HiCLIP: Contrastive Language-Image Pretraining with Hierarchy-aware Attention	Mar 6, 2023	cross-modal alignment	CodeCode Available	1
TOT: Topology-Aware Optimal Transport For Multimodal Hate Detection	Feb 27, 2023	cross-modal alignment	—Unverified	0
End-to-end Semantic Object Detection with Cross-Modal Alignment	Feb 10, 2023	Contrastive Learningcross-modal alignment	—Unverified	0
Does Vision Accelerate Hierarchical Generalization in Neural Language Learners?	Feb 1, 2023	cross-modal alignmentLanguage Acquisition	—Unverified	0
Improving Cross-modal Alignment for Text-Guided Image Inpainting	Jan 26, 2023	cross-modal alignmentImage Inpainting	—Unverified	0
Linguistic Query-Guided Mask Generation for Referring Image Segmentation	Jan 16, 2023	Contrastive Learningcross-modal alignment	—Unverified	0

Show:10 25 50

← PrevPage 11 of 14Next →

No leaderboard results yet.