cross-modal alignment

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 226–250 of 342 papers

Title	Date	Tasks	Status	Hype
OpenSight: A Simple Open-Vocabulary Framework for LiDAR-Based Object Detection	Dec 12, 2023	cross-modal alignmentobject-detection	—Unverified	0
Navigating Open Set Scenarios for Skeleton-based Action Recognition	Dec 11, 2023	Action RecognitionActivity Recognition	CodeCode Available	1
Progressive Multi-Modality Learning for Inverse Protein Folding	Dec 11, 2023	cross-modal alignmentData Augmentation	CodeCode Available	1
PMMTalk: Speech-Driven 3D Facial Animation from Complementary Pseudo Multi-modal Features	Dec 5, 2023	cross-modal alignmentDecoder	—Unverified	0
DAP: Domain-aware Prompt Learning for Vision-and-Language Navigation	Nov 29, 2023	cross-modal alignmentNavigate	—Unverified	0
MCAD: Multi-teacher Cross-modal Alignment Distillation for efficient image-text retrieval	Oct 30, 2023	cross-modal alignmentImage-text Retrieval	—Unverified	0
Video Referring Expression Comprehension via Transformer with Content-conditioned Query	Oct 25, 2023	cross-modal alignmentReferring Expression	—Unverified	0
On the Language Encoder of Contrastive Cross-modal Models	Oct 20, 2023	cross-modal alignmentSentence	—Unverified	0
Separating Invisible Sounds Toward Universal Audiovisual Scene-Aware Sound Separation	Oct 18, 2023	cross-modal alignment	—Unverified	0
Robust Graph Matching Using An Unbalanced Hierarchical Optimal Transport Framework	Oct 18, 2023	cross-modal alignmentGraph Matching	CodeCode Available	0
CoDA: Collaborative Novel Box Discovery and Cross-modal Alignment for Open-vocabulary 3D Object Detection	Oct 4, 2023	3D Object Detectioncross-modal alignment	CodeCode Available	2
ReForm-Eval: Evaluating Large Vision Language Models via Unified Re-Formulation of Task-Oriented Benchmarks	Oct 4, 2023	cross-modal alignment	CodeCode Available	1
Prototype-guided Cross-modal Completion and Alignment for Incomplete Text-based Person Re-identification	Sep 29, 2023	cross-modal alignmentPerson Re-Identification	—Unverified	0
Align before Search: Aligning Ads Image to Text for Accurate Cross-Modal Sponsored Search	Sep 28, 2023	cross-modal alignmentCross-Modal Retrieval	CodeCode Available	0
VDC: Versatile Data Cleanser based on Visual-Linguistic Inconsistency by Multimodal Large Language Models	Sep 28, 2023	Backdoor Attackcross-modal alignment	CodeCode Available	1
Cross-modal Alignment with Optimal Transport for CTC-based ASR	Sep 24, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Sound Source Localization is All about Cross-Modal Alignment	Sep 19, 2023	Allcross-modal alignment	—Unverified	0
Multi-Semantic Fusion Model for Generalized Zero-Shot Skeleton-Based Action Recognition	Sep 18, 2023	Action Recognitioncross-modal alignment	CodeCode Available	1
Prompt-based Context- and Domain-aware Pretraining for Vision and Language Navigation	Sep 7, 2023	Contrastive Learningcross-modal alignment	—Unverified	0
Towards High-Fidelity Text-Guided 3D Face Generation and Manipulation Using only Images	Aug 31, 2023	3D Shape GenerationContrastive Learning	—Unverified	0
Position-Enhanced Visual Instruction Tuning for Multimodal Large Language Models	Aug 25, 2023	cross-modal alignmentPosition	CodeCode Available	1
Grounded Entity-Landmark Adaptive Pre-training for Vision-and-Language Navigation	Aug 24, 2023	cross-modal alignmentDescriptive	CodeCode Available	1
DiffCloth: Diffusion Based Garment Synthesis and Manipulation via Structural Cross-modal Semantic Alignment	Aug 22, 2023	AttributeConstituency Parsing	—Unverified	0
Language-Guided Diffusion Model for Visual Grounding	Aug 18, 2023	cross-modal alignmentDenoising	CodeCode Available	0
AerialVLN: Vision-and-Language Navigation for UAVs	Aug 13, 2023	cross-modal alignmentNavigate	CodeCode Available	2

Show:10 25 50

← PrevPage 10 of 14Next →

No leaderboard results yet.