multimodal interaction

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–75 of 106 papers

Title	Date	Tasks	Status
RGBT Tracking via All-layer Multimodal Interactions with Progressive Fusion Mamba	Aug 16, 2024	AllMamba	—Unverified
Dissecting Dissonance: Benchmarking Large Multimodal Models Against Self-Contradictory Instructions	Aug 2, 2024	Benchmarkingmultimodal interaction	CodeCode Available
A Unified Understanding of Adversarial Vulnerability Regarding Unimodal Models and Vision-Language Pre-training Models	Jul 25, 2024	Data Augmentationmultimodal interaction	—Unverified
Dallah: A Dialect-Aware Multimodal Large Language Model for Arabic	Jul 25, 2024	Image to textLanguage Modeling	—Unverified
Empathic Grounding: Explorations using Multimodal Interaction and Large Language Models with Conversational Agents	Jul 1, 2024	Emotional IntelligenceEmotion Classification	CodeCode Available
HGNET: A Hierarchical Feature Guided Network for Occupancy Flow Field Prediction	Jul 1, 2024	Autonomous Drivingmultimodal interaction	—Unverified
A look under the hood of the Interactive Deep Learning Enterprise (No-IDLE)	Jun 27, 2024	AnatomyDeep Learning	—Unverified
OmniJARVIS: Unified Vision-Language-Action Tokenization Enables Open-World Instruction Following Agents	Jun 27, 2024	DecoderImitation Learning	—Unverified
EMMI -- Empathic Multimodal Motivational Interviews Dataset: Analyses and Annotations	Jun 24, 2024	multimodal interaction	—Unverified
Revisiting Multimodal Emotion Recognition in Conversation from the Perspective of Graph Spectrum	Apr 27, 2024	Contrastive LearningEmotion Recognition	—Unverified
BlendScape: Enabling End-User Customization of Video-Conferencing Environments through Generative AI	Mar 20, 2024	Image Generationmultimodal interaction	—Unverified
Improving Adversarial Transferability of Vision-Language Pre-training Models through Collaborative Multimodal Interaction	Mar 16, 2024	Adversarial RobustnessImage-text Retrieval	—Unverified
On the Arrow of Inference	Feb 22, 2024	counterfactualCounterfactual Reasoning	—Unverified
Memory-Inspired Temporal Prompt Interaction for Text-Image Classification	Jan 26, 2024	Classificationimage-classification	—Unverified
Dynamic Hand Gesture-Featured Human Motor Adaptation in Tool Delivery using Voice Recognition	Sep 20, 2023	Gesture RecognitionHand Gesture Recognition	—Unverified
Adaptive User-centered Neuro-symbolic Learning for Multimodal Interaction with Autonomous Systems	Sep 11, 2023	Incremental Learningmultimodal interaction	—Unverified
Expanding the Role of Affective Phenomena in Multimodal Interaction Research	May 18, 2023	multimodal interaction	—Unverified
A Comprehensive Survey of AI-Generated Content (AIGC): A History of Generative AI from GAN to ChatGPT	Mar 7, 2023	multimodal interaction	CodeCode Available
HTML: Hybrid Temporal-scale Multimodal Learning Framework for Referring Video Object Segmentation	Jan 1, 2023	multimodal interactionObject	—Unverified
InterMulti:Multi-view Multimodal Interactions with Text-dominated Hierarchical High-order Fusion for Emotion Analysis	Dec 20, 2022	Emotion Recognitionmultimodal interaction	—Unverified
A novel multimodal dynamic fusion network for disfluency detection in spoken utterances	Nov 27, 2022	multimodal interaction	—Unverified
Adaptive Contrastive Learning on Multimodal Transformer for Review Helpfulness Predictions	Nov 7, 2022	Contrastive Learningmultimodal interaction	CodeCode Available
Adaptive User-Centered Multimodal Interaction towards Reliable and Trusted Automotive Interfaces	Nov 7, 2022	multimodal interaction	—Unverified
Semantics-Consistent Cross-domain Summarization via Optimal Transport Alignment	Oct 10, 2022	Articlesmultimodal interaction	—Unverified
MAMO: Masked Multimodal Modeling for Fine-Grained Vision-Language Representation Learning	Oct 9, 2022	Image-text Retrievalmultimodal interaction	—Unverified

Show:10 25 50

← PrevPage 3 of 5Next →

No leaderboard results yet.