Multimodal Recommendation

The multimodal recommendation task involves developing systems that leverage and integrate multiple types of data—such as text, images, audio, and user interactions—to predict and suggest items that align with a user's preferences. Unlike traditional recommendation approaches that rely on a single data modality, multimodal recommendation harnesses the diverse information from various sources to create richer and more nuanced representations of both users and items. This integration enables the system to understand and capture complex relationships and attributes across different data types, thereby enhancing the accuracy and relevance of the recommendations. The primary goal is to provide personalized suggestions by effectively merging and processing heterogeneous data to better match users with items they are likely to engage with or find valuable.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–50 of 59 papers

Title	Date	Tasks	Status	Hype	Score
Modality-Independent Graph Neural Networks with Global Transformers for Multimodal Recommendation	Dec 18, 2024	Graph LearningMulti-modal Recommendation	CodeCode Available	2	5
A Comprehensive Survey on Multimodal Recommender Systems: Taxonomy, Evaluation, and Future Directions	Feb 9, 2023	Multimodal RecommendationRecommendation Systems	CodeCode Available	2	5
MENTOR: Multi-level Self-supervised Learning for Multimodal Recommendation	Feb 29, 2024	cross-modal alignmentMultimodal Recommendation	CodeCode Available	1	5
Mining Latent Structures for Multimedia Recommendation	Apr 19, 2021	Collaborative FilteringMultimedia recommendation	CodeCode Available	1	5
Mirror Gradient: Towards Robust Multimodal Recommender Systems via Exploring Flat Local Minima	Feb 17, 2024	Multimodal RecommendationRecommendation Systems	CodeCode Available	1	5
A Tale of Two Graphs: Freezing and Denoising Graph Structures for Multimodal Recommendation	Nov 13, 2022	DenoisingGraph structure learning	CodeCode Available	1	5
Modality-Balanced Learning for Multimedia Recommendation	Jul 26, 2024	Collaborative Filteringcounterfactual	CodeCode Available	1	5
LGMRec: Local and Global Graph Learning for Multimodal Recommendation	Dec 27, 2023	Graph EmbeddingGraph Learning	CodeCode Available	1	5
Disentangled Graph Variational Auto-Encoder for Multimodal Recommendation with Interpretability	Feb 25, 2024	Collaborative FilteringMultimodal Recommendation	CodeCode Available	1	5
Generating with Fairness: A Modality-Diffused Counterfactual Framework for Incomplete Multimodal Recommendations	Jan 21, 2025	counterfactualFairness	CodeCode Available	1	5
Spectrum-based Modality Representation Fusion Graph Convolutional Network for Multimodal Recommendation	Dec 19, 2024	Graph LearningMultimodal Recommendation	CodeCode Available	1	5
GUME: Graphs and User Modalities Enhancement for Long-Tail Multimodal Recommendation	Jul 17, 2024	Multimodal RecommendationRecommendation Systems	CodeCode Available	1	5
Harnessing Multimodal Large Language Models for Multimodal Sequential Recommendation	Aug 19, 2024	Large Language ModelMultimodal Large Language Model	CodeCode Available	1	5
Train Once, Deploy Anywhere: Matryoshka Representation Learning for Multimodal Recommendation	Sep 25, 2024	Multimodal RecommendationRecommendation Systems	CodeCode Available	1	5
AlignRec: Aligning and Training in Multimodal Recommendations	Mar 19, 2024	Multimodal Recommendation	CodeCode Available	1	5
COHESION: Composite Graph Convolutional Network with Dual-Stage Fusion for Multimodal Recommendation	Apr 6, 2025	Multimodal RecommendationRepresentation Learning	CodeCode Available	1	5
LightGT: A Light Graph Transformer for Multimedia Recommendation	Jul 18, 2023	Collaborative FilteringMicrovideo Recommendation	CodeCode Available	1	5
Beyond Graph Convolution: Multimodal Recommendation with Topology-aware MLPs	Dec 16, 2024	Multimodal RecommendationRecommendation Systems	CodeCode Available	1	5
Ducho 2.0: Towards a More Up-to-Date Unified Framework for the Extraction of Multimodal Features in Recommendation	Mar 7, 2024	BenchmarkingMultimodal Recommendation	CodeCode Available	1	5
Ducho: A Unified Framework for the Extraction of Multimodal Features in Recommendation	Jun 29, 2023	Multimodal Recommendation	CodeCode Available	1	5
End-to-end training of Multimodal Model and ranking Model	Apr 9, 2024	Contrastive Learningmodel	CodeCode Available	1	5
Enhancing Dyadic Relations with Homogeneous Graphs for Multimodal Recommendation	Jan 28, 2023	Graph LearningMultimodal Recommendation	CodeCode Available	1	5
Causality-Inspired Fair Representation Learning for Multimodal Recommendation	Oct 26, 2023	AttributeCausal Inference	CodeCode Available	1	5
Quadratic Interest Network for Multimodal Click-Through Rate Prediction	Apr 24, 2025	Click-Through Rate PredictionMultimodal Recommendation	CodeCode Available	1	5
Do We Really Need to Drop Items with Missing Modalities in Multimodal Recommendation?	Aug 21, 2024	ImputationMultimodal Recommendation	CodeCode Available	0	5
STAIR: Manipulating Collaborative and Multimodal Information for E-Commerce Recommendation	Dec 16, 2024	Collaborative FilteringMultimodal Recommendation	CodeCode Available	0	5
MMGCN: Multi-modal Graph Convolution Network for Personalized Recommendation of Micro-video	Oct 19, 2019	Microvideo RecommendationMicro-video recommendations	CodeCode Available	0	5
Collaborative Filtering Meets Spectrum Shift: Connecting User-Item Interaction with Graph-Structured Side Information	Feb 12, 2025	Collaborative FilteringMultimodal Recommendation	CodeCode Available	0	5
Ducho meets Elliot: Large-scale Benchmarks for Multimodal Recommendation	Sep 24, 2024	BenchmarkingMovie Recommendation	CodeCode Available	0	5
Dynamic Multimodal Fusion via Meta-Learning Towards Micro-Video Recommendation	Jan 13, 2025	Meta-LearningMultimodal Recommendation	CodeCode Available	0	5
Semantic-Guided Feature Distillation for Multimodal Recommendation	Aug 6, 2023	Multimodal RecommendationRepresentation Learning	CodeCode Available	0	5
A Multimodal Single-Branch Embedding Network for Recommendation in Cold-Start and Missing Modality Scenarios	Sep 26, 2024	Collaborative FilteringMultimodal Recommendation	CodeCode Available	0	5
X-Reflect: Cross-Reflection Prompting for Multimodal Recommendation	Aug 27, 2024	Multimodal RecommendationRecommendation Systems	—Unverified	0	0
A Survey on Large Language Models in Multimodal Recommender Systems	May 14, 2025	In-Context LearningMultimodal Recommendation	—Unverified	0	0
ATFLRec: A Multimodal Recommender System with Audio-Text Fusion and Low-Rank Adaptation via Instruction-Tuned Large Language Model	Sep 13, 2024	Graph Neural NetworkLanguage Modeling	—Unverified	0	0
Attention-guided Multi-step Fusion: A Hierarchical Fusion Network for Multimodal Recommendation	Apr 24, 2023	Contrastive LearningMultimodal Recommendation	—Unverified	0	0
Attribute-driven Disentangled Representation Learning for Multimodal Recommendation	Dec 22, 2023	AttributeMultimodal Recommendation	—Unverified	0	0
Bridging Domain Gaps between Pretrained Multimodal Models and Recommendations	Feb 21, 2025	Multimodal RecommendationRecommendation Systems	—Unverified	0	0
Dealing with Missing Modalities in Multimodal Recommendation: a Feature Propagation-based Approach	Mar 28, 2024	Graph Representation LearningMultimodal Recommendation	—Unverified	0	0
Don't Lose Yourself: Boosting Multimodal Recommendation via Reducing Node-neighbor Discrepancy in Graph Convolutional Network	Dec 25, 2024	Multimodal RecommendationRecommendation Systems	—Unverified	0	0
DREAM: A Dual Representation Learning Model for Multimodal Recommendation	Apr 17, 2024	Multimodal RecommendationRepresentation Learning	—Unverified	0	0
HistLLM: A Unified Framework for LLM-Based Multimodal Recommendation with User History Encoding and Compression	Apr 14, 2025	Multimodal Recommendation	—Unverified	0	0
ID Embedding as Subtle Features of Content and Structure for Multimodal Recommendation	Nov 10, 2023	Contrastive LearningMultimodal Recommendation	—Unverified	0	0
Knowledge Soft Integration for Multimodal Recommendation	May 12, 2023	Graph Neural NetworkMultimodal Recommendation	—Unverified	0	0
Learning ID-free Item Representation with Token Crossing for Multimodal Recommendation	Oct 25, 2024	Multimodal RecommendationQuantization	—Unverified	0	0
MDVT: Enhancing Multimodal Recommendation with Model-Agnostic Multimodal-Driven Virtual Triplets	May 22, 2025	Model OptimizationMultimodal Recommendation	—Unverified	0	0
MMGRec: Multimodal Generative Recommendation with Transformer Model	Apr 25, 2024	modelMultimodal Recommendation	—Unverified	0	0
MMRec: Simplifying Multimodal Recommendation	Feb 2, 2023	Multimodal Recommendation	—Unverified	0	0
Modality Reliability Guided Multimodal Recommendation	Apr 23, 2025	Multimodal Recommendation	—Unverified	0	0
Multimodal Graph Neural Network for Recommendation with Dynamic De-redundancy and Modality-Guided Feature De-noisy	Nov 3, 2024	DenoisingGraph Neural Network	—Unverified	0	0

Show:10 25 50

← PrevPage 1 of 2Next →

No leaderboard results yet.