Domain Generalization

The idea of Domain Generalization is to learn from one or multiple training domains, to extract a domain-agnostic model which can be applied to an unseen domain

Source: Diagram Image Retrieval using Sketch-Based Deep Learning and Transfer Learning

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–50 of 1751 papers

Title	Date	Tasks	Status	Hype
DINOv2: Learning Robust Visual Features without Supervision	Apr 14, 2023	Depth EstimationDomain Generalization	CodeCode Available	6
Matching Anything by Segmenting Anything	Jun 6, 2024	Domain GeneralizationMultiple Object Tracking	CodeCode Available	5
Sequencer: Deep LSTM for Image Classification	May 4, 2022	Domain Generalizationimage-classification	CodeCode Available	5
A ConvNet for the 2020s	Jan 10, 2022	ClassificationDomain Generalization	CodeCode Available	5
Delving into RL for Image Generation with CoT: A Study on DPO vs. GRPO	May 22, 2025	Domain GeneralizationImage Generation	CodeCode Available	4
Light-R1: Curriculum SFT, DPO and RL for Long COT from Scratch and Beyond	Mar 13, 2025	Domain GeneralizationMath	CodeCode Available	4
Seg-Zero: Reasoning-Chain Guided Segmentation via Cognitive Reinforcement	Mar 9, 2025	Domain GeneralizationObject Detection	CodeCode Available	4
Conditional Prompt Learning for Vision-Language Models	Mar 10, 2022	Domain GeneralizationPrompt Engineering	CodeCode Available	4
Deep Residual Learning for Image Recognition	Dec 10, 2015	Classification	CodeCode Available	4
Generalized Trajectory Scoring for End-to-end Multimodal Planning	Jun 7, 2025	Autonomous DrivingDomain Generalization	CodeCode Available	3
Distilling LLM Agent into Small Models with Retrieval and Code Tools	May 23, 2025	Action GenerationDomain Generalization	CodeCode Available	3
Reinforcement Learning for Reasoning in Large Language Models with One Training Example	Apr 29, 2025	Domain GeneralizationMath	CodeCode Available	3
Advances in Multimodal Adaptation and Generalization: From Traditional Approaches to Foundation Models	Jan 30, 2025	Action RecognitionDomain Adaptation	CodeCode Available	3
ControlMLLM: Training-Free Visual Prompt Learning for Multimodal Large Language Models	Jul 31, 2024	Domain GeneralizationPrompt Learning	CodeCode Available	3
Stronger Fewer & Superior: Harnessing Vision Foundation Models for Domain Generalized Semantic Segmentation	Jan 1, 2024	Domain GeneralizationSemantic Segmentation	CodeCode Available	3
Generative Data Augmentation using LLMs improves Distributional Robustness in Question Answering	Sep 3, 2023	Data AugmentationDomain Adaptation	CodeCode Available	3
MetaFormer Baselines for Vision	Oct 24, 2022	Domain GeneralizationImage Classification	CodeCode Available	3
EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks	May 28, 2019	Action RecognitionDomain Generalization	CodeCode Available	3
AutoAugment: Learning Augmentation Policies from Data	May 24, 2018	Data AugmentationDomain Generalization	CodeCode Available	3
Feed-Forward SceneDINO for Unsupervised Semantic Scene Completion	Jul 8, 2025	3D geometryDomain Generalization	CodeCode Available	2
Play to Generalize: Learning to Reason Through Game Play	Jun 9, 2025	Domain GeneralizationMath	CodeCode Available	2
Omni-R1: Reinforcement Learning for Omnimodal Reasoning via Two-System Collaboration	May 26, 2025	Domain GeneralizationHallucination	CodeCode Available	2
Code2Logic: Game-Code-Driven Data Synthesis for Enhancing VLMs General Reasoning	May 20, 2025	Domain GeneralizationMultimodal Reasoning	CodeCode Available	2
CLIP-Powered Domain Generalization and Domain Adaptation: A Comprehensive Survey	Apr 19, 2025	Computational EfficiencyDomain Adaptation	CodeCode Available	2
Earth-Adapter: Bridge the Geospatial Domain Gaps with Mixture of Frequency Adaptation	Apr 8, 2025	Domain AdaptationDomain Generalization	CodeCode Available	2
Enhance Then Search: An Augmentation-Search Strategy with Foundation Models for Cross-Domain Few-Shot Object Detection	Apr 6, 2025	Cross-Domain Few-ShotCross-Domain Few-Shot Object Detection	CodeCode Available	2
Mamba as a Bridge: Where Vision Foundation Models Meet Vision Language Models for Domain-Generalized Semantic Segmentation	Apr 4, 2025	Domain GeneralizationMamba	CodeCode Available	2
DeepPerception: Advancing R1-like Cognitive Visual Perception in MLLMs for Knowledge-Intensive Visual Grounding	Mar 17, 2025	Domain GeneralizationMultimodal Reasoning	CodeCode Available	2
Test-Time Domain Generalization via Universe Learning: A Multi-Graph Matching Approach for Medical Image Segmentation	Mar 17, 2025	Domain AdaptationDomain Generalization	CodeCode Available	2
Diff9D: Diffusion-Based Domain-Generalized Category-Level 9-DoF Object Pose Estimation	Feb 4, 2025	DenoisingDomain Generalization	CodeCode Available	2
Avoiding Shortcuts: Enhancing Channel-Robust Specific Emitter Identification via Single-Source Domain Generalization	Jan 20, 2025	Contrastive LearningDomain Generalization	CodeCode Available	2
FAMNet: Frequency-aware Matching Network for Cross-domain Few-shot Medical Image Segmentation	Dec 12, 2024	Cross-Domain Few-ShotDomain Generalization	CodeCode Available	2
SoRA: Singular Value Decomposed Low-Rank Adaptation for Domain Generalizable Representation Learning	Dec 5, 2024	Domain AdaptationDomain Generalization	CodeCode Available	2
OpenAD: Open-World Autonomous Driving Benchmark for 3D Object Detection	Nov 26, 2024	3D Object DetectionAutonomous Driving	CodeCode Available	2
CrossEarth: Geospatial Vision Foundation Model for Domain Generalizable Remote Sensing Semantic Segmentation	Oct 30, 2024	Domain AdaptationDomain Generalization	CodeCode Available	2
PaPaGei: Open Foundation Models for Optical Physiological Signals	Oct 27, 2024	Contrastive LearningDomain Generalization	CodeCode Available	2
DiffusionFake: Enhancing Generalization in Deepfake Detection via Guided Stable Diffusion	Oct 6, 2024	DeepFake DetectionDomain Generalization	CodeCode Available	2
HPT++: Hierarchically Prompting Vision-Language Models with Multi-Granularity Knowledge Generation and Improved Structure Modeling	Aug 27, 2024	Domain GeneralizationPrompt Engineering	CodeCode Available	2
RAG-QA Arena: Evaluating Domain Robustness for Long-form Retrieval Augmented Question Answering	Jul 19, 2024	Domain GeneralizationForm	CodeCode Available	2
Improving Zero-shot Generalization of Learned Prompts via Unsupervised Knowledge Distillation	Jul 3, 2024	Domain GeneralizationKnowledge Distillation	CodeCode Available	2
GalLoP: Learning Global and Local Prompts for Vision-Language Models	Jul 1, 2024	DiversityDomain Generalization	CodeCode Available	2
Description and Discussion on DCASE 2024 Challenge Task 2: First-Shot Unsupervised Anomalous Sound Detection for Machine Condition Monitoring	Jun 11, 2024	AttributeDomain Generalization	CodeCode Available	2
Continuous Temporal Domain Generalization	May 25, 2024	Domain Generalization	CodeCode Available	2
VimTS: A Unified Video and Image Text Spotter for Enhancing the Cross-domain Generalization	Apr 30, 2024	Domain AdaptationDomain Generalization	CodeCode Available	2
Generative Medical Segmentation	Mar 27, 2024	DecoderDomain Generalization	CodeCode Available	2
Neural Markov Random Field for Stereo Matching	Mar 17, 2024	Domain GeneralizationInductive Bias	CodeCode Available	2
Single Domain Generalization for Crowd Counting	Mar 14, 2024	Crowd CountingDomain Generalization	CodeCode Available	2
Robust Synthetic-to-Real Transfer for Stereo Matching	Mar 12, 2024	Domain GeneralizationPseudo Label	CodeCode Available	2
Gradient Alignment for Cross-Domain Face Anti-Spoofing	Feb 29, 2024	Domain GeneralizationFace Anti-Spoofing	CodeCode Available	2
eCeLLM: Generalizing Large Language Models for E-commerce from Large-scale, High-quality Instruction Data	Feb 13, 2024	Domain Generalization	CodeCode Available	2

Show:10 25 50

← PrevPage 1 of 36Next →

All datasets PACS VizWiz-Classification ImageNet-C Office-Home ImageNet-A ImageNet-R DomainNet VLCS TerraIncognita GTA-to-Avg(Cityscapes,BDD,Mapillary)ImageNet-Sketch GTA5 to Cityscapes

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	SIMPLE+	Average Accuracy	99	—	Unverified
2	PromptStyler (CLIP, ViT-L/14)	Average Accuracy	98.6	—	Unverified
3	GMDG (RegNetY-16GF, SWAD)	Average Accuracy	97.9	—	Unverified
4	D-Triplet(RegNetY-16GF)	Average Accuracy	97.6	—	Unverified
5	MoA (OpenCLIP, ViT-B/16)	Average Accuracy	97.4	—	Unverified
6	GMDG (e RegNetY-16GF)	Average Accuracy	97.3	—	Unverified
7	PromptStyler (CLIP, ViT-B/16)	Average Accuracy	97.2	—	Unverified
8	SPG (CLIP, ViT-B/16)	Average Accuracy	97	—	Unverified
9	MIRO (RegNetY-16GF, SWAD)	Average Accuracy	96.8	—	Unverified
10	CAR-FT (CLIP, ViT-B/16)	Average Accuracy	96.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ViT-8/B-224	Accuracy - Clean Images	450	—	Unverified
2	VOLO-D5	Accuracy - All Images	57.2	—	Unverified
3	ConvNeXt-B	Accuracy - All Images	53.5	—	Unverified
4	ResNeXt-101 32x16d	Accuracy - All Images	51.7	—	Unverified
5	EfficientNet-B8 (advprop+autoaug)	Accuracy - All Images	50.5	—	Unverified
6	EfficientNet-B7 (advprop+autoaug)	Accuracy - All Images	49.7	—	Unverified
7	EfficientNet-B6 (advprop+autoaug)	Accuracy - All Images	49.6	—	Unverified
8	EfficientNet-B5 (advprop+autoaug)	Accuracy - All Images	49.1	—	Unverified
9	ViT-16/L-224	Accuracy - All Images	49	—	Unverified
10	ResNet-50 (gn)	Accuracy - All Images	48.9	—	Unverified