Zero-shot Generalization

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 301–350 of 572 papers

Title	Date	Tasks	Status
Zero-Shot Monocular Scene Flow Estimation in the Wild	Jan 17, 2025	Depth EstimationPrediction	—Unverified
StereoGen: High-quality Stereo Image Generation from a Single Image	Jan 15, 2025	Depth EstimationImage Generation	—Unverified
Capability-Aware Shared Hypernetworks for Flexible Heterogeneous Multi-Robot Coordination	Jan 10, 2025	DiversityImitation Learning	CodeCode Available
Robotic Programmer: Video Instructed Policy Code Generation for Robotic Manipulation	Jan 8, 2025	Code GenerationLanguage Modeling	—Unverified
MADation: Face Morphing Attack Detection with Foundation Models	Jan 7, 2025	Face Morphing Attack DetectionFace Recognition	CodeCode Available
Spot Risks Before Speaking! Unraveling Safety Attention Heads in Large Vision-Language Models	Jan 3, 2025	Zero-shot Generalization	CodeCode Available
On the Zero-shot Adversarial Robustness of Vision-Language Models: A Truly Zero-shot and Training-free Approach	Jan 1, 2025	Adversarial RobustnessZero-shot Generalization	—Unverified
On the Out-Of-Distribution Generalization of Large Multimodal Models	Jan 1, 2025	In-Context LearningOut-of-Distribution Generalization	—Unverified
From Pixels to Predicates: Learning Symbolic World Models via Pretrained Vision-Language Models	Dec 31, 2024	Decision MakingZero-shot Generalization	—Unverified
EC-Diffuser: Multi-Object Manipulation via Entity-Centric Behavior Generation	Dec 25, 2024	ObjectZero-shot Generalization	—Unverified
Multiple Consistency-guided Test-Time Adaptation for Contrastive Audio-Language Models with Unlabeled Audio	Dec 23, 2024	Contrastive LearningPrompt Learning	—Unverified
Towards Graph Foundation Models: Learning Generalities Across Graphs via Task-Trees	Dec 21, 2024	Graph Neural NetworkIn-Context Learning	CodeCode Available
Zero-Shot Generalization for Blockage Localization in mmWave Communication	Dec 18, 2024	Self-Supervised LearningZero-shot Generalization	—Unverified
Efficient Fine-Tuning of Single-Cell Foundation Models Enables Zero-Shot Molecular Perturbation Prediction	Dec 18, 2024	Drug DiscoveryZero-shot Generalization	—Unverified
Memorizing SAM: 3D Medical Segment Anything Model with Memorizing Transformer	Dec 18, 2024	Image SegmentationMedical Image Analysis	CodeCode Available
Marigold-DC: Zero-Shot Monocular Depth Completion with Guided Diffusion	Dec 18, 2024	DenoisingDepth Completion	—Unverified
EasyRef: Omni-Generalized Group Image Reference for Diffusion Models via Multimodal LLM	Dec 12, 2024	Image ComprehensionImage Generation	—Unverified
WiFo: Wireless Foundation Model for Channel Prediction	Dec 12, 2024	modelMulti-Task Learning	—Unverified
Lightweight Method for Interactive 3D Medical Image Segmentation with Multi-Round Result Fusion	Dec 11, 2024	GPUImage Segmentation	CodeCode Available
Disentanglement and Compositionality of Letter Identity and Letter Position in Variational Auto-Encoder Vision Models	Dec 11, 2024	DisentanglementPosition	—Unverified
ConfigX: Modular Configuration for Evolutionary Algorithms via Multitask Reinforcement Learning	Dec 10, 2024	Evolutionary AlgorithmsLifelong learning	CodeCode Available
S^3: Synonymous Semantic Space for Improving Zero-Shot Generalization of Vision-Language Models	Dec 6, 2024	zero-shot-classificationZero-shot Generalization	—Unverified
CLIP-PING: Boosting Lightweight Vision-Language Models with Proximus Intrinsic Neighbors Guidance	Dec 5, 2024	Contrastive Learningcross-modal alignment	—Unverified
UTSD: Unified Time Series Diffusion Model	Dec 4, 2024	Denoisingmodel	—Unverified
The Matrix: Infinite-Horizon World Generation with Real-Time Moving Control	Dec 4, 2024	Zero-shot Generalization	—Unverified
Visatronic: A Multimodal Decoder-Only Model for Speech Synthesis	Nov 26, 2024	Decodermultimodal generation	—Unverified
Style-Pro: Style-Guided Prompt Learning for Generalizable Vision-Language Models	Nov 25, 2024	Domain GeneralizationPrompt Learning	—Unverified
Generating Out-Of-Distribution Scenarios Using Language Models	Nov 25, 2024	Autonomous DrivingAutonomous Vehicles	—Unverified
Context-Aware Multimodal Pretraining	Nov 22, 2024	Contrastive LearningRepresentation Learning	—Unverified
SAM Carries the Burden: A Semi-Supervised Approach Refining Pseudo Labels for Medical Segmentation	Nov 19, 2024	Image SegmentationMedical Image Segmentation	CodeCode Available
HEIGHT: Heterogeneous Interaction Graph Transformer for Robot Navigation in Crowded and Constrained Environments	Nov 19, 2024	Deep Reinforcement LearningRobot Navigation	—Unverified
Scalable Autoregressive Monocular Depth Estimation	Nov 18, 2024	Depth EstimationMonocular Depth Estimation	—Unverified
MLAN: Language-Based Instruction Tuning Improves Zero-Shot Generalization of Multimodal Large Language Models	Nov 15, 2024	Instruction FollowingZero-shot Generalization	CodeCode Available
Self-Supervised Monocular 4D Scene Reconstruction for Egocentric Videos	Nov 14, 2024	4D reconstructionSelf-Supervised Learning	—Unverified
Mono2Stereo: Monocular Knowledge Transfer for Enhanced Stereo Matching	Nov 14, 2024	Depth EstimationKnowledge Distillation	—Unverified
In the Era of Prompt Learning with Vision-Language Models	Nov 7, 2024	Domain AdaptationDomain Generalization	—Unverified
Enabling Adaptive Agent Training in Open-Ended Simulators by Targeting Diversity	Nov 7, 2024	DiversityMeta Reinforcement Learning	CodeCode Available
Object segmentation from common fate: Motion energy processing enables human-like zero-shot generalization to random dot stimuli	Nov 3, 2024	Optical Flow EstimationSemantic Segmentation	CodeCode Available
Compositional Automata Embeddings for Goal-Conditioned Reinforcement Learning	Oct 31, 2024	Graph Neural Networkreinforcement-learning	—Unverified
JudgeRank: Leveraging Large Language Models for Reasoning-Intensive Reranking	Oct 31, 2024	Code CompletionOpen-Domain Question Answering	—Unverified
GHIL-Glue: Hierarchical Control with Filtered Subgoal Images	Oct 26, 2024	Imitation LearningVideo Prediction	—Unverified
Adversarial Environment Design via Regret-Guided Diffusion Models	Oct 25, 2024	Deep Reinforcement LearningDiversity	—Unverified
Random Policy Enables In-Context Reinforcement Learning within Trust Horizons	Oct 25, 2024	In-Context LearningIn-Context Reinforcement Learning	—Unverified
BioMistral-NLU: Towards More Generalizable Medical Language Understanding through Instruction Tuning	Oct 24, 2024	Instruction FollowingNatural Language Understanding	—Unverified
LVSM: A Large View Synthesis Model with Minimal 3D Inductive Bias	Oct 22, 2024	3DGSDecoder	—Unverified
DEL-Ranking: Ranking-Correction Denoising Framework for Elucidating Molecular Affinities in DNA-Encoded Libraries	Oct 19, 2024	DenoisingZero-shot Generalization	—Unverified
MoTE: Reconciling Generalization with Specialization for Visual-Language to Video Knowledge Transfer	Oct 14, 2024	Transfer LearningVideo Recognition	CodeCode Available
On the Evaluation of Generative Robotic Simulations	Oct 10, 2024	Diversitytext similarity	—Unverified
Learning to Generate Diverse Pedestrian Movements from Web Videos with Noisy Labels	Oct 10, 2024	Motion ForecastingZero-shot Generalization	—Unverified
Zero-Shot Generalization of Vision-Based RL Without Data Augmentation	Oct 9, 2024	Data AugmentationDisentanglement	—Unverified

Show:10 25 50

← PrevPage 7 of 12Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	GR-MG	Avg. sequence length	4.04	—	Unverified
2	MoDE	Avg. sequence length	4.01	—	Unverified
3	RoboUniView	Avg. sequence length	3.65	—	Unverified
4	3D Diffuser Actor	Avg. sequence length	3.27	—	Unverified
5	GR-1	Avg. sequence length	3.06	—	Unverified