Zero-shot Generalization

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–100 of 572 papers

Title	Date	Tasks	Status	Hype
Visual Image Reconstruction from Brain Activity via Latent Representation	May 13, 2025	Early ClassificationImage Reconstruction	—Unverified	0
Towards Artificial General or Personalized Intelligence? A Survey on Foundation Models for Personalized Federated Intelligence	May 11, 2025	Computational EfficiencyFederated Learning	—Unverified	0
Learning Graph Representation of Agent Diffusers	May 10, 2025	Graph Neural NetworkImage Generation	CodeCode Available	0
Benchmarking Vision, Language, & Action Models in Procedurally Generated, Open Ended Action Environments	May 8, 2025	BenchmarkingPrompt Engineering	CodeCode Available	1
Pro2SAM: Mask Prompt to SAM with Grid Points for Weakly Supervised Object Localization	May 8, 2025	Object LocalizationWeakly-Supervised Object Localization	—Unverified	0
TeDA: Boosting Vision-Lanuage Models for Zero-Shot 3D Object Retrieval via Testing-time Distribution Alignment	May 5, 2025	3D Object RetrievalLanguage Modeling	CodeCode Available	0
Towards Ball Spin and Trajectory Analysis in Table Tennis Broadcast Videos via Physically Grounded Synthetic-to-Real Transfer	Apr 28, 2025	Monocular 3D Object LocalizationSports Analytics	CodeCode Available	1
A Review of 3D Object Detection with Vision-Language Models	Apr 25, 2025	3D Object DetectionObject	—Unverified	0
Text-to-Decision Agent: Learning Generalist Policies from Natural Language Supervision	Apr 21, 2025	MuJoCoZero-shot Generalization	—Unverified	0
Dysarthria Normalization via Local Lie Group Transformations for Robust ASR	Apr 16, 2025	Robust Speech Recognitionspeech-recognition	CodeCode Available	0
Crane: Context-Guided Prompt Learning and Attention Refinement for Zero-Shot Anomaly Detections	Apr 15, 2025	Anomaly DetectionAnomaly Localization	CodeCode Available	1
Zero-Shot Whole-Body Humanoid Control via Behavioral Foundation Models	Apr 15, 2025	Humanoid ControlReinforcement Learning (RL)	CodeCode Available	4
Detect Anything 3D in the Wild	Apr 10, 2025	3D Object DetectionAutonomous Driving	CodeCode Available	3
SAM2MOT: A Novel Paradigm of Multi-Object Tracking by Segmentation	Apr 6, 2025	Multi-Object TrackingObject	CodeCode Available	2
Delineate Anything: Resolution-Agnostic Field Boundary Delineation on Satellite Imagery	Apr 3, 2025	Field Boundary DelineationInstance Segmentation	CodeCode Available	2
PicoPose: Progressive Pixel-to-Pixel Correspondence Learning for Novel Object Pose Estimation	Apr 3, 2025	ObjectPose Estimation	CodeCode Available	1
Evolutionary Prompt Optimization Discovers Emergent Multimodal Reasoning Strategies in Vision-Language Models	Mar 30, 2025	Image SegmentationLanguage Modeling	—Unverified	0
Zero-shot Domain Generalization of Foundational Models for 3D Medical Image Segmentation: An Experimental Study	Mar 28, 2025	Domain GeneralizationImage Segmentation	—Unverified	0
Q-Insight: Understanding Image Quality via Visual Reinforcement Learning	Mar 28, 2025	DescriptiveImage Quality Assessment	CodeCode Available	2
Thinking agents for zero-shot generalization to qualitatively novel tasks	Mar 25, 2025	Zero-shot Generalization	—Unverified	0
Unpaired Object-Level SAR-to-Optical Image Translation for Aircraft with Keypoints-Guided Diffusion Models	Mar 25, 2025	TranslationZero-shot Generalization	—Unverified	0
FRESA:Feedforward Reconstruction of Personalized Skinned Avatars from Few Images	Mar 24, 2025	3D CanonicalizationZero-shot Generalization	CodeCode Available	1
Aether: Geometric-Aware Unified World Modeling	Mar 24, 2025	Dynamic ReconstructionPrediction	—Unverified	0
Equivariant Image Modeling	Mar 24, 2025	Image GenerationZero-shot Generalization	CodeCode Available	1
Bokehlicious: Photorealistic Bokeh Rendering with Controllable Apertures	Mar 20, 2025	DeblurringZero-shot Generalization	CodeCode Available	2
Jasmine: Harnessing Diffusion Prior for Self-supervised Depth Estimation	Mar 20, 2025	Depth EstimationImage Reconstruction	—Unverified	0
Enhancing Zero-Shot Image Recognition in Vision-Language Models through Human-like Concept Guidance	Mar 20, 2025	Prompt EngineeringZero-shot Generalization	—Unverified	0
STOP: Integrated Spatial-Temporal Dynamic Prompting for Video Understanding	Mar 20, 2025	Video UnderstandingZero-shot Generalization	CodeCode Available	1
GenM^3: Generative Pretrained Multi-path Motion Model for Text Conditional Human Motion Generation	Mar 19, 2025	Large Language ModelMotion Generation	—Unverified	0
Learning with Expert Abstractions for Efficient Multi-Task Continuous Control	Mar 19, 2025	continuous-controlContinuous Control	CodeCode Available	0
Good Actions Succeed, Bad Actions Generalize: A Case Study on Why RL Generalizes Better	Mar 19, 2025	AttributeReinforcement Learning (RL)	—Unverified	0
Foundation Feature-Driven Online End-Effector Pose Estimation: A Marker-Free and Learning-Free Approach	Mar 18, 2025	6D Pose EstimationPose Estimation	—Unverified	0
Compound Expression Recognition via Large Vision-Language Models	Mar 14, 2025	Emotion RecognitionZero-shot Generalization	—Unverified	0
Autoregressive Image Generation with Randomized Parallel Decoding	Mar 13, 2025	Conditional Image GenerationImage Generation	CodeCode Available	2
Efficient Alignment of Unconditioned Action Prior for Language-conditioned Pick and Place in Clutter	Mar 12, 2025	Zero-shot Generalization	CodeCode Available	2
Prompt-OT: An Optimal Transport Regularization Paradigm for Knowledge Preservation in Vision-Language Model Adaptation	Mar 11, 2025	Domain GeneralizationLanguage Modeling	CodeCode Available	0
A Recipe for Improving Remote Sensing VLM Zero Shot Generalization	Mar 10, 2025	Cross-Modal RetrievalZero-Shot Cross-Modal Retrieval	—Unverified	0
PE3R: Perception-Efficient 3D Reconstruction	Mar 10, 2025	3D ReconstructionZero-shot Generalization	CodeCode Available	3
PoseLess: Depth-Free Vision-to-Joint Control via Direct Image Mapping with VLM	Mar 10, 2025	DecoderPose Estimation	—Unverified	0
Seg-Zero: Reasoning-Chain Guided Segmentation via Cognitive Reinforcement	Mar 9, 2025	Domain GeneralizationObject Detection	CodeCode Available	4
Next Token Is Enough: Realistic Image Quality and Aesthetic Scoring with Multimodal Large Language Model	Mar 8, 2025	Image Quality AssessmentLanguage Modeling	CodeCode Available	2
OTTER: A Vision-Language-Action Model with Text-Aware Visual Feature Extraction	Mar 5, 2025	Vision-Language-ActionZero-shot Generalization	—Unverified	0
RAILGUN: A Unified Convolutional Policy for Multi-Agent Path Finding Across Different Environments and Tasks	Mar 4, 2025	Multi-Agent Path FindingZero-shot Generalization	—Unverified	0
Nature-Inspired Population-Based Evolution of Large Language Models	Mar 3, 2025	GPUZero-shot Generalization	CodeCode Available	1
Re-Imagining Multimodal Instruction Tuning: A Representation View	Mar 2, 2025	Instruction FollowingMME	CodeCode Available	0
Delving into Out-of-Distribution Detection with Medical Vision-Language Models	Mar 2, 2025	Benchmarkingimage-classification	CodeCode Available	1
Contrastive Learning of English Language and Crystal Graphs for Multimodal Representation of Materials Knowledge	Feb 23, 2025	Contrastive LearningZero-shot Generalization	—Unverified	0
Learning from Reward-Free Offline Data: A Case for Planning with Latent Dynamics Models	Feb 20, 2025	Reinforcement Learning (RL)Zero-shot Generalization	—Unverified	0
GeLLMO: Generalizing Large Language Models for Multi-property Molecule Optimization	Feb 19, 2025	Zero-shot Generalization	CodeCode Available	0
WRT-SAM: Foundation Model-Driven Segmentation for Generalized Weld Radiographic Testing	Feb 17, 2025	Anomaly DetectionImage Segmentation	—Unverified	0

Show:10 25 50

← PrevPage 2 of 12Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	GR-MG	Avg. sequence length	4.04	—	Unverified
2	MoDE	Avg. sequence length	4.01	—	Unverified
3	RoboUniView	Avg. sequence length	3.65	—	Unverified
4	3D Diffuser Actor	Avg. sequence length	3.27	—	Unverified
5	GR-1	Avg. sequence length	3.06	—	Unverified