Zero-shot Generalization

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 151–200 of 572 papers

Title	Date	Tasks	Status	Hype
S^3: Synonymous Semantic Space for Improving Zero-Shot Generalization of Vision-Language Models	Dec 6, 2024	zero-shot-classificationZero-shot Generalization	—Unverified	0
Stereo Anywhere: Robust Zero-Shot Deep Stereo Matching Even Where Either Stereo or Mono Fail	Dec 5, 2024	Stereo MatchingZero-shot Generalization	CodeCode Available	3
CLIP-PING: Boosting Lightweight Vision-Language Models with Proximus Intrinsic Neighbors Guidance	Dec 5, 2024	Contrastive Learningcross-modal alignment	—Unverified	0
UTSD: Unified Time Series Diffusion Model	Dec 4, 2024	Denoisingmodel	—Unverified	0
The Matrix: Infinite-Horizon World Generation with Real-Time Moving Control	Dec 4, 2024	Zero-shot Generalization	—Unverified	0
COMPrompter: reconceptualized segment anything model with multiprompt network for camouflaged object detection	Nov 28, 2024	object-detectionObject Detection	CodeCode Available	1
Collaborative Decoding Makes Visual Auto-Regressive Modeling Efficient	Nov 26, 2024	GPUImage Generation	CodeCode Available	2
vesselFM: A Foundation Model for Universal 3D Blood Vessel Segmentation	Nov 26, 2024	Image SegmentationMedical Image Analysis	CodeCode Available	2
Visatronic: A Multimodal Decoder-Only Model for Speech Synthesis	Nov 26, 2024	Decodermultimodal generation	—Unverified	0
Style-Pro: Style-Guided Prompt Learning for Generalizable Vision-Language Models	Nov 25, 2024	Domain GeneralizationPrompt Learning	—Unverified	0
Generating Out-Of-Distribution Scenarios Using Language Models	Nov 25, 2024	Autonomous DrivingAutonomous Vehicles	—Unverified	0
Context-Aware Multimodal Pretraining	Nov 22, 2024	Contrastive LearningRepresentation Learning	—Unverified	0
SAM Carries the Burden: A Semi-Supervised Approach Refining Pseudo Labels for Medical Segmentation	Nov 19, 2024	Image SegmentationMedical Image Segmentation	CodeCode Available	0
HEIGHT: Heterogeneous Interaction Graph Transformer for Robot Navigation in Crowded and Constrained Environments	Nov 19, 2024	Deep Reinforcement LearningRobot Navigation	—Unverified	0
Scalable Autoregressive Monocular Depth Estimation	Nov 18, 2024	Depth EstimationMonocular Depth Estimation	—Unverified	0
MLAN: Language-Based Instruction Tuning Improves Zero-Shot Generalization of Multimodal Large Language Models	Nov 15, 2024	Instruction FollowingZero-shot Generalization	CodeCode Available	0
Self-Supervised Monocular 4D Scene Reconstruction for Egocentric Videos	Nov 14, 2024	4D reconstructionSelf-Supervised Learning	—Unverified	0
Mono2Stereo: Monocular Knowledge Transfer for Enhanced Stereo Matching	Nov 14, 2024	Depth EstimationKnowledge Distillation	—Unverified	0
WorkflowLLM: Enhancing Workflow Orchestration Capability of Large Language Models	Nov 8, 2024	Task PlanningZero-shot Generalization	CodeCode Available	2
In the Era of Prompt Learning with Vision-Language Models	Nov 7, 2024	Domain AdaptationDomain Generalization	—Unverified	0
Enabling Adaptive Agent Training in Open-Ended Simulators by Targeting Diversity	Nov 7, 2024	DiversityMeta Reinforcement Learning	CodeCode Available	0
Object segmentation from common fate: Motion energy processing enables human-like zero-shot generalization to random dot stimuli	Nov 3, 2024	Optical Flow EstimationSemantic Segmentation	CodeCode Available	0
ZIM: Zero-Shot Image Matting for Anything	Nov 1, 2024	Image InpaintingImage Matting	CodeCode Available	3
JudgeRank: Leveraging Large Language Models for Reasoning-Intensive Reranking	Oct 31, 2024	Code CompletionOpen-Domain Question Answering	—Unverified	0
Compositional Automata Embeddings for Goal-Conditioned Reinforcement Learning	Oct 31, 2024	Graph Neural Networkreinforcement-learning	—Unverified	0
Instruction-Tuning Llama-3-8B Excels in City-Scale Mobility Prediction	Oct 31, 2024	Disaster ResponseLanguage Modeling	CodeCode Available	1
GHIL-Glue: Hierarchical Control with Filtered Subgoal Images	Oct 26, 2024	Imitation LearningVideo Prediction	—Unverified	0
Random Policy Enables In-Context Reinforcement Learning within Trust Horizons	Oct 25, 2024	In-Context LearningIn-Context Reinforcement Learning	—Unverified	0
Adversarial Environment Design via Regret-Guided Diffusion Models	Oct 25, 2024	Deep Reinforcement LearningDiversity	—Unverified	0
BioMistral-NLU: Towards More Generalizable Medical Language Understanding through Instruction Tuning	Oct 24, 2024	Instruction FollowingNatural Language Understanding	—Unverified	0
LVSM: A Large View Synthesis Model with Minimal 3D Inductive Bias	Oct 22, 2024	3DGSDecoder	—Unverified	0
DEL-Ranking: Ranking-Correction Denoising Framework for Elucidating Molecular Affinities in DNA-Encoded Libraries	Oct 19, 2024	DenoisingZero-shot Generalization	—Unverified	0
BiGR: Harnessing Binary Latent Codes for Image Generation and Improved Visual Representation Capabilities	Oct 18, 2024	Conditional Image GenerationImage Generation	CodeCode Available	2
Meta-DT: Offline Meta-RL as Conditional Sequence Modeling with World Model Disentanglement	Oct 15, 2024	DisentanglementInductive Bias	CodeCode Available	2
MoTE: Reconciling Generalization with Specialization for Visual-Language to Video Knowledge Transfer	Oct 14, 2024	Transfer LearningVideo Recognition	CodeCode Available	0
Learning to Generate Diverse Pedestrian Movements from Web Videos with Noisy Labels	Oct 10, 2024	Motion ForecastingZero-shot Generalization	—Unverified	0
On the Evaluation of Generative Robotic Simulations	Oct 10, 2024	Diversitytext similarity	—Unverified	0
RDT-1B: a Diffusion Foundation Model for Bimanual Manipulation	Oct 10, 2024	Zero-shot Generalization	CodeCode Available	5
Zero-Shot Generalization of Vision-Based RL Without Data Augmentation	Oct 9, 2024	Data AugmentationDisentanglement	—Unverified	0
Zero-Shot Fact Verification via Natural Logic and Large Language Models	Oct 4, 2024	Fact VerificationZero-shot Generalization	CodeCode Available	0
What Matters for Model Merging at Scale?	Oct 4, 2024	modelTask Arithmetic	—Unverified	0
Cross-Embodiment Dexterous Grasping with Reinforcement Learning	Oct 3, 2024	reinforcement-learningReinforcement Learning	—Unverified	0
Learning Diverse Bimanual Dexterous Manipulation Skills from Human Demonstrations	Oct 3, 2024	Zero-shot Generalization	—Unverified	0
MedViLaM: A multimodal large language model with advanced generalizability and explainability for medical data understanding and generation	Sep 29, 2024	Language ModelingLanguage Modelling	CodeCode Available	0
Lotus: Diffusion-based Visual Foundation Model for High-quality Dense Prediction	Sep 26, 2024	3D ReconstructionDenoising	CodeCode Available	4
A novel open-source ultrasound dataset with deep learning benchmarks for spinal cord injury localization and anatomical segmentation	Sep 24, 2024	Anatomyobject-detection	CodeCode Available	0
From Goal-Conditioned to Language-Conditioned Agents via Vision-Language Models	Sep 24, 2024	Reinforcement Learning (RL)Zero-shot Generalization	—Unverified	0
M^2PT: Multimodal Prompt Tuning for Zero-shot Instruction Learning	Sep 24, 2024	Zero-shot Generalization	CodeCode Available	1
Deep Generative Adversarial Network for Occlusion Removal from a Single Image	Sep 20, 2024	Generative Adversarial NetworkSegmentation	—Unverified	0
Deep Learning based Optical Image Super-Resolution via Generative Diffusion Models for Layerwise in-situ LPBF Monitoring	Sep 20, 2024	Image Super-ResolutionSSIM	—Unverified	0

Show:10 25 50

← PrevPage 4 of 12Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	GR-MG	Avg. sequence length	4.04	—	Unverified
2	MoDE	Avg. sequence length	4.01	—	Unverified
3	RoboUniView	Avg. sequence length	3.65	—	Unverified
4	3D Diffuser Actor	Avg. sequence length	3.27	—	Unverified
5	GR-1	Avg. sequence length	3.06	—	Unverified