Visual Prompting

Visual Prompting is the task of streamlining computer vision processes by harnessing the power of prompts, inspired by the breakthroughs of text prompting in NLP. This innovative approach involves using a few visual prompts to swiftly convert an unlabeled dataset into a deployed model, significantly reducing development time for both individual projects and enterprise solutions.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 26–50 of 127 papers

Title	Date	Tasks	Status	Hype	Score
EarthMarker: A Visual Prompting Multi-modal Large Language Model for Remote Sensing	Jul 18, 2024	Instruction FollowingLanguage Modeling	CodeCode Available	1	5
Selective Visual Prompting in Vision Mamba	Dec 12, 2024	MambaState Space Models	CodeCode Available	1	5
Scaffolding Coordinates to Promote Vision-Language Coordination in Large Multi-Modal Models	Feb 19, 2024	Visual Prompting	CodeCode Available	1	5
Open-Vocabulary Action Localization with Iterative Visual Prompting	Aug 30, 2024	Action LocalizationTemporal Action Localization	CodeCode Available	1	5
Tune-An-Ellipse: CLIP Has Potential to Find What You Want	Jan 1, 2024	ObjectReferring Expression	CodeCode Available	1	5
Visual Prompting for Generalized Few-shot Segmentation: A Multi-scale Approach	Apr 17, 2024	DecoderGeneralized Few-Shot Semantic Segmentation	CodeCode Available	1	5
Finding Visual Task Vectors	Apr 8, 2024	Visual Prompting	CodeCode Available	1	5
Inst-IT: Boosting Multimodal Instance Understanding via Explicit Visual Prompt Instruction Tuning	Dec 4, 2024	Multimodal Large Language ModelVideo Understanding	CodeCode Available	1	5
LoR-VP: Low-Rank Visual Prompting for Efficient Vision Model Adaptation	Feb 2, 2025	Inductive BiasVisual Prompting	CodeCode Available	1	5
Visual Instruction Inversion: Image Editing via Visual Prompting	Jul 26, 2023	Visual Prompting	CodeCode Available	1	5
EZ-CLIP: Efficient Zeroshot Video Action Recognition	Dec 13, 2023	Action RecognitionGPU	CodeCode Available	1	5
By My Eyes: Grounding Multimodal Large Language Models with Sensor Data via Visual Prompting	Jul 15, 2024	Visual Prompting	CodeCode Available	1	5
Fine-Grained Visual Prompting	Jun 7, 2023	Visual Prompting	CodeCode Available	1	5
ViscoNet: Bridging and Harmonizing Visual and Textual Conditioning for ControlNet	Dec 5, 2023	Image GenerationPerson Re-Identification	CodeCode Available	1	5
Exploring the Transferability of Visual Prompting for Multimodal Large Language Models	Apr 17, 2024	HallucinationMultimodal Reasoning	CodeCode Available	1	5
OT-VP: Optimal Transport-guided Visual Prompting for Test-Time Adaptation	Jun 12, 2024	Prompt LearningTest-time Adaptation	CodeCode Available	1	5
Improving Visual Object Tracking through Visual Prompting	Sep 27, 2024	Object	CodeCode Available	1	5
GeoSAM: Fine-tuning SAM with Multi-Modal Prompts for Mobility Infrastructure Segmentation	Nov 19, 2023	Image SegmentationLarge Language Model	CodeCode Available	1	5
UPGPT: Universal Diffusion Model for Person Image Generation, Editing and Pose Transfer	Apr 18, 2023	DisentanglementImage Generation	CodeCode Available	1	5
Vision Graph Prompting via Semantic Low-Rank Decomposition	May 7, 2025	parameter-efficient fine-tuningVisual Prompting	CodeCode Available	1	5
Visual Prompting for Adversarial Robustness	Oct 12, 2022	Adversarial DefenseAdversarial Robustness	CodeCode Available	1	5
Towards Universal Text-driven CT Image Segmentation	Mar 8, 2025	Computed Tomography (CT)Contrastive Learning	CodeCode Available	0	5
Towards Online Multi-Modal Social Interaction Understanding	Mar 25, 2025	Visual Prompting	CodeCode Available	0	5
UICrit: Enhancing Automated Design Evaluation with a UICritique Dataset	Jul 11, 2024	Visual Prompting	CodeCode Available	0	5
Adapting Pre-trained Language Models to Vision-Language Tasks via Dynamic Visual Prompting	Jun 1, 2023	Transfer LearningVisual Prompting	CodeCode Available	0	5

Show:10 25 50

← PrevPage 2 of 6Next →

No leaderboard results yet.