Visual Prompting

Visual Prompting is the task of streamlining computer vision processes by harnessing the power of prompts, inspired by the breakthroughs of text prompting in NLP. This innovative approach involves using a few visual prompts to swiftly convert an unlabeled dataset into a deployed model, significantly reducing development time for both individual projects and enterprise solutions.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 26–50 of 127 papers

Title	Date	Tasks	Status	Hype
By My Eyes: Grounding Multimodal Large Language Models with Sensor Data via Visual Prompting	Jul 15, 2024	Visual Prompting	CodeCode Available	1
Dynamic Domains, Dynamic Solutions: DPCore for Continual Test-Time Adaptation	Jun 15, 2024	Test-time AdaptationVisual Prompting	CodeCode Available	1
OT-VP: Optimal Transport-guided Visual Prompting for Test-Time Adaptation	Jun 12, 2024	Prompt LearningTest-time Adaptation	CodeCode Available	1
Visual Prompting for Generalized Few-shot Segmentation: A Multi-scale Approach	Apr 17, 2024	DecoderGeneralized Few-Shot Semantic Segmentation	CodeCode Available	1
Exploring the Transferability of Visual Prompting for Multimodal Large Language Models	Apr 17, 2024	HallucinationMultimodal Reasoning	CodeCode Available	1
Finding Visual Task Vectors	Apr 8, 2024	Visual Prompting	CodeCode Available	1
Scaffolding Coordinates to Promote Vision-Language Coordination in Large Multi-Modal Models	Feb 19, 2024	Visual Prompting	CodeCode Available	1
Tune-An-Ellipse: CLIP Has Potential to Find What You Want	Jan 1, 2024	ObjectReferring Expression	CodeCode Available	1
EZ-CLIP: Efficient Zeroshot Video Action Recognition	Dec 13, 2023	Action RecognitionGPU	CodeCode Available	1
ViscoNet: Bridging and Harmonizing Visual and Textual Conditioning for ControlNet	Dec 5, 2023	Image GenerationPerson Re-Identification	CodeCode Available	1
Visual Prompting Upgrades Neural Network Sparsification: A Data-Model Perspective	Dec 3, 2023	Image ClassificationVisual Prompting	CodeCode Available	1
GeoSAM: Fine-tuning SAM with Multi-Modal Prompts for Mobility Infrastructure Segmentation	Nov 19, 2023	Image SegmentationLarge Language Model	CodeCode Available	1
AutoVP: An Automated Visual Prompting Framework and Benchmark	Oct 12, 2023	image-classificationImage Classification	CodeCode Available	1
Visual Instruction Inversion: Image Editing via Visual Prompting	Jul 26, 2023	Visual Prompting	CodeCode Available	1
Fine-Grained Visual Prompting	Jun 7, 2023	Visual Prompting	CodeCode Available	1
UPGPT: Universal Diffusion Model for Person Image Generation, Editing and Pose Transfer	Apr 18, 2023	DisentanglementImage Generation	CodeCode Available	1
BlackVIP: Black-Box Visual Prompting for Robust Transfer Learning	Mar 26, 2023	Transfer LearningVisual Prompting	CodeCode Available	1
Diversity-Aware Meta Visual Prompting	Mar 14, 2023	DiversityVisual Prompting	CodeCode Available	1
Text-Visual Prompting for Efficient 2D Temporal Video Grounding	Mar 9, 2023	SentenceVideo Grounding	CodeCode Available	1
Understanding and Improving Visual Prompting: A Label-Mapping Perspective	Nov 21, 2022	Transfer LearningVisual Prompting	CodeCode Available	1
Visual Prompting for Adversarial Robustness	Oct 12, 2022	Adversarial DefenseAdversarial Robustness	CodeCode Available	1
Stepwise Decomposition and Dual-stream Focus: A Novel Approach for Training-free Camouflaged Object Segmentation	Jun 7, 2025	Camouflaged Object SegmentationFeature Correlation	CodeCode Available	0
RSVP: Reasoning Segmentation via Visual Prompting and Multi-modal Chain-of-Thought	Jun 4, 2025	Multimodal ReasoningReasoning Segmentation	—Unverified	0
Grid-LOGAT: Grid Based Local and Global Area Transcription for Video Question Answering	May 30, 2025	Language ModelingLanguage Modelling	—Unverified	0
DINO-R1: Incentivizing Reasoning Capability in Vision Foundation Models	May 29, 2025	Visual Prompting	—Unverified	0

Show:10 25 50

← PrevPage 2 of 6Next →

No leaderboard results yet.