Visual Prompting

Visual Prompting is the task of streamlining computer vision processes by harnessing the power of prompts, inspired by the breakthroughs of text prompting in NLP. This innovative approach involves using a few visual prompts to swiftly convert an unlabeled dataset into a deployed model, significantly reducing development time for both individual projects and enterprise solutions.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–127 of 127 papers

Title	Date	Tasks	Status
Unifying Image Processing as Visual Prompting Question Answering	Oct 16, 2023	Image EnhancementImage Restoration	—Unverified
Visual and textual prompts for enhancing emotion recognition in video	Apr 24, 2025	Emotion RecognitionVideo Emotion Recognition	—Unverified
Visual Prompting for One-shot Controllable Video Editing without Inversion	Apr 19, 2025	Video EditingVisual Prompting	—Unverified
Visual Prompting in LLMs for Enhancing Emotion Recognition	Oct 3, 2024	Emotion RecognitionVisual Prompting	—Unverified
Visual Prompting in Multimodal Large Language Models: A Survey	Sep 5, 2024	In-Context LearningPrompt Learning	—Unverified
Visual Prompting with Iterative Refinement for Design Critique Generation	Dec 22, 2024	AttributeVisual Prompting	—Unverified
VPA: Fully Test-Time Visual Prompt Adaptation	Sep 26, 2023	Domain AdaptationPseudo Label	—Unverified
VP Lab: a PEFT-Enabled Visual Prompting Laboratory for Semantic Segmentation	May 21, 2025	parameter-efficient fine-tuningSemantic Segmentation	—Unverified
VP-NTK: Exploring the Benefits of Visual Prompting in Differentially Private Data Synthesis	Mar 20, 2025	parameter-efficient fine-tuningVisual Prompting	—Unverified
WeatherGFM: Learning A Weather Generalist Foundation Model via In-context Learning	Nov 8, 2024	In-Context LearningQuestion Answering	—Unverified
Coarse Correspondences Boost Spatial-Temporal Reasoning in Multimodal Language Model	Aug 1, 2024	EgoSchemaLanguage Modeling	—Unverified
Fast Segment Anything	Jun 21, 2023	Edge DetectionImage Segmentation	CodeCode Available
Exploring the Benefits of Visual Prompting in Differential Privacy	Mar 22, 2023	image-classificationImage Classification	CodeCode Available
Adapting Pre-trained Language Models to Vision-Language Tasks via Dynamic Visual Prompting	Jun 1, 2023	Transfer LearningVisual Prompting	CodeCode Available
When Does Visual Prompting Outperform Linear Probing for Vision-Language Models? A Likelihood Perspective	Sep 3, 2024	Transfer LearningVisual Prompting	CodeCode Available
Targeted Visual Prompting for Medical Visual Question Answering	Aug 6, 2024	Medical Visual Question AnsweringQuestion Answering	CodeCode Available
Towards Universal Text-driven CT Image Segmentation	Mar 8, 2025	Computed Tomography (CT)Contrastive Learning	CodeCode Available
UICrit: Enhancing Automated Design Evaluation with a UICritique Dataset	Jul 11, 2024	Visual Prompting	CodeCode Available
Towards Online Multi-Modal Social Interaction Understanding	Mar 25, 2025	Visual Prompting	CodeCode Available
IP-Prompter: Training-Free Theme-Specific Image Generation via Dynamic Visual Prompting	Jan 26, 2025	Diffusion PersonalizationDiffusion Personalization Tuning Free	CodeCode Available
Unleashing the Power of Visual Prompting At the Pixel Level	Dec 20, 2022	DiversityVisual Prompting	CodeCode Available
Towards Ambiguity-Free Spatial Foundation Model: Rethinking and Decoupling Depth Ambiguity	Mar 8, 2025	Depth EstimationScene Understanding	CodeCode Available
Stepwise Decomposition and Dual-stream Focus: A Novel Approach for Training-free Camouflaged Object Segmentation	Jun 7, 2025	Camouflaged Object SegmentationFeature Correlation	CodeCode Available
Uncovering the Hidden Cost of Model Compression	Aug 29, 2023	modelModel Compression	CodeCode Available
Benchmarking Human and Automated Prompting in the Segment Anything Model	Oct 29, 2024	BenchmarkingImage Segmentation	CodeCode Available
ViP-LLaVA: Making Large Multimodal Models Understand Arbitrary Visual Prompts	Dec 1, 2023	Visual Commonsense ReasoningVisual Prompting	CodeCode Available
Leveraging Large Language Models for Scalable Vector Graphics-Driven Image Understanding	Jun 9, 2023	Few-Shot Learningimage-classification	CodeCode Available

Show:10 25 50

← PrevPage 3 of 3Next →

No leaderboard results yet.