Prompt Engineering

Prompt engineering is the process of designing and refining the prompts used to generate text from language models, such as GPT-3 or similar models. The goal of prompt engineering is to improve the quality and relevance of the generated text by carefully crafting the prompts to elicit the desired responses from the model.

Prompt engineering involves several steps, including selecting the appropriate model architecture and parameters, designing the prompt format and structure, selecting the appropriate task and training data, and fine-tuning the model using the selected prompt and data.

Prompt engineering is a crucial step in the development of language models, as it can greatly influence the quality and effectiveness of the model's responses. By carefully designing and refining the prompts used to generate text, researchers and developers can improve the accuracy and relevance of the model's output, making it more useful for a wide range of applications, including chatbots, language translation, content creation, and more.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 751–800 of 1236 papers

Title	Date	Tasks	Status
Understanding Defects in Generated Codes by Language Models	Aug 23, 2024	Code GenerationPrompt Engineering	—Unverified
Understanding LLM Scientific Reasoning through Promptings and Model's Explanation on the Answers	May 2, 2025	Natural Language UnderstandingPrompt Engineering	—Unverified
Understanding prompt engineering may not require rethinking generalization	Oct 6, 2023	Generalization BoundsLanguage Modelling	—Unverified
UnitCoder: Scalable Iterative Code Synthesis with Unit Test Guidance	Feb 17, 2025	Code GenerationHumanEval	—Unverified
Unleashing the potential of prompt engineering for large language models	Oct 23, 2023	HallucinationPrompt Engineering	—Unverified
Unlocking the Potential of ChatGPT: A Comprehensive Exploration of its Applications, Advantages, Limitations, and Future Directions in Natural Language Processing	Mar 27, 2023	Medical DiagnosisPrompt Engineering	—Unverified
Unlocking the Potential of Past Research: Using Generative AI to Reconstruct Healthcare Simulation Models	Mar 27, 2025	Code GenerationPrompt Engineering	—Unverified
Unmasking the Canvas: A Dynamic Benchmark for Image Generation Jailbreaking and LLM Content Safety	May 7, 2025	Image GenerationPrompt Engineering	—Unverified
Unsupervised Prompt Tuning for Text-Driven Object Detection	Jan 1, 2023	Data AugmentationObject	—Unverified
Unveiling the potential of large language models in generating semantic and cross-language clones	Sep 12, 2023	BenchmarkingCode Generation	—Unverified
UPRISE: Universal Prompt Retrieval for Improving Zero-Shot Evaluation	Mar 15, 2023	HallucinationPrompt Engineering	—Unverified
User-friendly Image Editing with Minimal Text Input: Leveraging Captioning and Injection Techniques	Jun 5, 2023	Prompt EngineeringSentence	—Unverified
Using customized GPT to develop prompting proficiency in architectural AI-generated images	Apr 16, 2025	Experimental DesignPrompt Engineering	—Unverified
Using Grammar Masking to Ensure Syntactic Validity in LLM-based Modeling Tasks	Jul 8, 2024	Few-Shot LearningLanguage Modeling	—Unverified
Harnessing LLMs for Automated Video Content Analysis: An Exploratory Workflow of Short Videos on Depression	Jun 27, 2024	Prompt Engineering	—Unverified
Using Large Language Models to Automate and Expedite Reinforcement Learning with Reward Machine	Feb 11, 2024	Language ModelingLanguage Modelling	—Unverified
Using Large Language Models to Generate Engaging Captions for Data Visualizations	Dec 27, 2022	Prompt Engineering	—Unverified
Using Large Language Models to Generate Clinical Trial Tables and Figures	Sep 18, 2024	Prompt EngineeringTransfer Learning	—Unverified
Using Pretrained Large Language Model with Prompt Engineering to Answer Biomedical Questions	Jul 9, 2024	ArticlesInformation Retrieval	—Unverified
UTSD: Unified Time Series Diffusion Model	Dec 4, 2024	Denoisingmodel	—Unverified
VideoCoT: A Video Chain-of-Thought Dataset with Active Annotation Tool	Jul 7, 2024	Active LearningHallucination	—Unverified
ViPer: Visual Personalization of Generative Models via Individual Preference Learning	Jul 24, 2024	Image GenerationLanguage Modeling	—Unverified
A Multi-Modal Foundation Model to Assist People with Blindness and Low Vision in Environmental Interaction	Oct 31, 2023	Language ModelingLanguage Modelling	—Unverified
Visual Prompt Engineering for Medical Vision Language Models in Radiology	Aug 28, 2024	Classificationimage-classification	—Unverified
"Well, Keep Thinking": Enhancing LLM Reasoning with Adaptive Injection Decoding	Mar 13, 2025	Prompt Engineering	—Unverified
WESE: Weak Exploration to Strong Exploitation for LLM Agents	Apr 11, 2024	Decision MakingPrompt Engineering	—Unverified
What does CLIP know about a red circle? Visual prompt engineering for VLMs	Apr 13, 2023	Image GenerationPrompt Engineering	—Unverified
When Debate Fails: Bias Reinforcement in Large Language Models	Mar 21, 2025	Decision MakingDiversity	—Unverified
When Large Language Models Meet Optical Networks: Paving the Way for Automation	May 14, 2024	AI AgentPrompt Engineering	—Unverified
When Raw Data Prevails: Are Large Language Model Embeddings Effective in Numerical Data Representation for Medical Machine Learning Applications?	Aug 15, 2024	Language ModelingLanguage Modelling	—Unverified
Why Compress What You Can Generate? When GPT-4o Generation Ushers in Image Compression Fields	Apr 30, 2025	Image CompressionImage Generation	—Unverified
Will It Blend? Mixing Training Paradigms & Prompting for Argument Quality Prediction	Sep 19, 2022	Argument MiningContrastive Learning	—Unverified
WirelessLLM: Empowering Large Language Models Towards Wireless Intelligence	May 27, 2024	Prompt EngineeringRetrieval-augmented Generation	—Unverified
Zero-shot Autonomous Microscopy for Scalable and Intelligent Characterization of 2D Materials	Apr 14, 2025	Image SegmentationPrompt Engineering	—Unverified
Synergistic Integration of Large Language Models and Cognitive Architectures for Robust AI: An Exploratory Analysis	Aug 18, 2023	Prompt Engineering	—Unverified
LocalValueBench: A Collaboratively Built and Extensible Benchmark for Evaluating Localized Value Alignment and Ethical Safety in Large Language Models	Jul 27, 2024	Prompt Engineering	—Unverified
Recording First-person Experiences to Build a New Type of Foundation Model	Jul 31, 2024	EEGPrompt Engineering	—Unverified
Model Performance-Guided Evaluation Data Selection for Effective Prompt Optimization	May 15, 2025	BenchmarkingClustering	—Unverified
Connecting the Dots: A Chain-of-Collaboration Prompting Framework for LLM Agents	May 16, 2025	Prompt Engineering	—Unverified
The Way We Prompt: Conceptual Blending, Neural Dynamics, and Prompt-Induced Transitions in LLMs	May 16, 2025	Prompt Engineering	—Unverified
Unable to Forget: Proactive lnterference Reveals Working Memory Limits in LLMs Beyond Context Length	Jun 9, 2025	Information RetrievalPrompt Engineering	—Unverified
From Legal Texts to Defeasible Deontic Logic via LLMs: A Study in Automated Semantic Analysis	Jun 10, 2025	Prompt Engineering	—Unverified
Augmenting Large Language Models with Static Code Analysis for Automated Code Quality Improvements	Jun 12, 2025	Prompt EngineeringRAG	—Unverified
3DAxisPrompt: Promoting the 3D Grounding and Reasoning in GPT-4o	Mar 17, 2025	Logical ReasoningPrompt Engineering	—Unverified
4DGen: Grounded 4D Content Generation with Spatial-temporal Consistency	Dec 28, 2023	Motion GenerationPrompt Engineering	—Unverified
A Brief History of Prompt: Leveraging Language Models. (Through Advanced Prompting)	Sep 30, 2023	FairnessInformation Retrieval	—Unverified
Accelerated materials language processing enabled by GPT	Aug 18, 2023	Document ClassificationExtractive Question-Answering	—Unverified
Accelerating Complex Disease Treatment through Network Medicine and GenAI: A Case Study on Drug Repurposing for Breast Cancer	Jun 18, 2024	Prompt EngineeringSpecificity	—Unverified
ACCESS: Prompt Engineering for Automated Web Accessibility Violation Corrections	Jan 28, 2024	Prompt Engineering	—Unverified
A Chat About Boring Problems: Studying GPT-based text normalization	Sep 23, 2023	Prompt EngineeringText Normalization	—Unverified

Show:10 25 50

← PrevPage 16 of 25Next →

All datasets ImageNet Caltech-101 DTD EuroSAT FGVC-Aircraft Oxford 102 Flower Oxford-IIIT Pet Dataset Stanford Cars SUN397 UCF101 Food-101 ImageNet-A

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	77.62	—	Unverified
2	Customized Ensemble	Harmonic mean	75.49	—	Unverified
3	MMRL	Harmonic mean	74.45	—	Unverified
4	MMRL++	Harmonic mean	74.44	—	Unverified
5	CoPrompt	Harmonic mean	74.33	—	Unverified
6	HPT++	Harmonic mean	74.24	—	Unverified
7	HPT	Harmonic mean	74.17	—	Unverified
8	ProMetaR	Harmonic mean	74.09	—	Unverified
9	MetaPrompt	Harmonic mean	74.02	—	Unverified
10	DePT	Harmonic mean	74.02	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	97.77	—	Unverified
2	HPT++	Harmonic mean	96.96	—	Unverified
3	MMRL++	Harmonic mean	96.75	—	Unverified
4	MMRL	Harmonic mean	96.68	—	Unverified
5	HPT	Harmonic mean	96.65	—	Unverified
6	CoPrompt	Harmonic mean	96.55	—	Unverified
7	MetaPrompt	Harmonic mean	96.32	—	Unverified
8	DePT	Harmonic mean	96.28	—	Unverified
9	ProMetaR	Harmonic mean	96.16	—	Unverified
10	RPO	Harmonic mean	96.03	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	77.94	—	Unverified
2	MMRL++	Harmonic mean	74.46	—	Unverified
3	HPT++	Harmonic mean	74.23	—	Unverified
4	MMRL	Harmonic mean	73.82	—	Unverified
5	CoPrompt	Harmonic mean	72.79	—	Unverified
6	ProMetaR	Harmonic mean	72.31	—	Unverified
7	HPT	Harmonic mean	72.16	—	Unverified
8	PromptSRC	Harmonic mean	71.75	—	Unverified
9	DePT	Harmonic mean	71.09	—	Unverified
10	RPO	Harmonic mean	68.61	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MMRL++	Harmonic mean	91.94	—	Unverified
2	PromptKD	Harmonic mean	89.14	—	Unverified
3	HPT++	Harmonic mean	87.36	—	Unverified
4	MMRL	Harmonic mean	87.21	—	Unverified
5	CoPrompt	Harmonic mean	85.84	—	Unverified
6	ProMetaR	Harmonic mean	85.3	—	Unverified
7	DePT	Harmonic mean	84.88	—	Unverified
8	HPT	Harmonic mean	84.82	—	Unverified
9	MetaPrompt	Harmonic mean	83.38	—	Unverified
10	MaPLe	Harmonic mean	82.35	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	45.17	—	Unverified
2	MMRL++	Harmonic mean	42.24	—	Unverified
3	HPT++	Harmonic mean	41.33	—	Unverified
4	MMRL	Harmonic mean	41.15	—	Unverified
5	DePT	Harmonic mean	40.73	—	Unverified
6	HPT	Harmonic mean	40.28	—	Unverified
7	ProMetaR	Harmonic mean	40.25	—	Unverified
8	PromptSRC	Harmonic mean	40.15	—	Unverified
9	CoPrompt	Harmonic mean	39.76	—	Unverified
10	MetaPrompt	Harmonic mean	38.24	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	90.24	—	Unverified
2	HPT	Harmonic mean	87.16	—	Unverified
3	MMRL++	Harmonic mean	87.01	—	Unverified
4	MMRL	Harmonic mean	86.78	—	Unverified
5	ProMetaR	Harmonic mean	86.7	—	Unverified
6	DePT	Harmonic mean	86.46	—	Unverified
7	PromptSRC	Harmonic mean	85.95	—	Unverified
8	HPT++	Harmonic mean	85.85	—	Unverified
9	CoPrompt	Harmonic mean	85.71	—	Unverified
10	MetaPrompt	Harmonic mean	84.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	97.15	—	Unverified
2	HPT++	Harmonic mean	96.91	—	Unverified
3	CoPrompt	Harmonic mean	96.87	—	Unverified
4	MMRL	Harmonic mean	96.74	—	Unverified
5	HPT	Harmonic mean	96.71	—	Unverified
6	MaPLe	Harmonic mean	96.58	—	Unverified
7	MMRL++	Harmonic mean	96.51	—	Unverified
8	ProMetaR	Harmonic mean	96.49	—	Unverified
9	CoCoOp	Harmonic mean	96.43	—	Unverified
10	DePT	Harmonic mean	96.37	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	83.13	—	Unverified
2	MMRL++	Harmonic mean	78.18	—	Unverified
3	MMRL	Harmonic mean	78.06	—	Unverified
4	DePT	Harmonic mean	77.79	—	Unverified
5	ProMetaR	Harmonic mean	76.72	—	Unverified
6	PromptSRC	Harmonic mean	76.58	—	Unverified
7	CoPrompt	Harmonic mean	75.66	—	Unverified
8	HPT++	Harmonic mean	75.59	—	Unverified
9	HPT	Harmonic mean	75.57	—	Unverified
10	MetaPrompt	Harmonic mean	75.48	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	82.6	—	Unverified
2	CoPrompt	Harmonic mean	81.31	—	Unverified
3	MMRL++	Harmonic mean	81.28	—	Unverified
4	MMRL	Harmonic mean	81.2	—	Unverified
5	HPT++	Harmonic mean	81.11	—	Unverified
6	DePT	Harmonic mean	81.06	—	Unverified
7	HPT	Harmonic mean	80.88	—	Unverified
8	ProMetaR	Harmonic mean	80.82	—	Unverified
9	MetaPrompt	Harmonic mean	80.62	—	Unverified
10	PromptSRC	Harmonic mean	80.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	86.1	—	Unverified
2	MMRL	Harmonic mean	83.89	—	Unverified
3	HPT++	Harmonic mean	83.81	—	Unverified
4	MMRL++	Harmonic mean	83.81	—	Unverified
5	ProMetaR	Harmonic mean	83.25	—	Unverified
6	HPT	Harmonic mean	83.16	—	Unverified
7	CoPrompt	Harmonic mean	83.07	—	Unverified
8	PromptSRC	Harmonic mean	82.74	—	Unverified
9	DePT	Harmonic mean	82.46	—	Unverified
10	MetaPrompt	Harmonic mean	81.35	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	93.05	—	Unverified
2	CoPrompt	Harmonic mean	91.4	—	Unverified
3	MaPLe	Harmonic mean	91.38	—	Unverified
4	ProMetaR	Harmonic mean	91.34	—	Unverified
5	MetaPrompt	Harmonic mean	91.29	—	Unverified
6	DePT	Harmonic mean	91.22	—	Unverified
7	MMRL++	Harmonic mean	91.1	—	Unverified
8	PromptSRC	Harmonic mean	91.1	—	Unverified
9	HPT++	Harmonic mean	91.09	—	Unverified
10	MMRL	Harmonic mean	91.03	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Top-1 accuracy %	51.6	—	Unverified
2	MMRL	Top-1 accuracy %	51.2	—	Unverified
3	HPT++	Top-1 accuracy %	51.18	—	Unverified
4	MaPLe	Top-1 accuracy %	50.9	—	Unverified
5	PromptSRC	Top-1 accuracy %	50.9	—	Unverified
6	HPT	Top-1 accuracy %	50.85	—	Unverified
7	CoCoOp	Top-1 accuracy %	50.63	—	Unverified
8	CoPrompt	Top-1 accuracy %	50.5	—	Unverified
9	CLIP	Top-1 accuracy %	47.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Top-1 accuracy %	77.9	—	Unverified
2	PromptSRC	Top-1 accuracy %	77.8	—	Unverified
3	MMRL	Top-1 accuracy %	77.53	—	Unverified
4	HPT++	Top-1 accuracy %	77.52	—	Unverified
5	CoPrompt	Top-1 accuracy %	77.51	—	Unverified
6	HPT	Top-1 accuracy %	77.38	—	Unverified
7	MaPLe	Top-1 accuracy %	76.98	—	Unverified
8	CoCoOP	Top-1 accuracy %	76.18	—	Unverified
9	CLIP	Top-1 accuracy %	73.96	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Top-1 accuracy %	49.8	—	Unverified
2	PromptSRC	Top-1 accuracy %	49.55	—	Unverified
3	CoPrompt	Top-1 accuracy %	49.43	—	Unverified
4	HPT	Top-1 accuracy %	49.36	—	Unverified
5	HPT++	Top-1 accuracy %	49.28	—	Unverified
6	MMRL	Top-1 accuracy %	49.17	—	Unverified
7	MaPLe	Top-1 accuracy %	49.15	—	Unverified
8	CoCoOp	Top-1 accuracy %	48.75	—	Unverified
9	CLIP	Top-1 accuracy %	46.15	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	HPT++	Top-1 accuracy %	65.31	—	Unverified
2	HPT	Top-1 accuracy %	65.25	—	Unverified
3	MMRL	Top-1 accuracy %	64.47	—	Unverified
4	PromptSRC	Top-1 accuracy %	64.35	—	Unverified
5	CoCoOp	Top-1 accuracy %	64.07	—	Unverified
6	MaPLe	Top-1 accuracy %	64.07	—	Unverified
7	POMP	Top-1 accuracy %	63.8	—	Unverified
8	CLIP	Top-1 accuracy %	60.83	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Accuracy	25.3	—	Unverified
2	VPT	Accuracy	24.8	—	Unverified