Prompt Engineering

Prompt engineering is the process of designing and refining the prompts used to generate text from language models, such as GPT-3 or similar models. The goal of prompt engineering is to improve the quality and relevance of the generated text by carefully crafting the prompts to elicit the desired responses from the model.

Prompt engineering involves several steps, including selecting the appropriate model architecture and parameters, designing the prompt format and structure, selecting the appropriate task and training data, and fine-tuning the model using the selected prompt and data.

Prompt engineering is a crucial step in the development of language models, as it can greatly influence the quality and effectiveness of the model's responses. By carefully designing and refining the prompts used to generate text, researchers and developers can improve the accuracy and relevance of the model's output, making it more useful for a wide range of applications, including chatbots, language translation, content creation, and more.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 701–750 of 1236 papers

Title	Date	Tasks	Status
TaskDiff: A Similarity Metric for Task-Oriented Conversations	Oct 23, 2023	Prompt EngineeringResponse Generation	—Unverified
Task Supportive and Personalized Human-Large Language Model Interaction: A User Study	Feb 9, 2024	Information RetrievalLanguage Modeling	—Unverified
Task Tokens: A Flexible Approach to Adapting Behavior Foundation Models	Mar 28, 2025	Imitation LearningPrompt Engineering	—Unverified
Teach Better or Show Smarter? On Instructions and Exemplars in Automatic Prompt Optimization	Jun 22, 2024	Instruction FollowingPrompt Engineering	—Unverified
Technical Report for Argoverse2 Scenario Mining Challenges on Iterative Error Correction and Spatially-Aware Prompting	Jun 10, 2025	Autonomous DrivingCode Generation	—Unverified
Text2Scenario: Text-Driven Scenario Generation for Autonomous Driving Test	Mar 4, 2025	Autonomous DrivingDescriptive	—Unverified
TextGraphs-16 Natural Language Premise Selection Task: Zero-Shot Premise Selection with Prompting Generative Language Models	Oct 1, 2022	Automated Theorem ProvingInformation Retrieval	—Unverified
Text Speaks Louder than Vision: ASCII Art Reveals Textual Biases in Vision-Language Models	Apr 2, 2025	Prompt Engineering	—Unverified
Text-to-Sticker: Style Tailoring Latent Diffusion Models for Human Expression	Nov 17, 2023	DiversityImage Generation	—Unverified
Textual Bayes: Quantifying Uncertainty in LLM-Based Systems	Jun 11, 2025	Bayesian InferencePrompt Engineering	—Unverified
TextVidBench: A Benchmark for Long Video Scene Text Understanding	Jun 5, 2025	Prompt EngineeringQuestion Answering	—Unverified
The Cultivated Practices of Text-to-Image Generation	Jun 20, 2023	Image GenerationPrompt Engineering	—Unverified
The economic trade-offs of large language models: A case study	Jun 8, 2023	Knowledge DistillationPrompt Engineering	—Unverified
The Future of Combating Rumors? Retrieval, Discrimination, and Generation	Mar 29, 2024	Language ModelingLanguage Modelling	—Unverified
The Future of MLLM Prompting is Adaptive: A Comprehensive Experimental Evaluation of Prompt Engineering Methods for Robust Multimodal Performance	Apr 14, 2025	Code GenerationHallucination	—Unverified
The Hidden Structure -- Improving Legal Document Understanding Through Explicit Text Formatting	May 19, 2025	document understandingOptical Character Recognition (OCR)	—Unverified
The Infinite Index: Information Retrieval on Generative Text-To-Image Models	Dec 14, 2022	Active LearningGame Design	—Unverified
Thematic Analysis with Open-Source Generative AI and Machine Learning: A New Method for Inductive Qualitative Codebook Development	Sep 28, 2024	Prompt EngineeringRetrieval-augmented Generation	—Unverified
The Potential and Pitfalls of using a Large Language Model such as ChatGPT or GPT-4 as a Clinical Assistant	Jul 16, 2023	DiagnosticLanguage Modeling	—Unverified
The Power of One: A Single Example is All it Takes for Segmentation in VLMs	Mar 13, 2025	Allobject-detection	—Unverified
The Problem of Alignment	Dec 30, 2023	Prompt Engineering	—Unverified
The Prompt Canvas: A Literature-Based Practitioner Guide for Creating Effective Prompts in Large Language Models	Dec 6, 2024	Prompt Engineering	—Unverified
The Sample Complexity of Parameter-Free Stochastic Convex Optimization	Jun 12, 2025	Few-Shot LearningModel Selection	—Unverified
The Synergy of Automated Pipelines with Prompt Engineering and Generative AI in Web Crawling	Dec 29, 2024	DiversityPrompt Engineering	—Unverified
ThreatModeling-LLM: Automating Threat Modeling using Large Language Models for Banking System	Nov 26, 2024	Prompt Engineering	—Unverified
To be or not to be? an exploration of continuously controllable prompt engineering	Nov 16, 2023	parameter-efficient fine-tuningPrompt Engineering	—Unverified
Token Prepending: A Training-Free Approach for Eliciting Better Sentence Embeddings from LLMs	Dec 16, 2024	Prompt EngineeringSemantic Textual Similarity	—Unverified
ToolFuzz -- Automated Agent Tool Testing	Mar 6, 2025	Large Language ModelPrompt Engineering	—Unverified
TopicTag: Automatic Annotation of NMF Topic Models Using Chain of Thought and Prompt Tuning with LLMs	Jul 29, 2024	Knowledge GraphsManagement	—Unverified
Demystifying Chains, Trees, and Graphs of Thoughts	Jan 25, 2024	Mathematical ReasoningPrompt Engineering	—Unverified
Toward accessible comics for blind and low vision readers	Jul 11, 2024	Optical Character RecognitionPrompt Engineering	—Unverified
Toward Large Language Models as a Therapeutic Tool: Comparing Prompting Techniques to Improve GPT-Delivered Problem-Solving Therapy	Aug 27, 2024	Prompt Engineering	—Unverified
Toward Reproducing Network Research Results Using Large Language Models	Sep 9, 2023	Prompt Engineering	—Unverified
Towards Analyzing and Mitigating Sycophancy in Large Vision-Language Models	Aug 21, 2024	HallucinationPrompt Engineering	—Unverified
Towards Educator-Driven Tutor Authoring: Generative AI Approaches for Creating Intelligent Tutor Interfaces	May 23, 2024	Prompt Engineering	—Unverified
Towards Full Authorship with AI: Supporting Revision with AI-Generated Views	Mar 2, 2024	Prompt EngineeringText Generation	—Unverified
Towards LLM-Powered Ambient Sensor Based Multi-Person Human Activity Recognition	Jun 25, 2024	Activity RecognitionHuman Activity Recognition	—Unverified
Towards Reliable Medical Question Answering: Techniques and Challenges in Mitigating Hallucinations in Language Models	Aug 25, 2024	Decision MakingHallucination	—Unverified
Towards Zero-Shot and Few-Shot Table Question Answering using GPT-3	Oct 31, 2022	Prompt EngineeringQuestion Answering	—Unverified
Towards Zero-Shot Differential Morphing Attack Detection with Multimodal Large Language Models	May 21, 2025	BenchmarkingPrompt Engineering	—Unverified
Toxicity Detection with Generative Prompt-based Inference	May 24, 2022	Language ModelingLanguage Modelling	—Unverified
Training-Free Semantic Segmentation via LLM-Supervision	Mar 31, 2024	Language ModelingLanguage Modelling	—Unverified
Training LLM-Based Agents with Synthetic Self-Reflected Trajectories and Partial Masking	May 26, 2025	Prompt Engineering	—Unverified
Traj-LLM: A New Exploration for Empowering Trajectory Prediction with Pre-trained Large Language Models	May 8, 2024	Autonomous DrivingDecoder	—Unverified
Transformers Utilization in Chart Understanding: A Review of Recent Advances & Future Trends	Oct 5, 2024	BenchmarkingChart Understanding	—Unverified
Transforming Expert Knowledge into Scalable Ontology via Large Language Models	Jun 10, 2025	Prompt Engineering	—Unverified
Trash to Treasure: Using text-to-image models to inform the design of physical artefacts	Feb 1, 2023	Prompt Engineering	—Unverified
Treasure Hunt: Real-time Targeting of the Long Tail using Training-Time Markers	Jun 17, 2025	Instruction FollowingPrompt Engineering	—Unverified
UM_FHS at TREC 2024 PLABA: Exploration of Fine-tuning and AI agent approach for plain language adaptations of biomedical text	Feb 19, 2025	AI AgentPrompt Engineering	—Unverified
Uncovering Latent Human Wellbeing in Language Model Embeddings	Feb 19, 2024	EthicsLanguage Modeling	—Unverified

Show:10 25 50

← PrevPage 15 of 25Next →

All datasets ImageNet Caltech-101 DTD EuroSAT FGVC-Aircraft Oxford 102 Flower Oxford-IIIT Pet Dataset Stanford Cars SUN397 UCF101 Food-101 ImageNet-A

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	77.62	—	Unverified
2	Customized Ensemble	Harmonic mean	75.49	—	Unverified
3	MMRL	Harmonic mean	74.45	—	Unverified
4	MMRL++	Harmonic mean	74.44	—	Unverified
5	CoPrompt	Harmonic mean	74.33	—	Unverified
6	HPT++	Harmonic mean	74.24	—	Unverified
7	HPT	Harmonic mean	74.17	—	Unverified
8	ProMetaR	Harmonic mean	74.09	—	Unverified
9	MetaPrompt	Harmonic mean	74.02	—	Unverified
10	DePT	Harmonic mean	74.02	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	97.77	—	Unverified
2	HPT++	Harmonic mean	96.96	—	Unverified
3	MMRL++	Harmonic mean	96.75	—	Unverified
4	MMRL	Harmonic mean	96.68	—	Unverified
5	HPT	Harmonic mean	96.65	—	Unverified
6	CoPrompt	Harmonic mean	96.55	—	Unverified
7	MetaPrompt	Harmonic mean	96.32	—	Unverified
8	DePT	Harmonic mean	96.28	—	Unverified
9	ProMetaR	Harmonic mean	96.16	—	Unverified
10	RPO	Harmonic mean	96.03	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	77.94	—	Unverified
2	MMRL++	Harmonic mean	74.46	—	Unverified
3	HPT++	Harmonic mean	74.23	—	Unverified
4	MMRL	Harmonic mean	73.82	—	Unverified
5	CoPrompt	Harmonic mean	72.79	—	Unverified
6	ProMetaR	Harmonic mean	72.31	—	Unverified
7	HPT	Harmonic mean	72.16	—	Unverified
8	PromptSRC	Harmonic mean	71.75	—	Unverified
9	DePT	Harmonic mean	71.09	—	Unverified
10	RPO	Harmonic mean	68.61	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MMRL++	Harmonic mean	91.94	—	Unverified
2	PromptKD	Harmonic mean	89.14	—	Unverified
3	HPT++	Harmonic mean	87.36	—	Unverified
4	MMRL	Harmonic mean	87.21	—	Unverified
5	CoPrompt	Harmonic mean	85.84	—	Unverified
6	ProMetaR	Harmonic mean	85.3	—	Unverified
7	DePT	Harmonic mean	84.88	—	Unverified
8	HPT	Harmonic mean	84.82	—	Unverified
9	MetaPrompt	Harmonic mean	83.38	—	Unverified
10	MaPLe	Harmonic mean	82.35	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	45.17	—	Unverified
2	MMRL++	Harmonic mean	42.24	—	Unverified
3	HPT++	Harmonic mean	41.33	—	Unverified
4	MMRL	Harmonic mean	41.15	—	Unverified
5	DePT	Harmonic mean	40.73	—	Unverified
6	HPT	Harmonic mean	40.28	—	Unverified
7	ProMetaR	Harmonic mean	40.25	—	Unverified
8	PromptSRC	Harmonic mean	40.15	—	Unverified
9	CoPrompt	Harmonic mean	39.76	—	Unverified
10	MetaPrompt	Harmonic mean	38.24	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	90.24	—	Unverified
2	HPT	Harmonic mean	87.16	—	Unverified
3	MMRL++	Harmonic mean	87.01	—	Unverified
4	MMRL	Harmonic mean	86.78	—	Unverified
5	ProMetaR	Harmonic mean	86.7	—	Unverified
6	DePT	Harmonic mean	86.46	—	Unverified
7	PromptSRC	Harmonic mean	85.95	—	Unverified
8	HPT++	Harmonic mean	85.85	—	Unverified
9	CoPrompt	Harmonic mean	85.71	—	Unverified
10	MetaPrompt	Harmonic mean	84.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	97.15	—	Unverified
2	HPT++	Harmonic mean	96.91	—	Unverified
3	CoPrompt	Harmonic mean	96.87	—	Unverified
4	MMRL	Harmonic mean	96.74	—	Unverified
5	HPT	Harmonic mean	96.71	—	Unverified
6	MaPLe	Harmonic mean	96.58	—	Unverified
7	MMRL++	Harmonic mean	96.51	—	Unverified
8	ProMetaR	Harmonic mean	96.49	—	Unverified
9	CoCoOp	Harmonic mean	96.43	—	Unverified
10	DePT	Harmonic mean	96.37	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	83.13	—	Unverified
2	MMRL++	Harmonic mean	78.18	—	Unverified
3	MMRL	Harmonic mean	78.06	—	Unverified
4	DePT	Harmonic mean	77.79	—	Unverified
5	ProMetaR	Harmonic mean	76.72	—	Unverified
6	PromptSRC	Harmonic mean	76.58	—	Unverified
7	CoPrompt	Harmonic mean	75.66	—	Unverified
8	HPT++	Harmonic mean	75.59	—	Unverified
9	HPT	Harmonic mean	75.57	—	Unverified
10	MetaPrompt	Harmonic mean	75.48	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	82.6	—	Unverified
2	CoPrompt	Harmonic mean	81.31	—	Unverified
3	MMRL++	Harmonic mean	81.28	—	Unverified
4	MMRL	Harmonic mean	81.2	—	Unverified
5	HPT++	Harmonic mean	81.11	—	Unverified
6	DePT	Harmonic mean	81.06	—	Unverified
7	HPT	Harmonic mean	80.88	—	Unverified
8	ProMetaR	Harmonic mean	80.82	—	Unverified
9	MetaPrompt	Harmonic mean	80.62	—	Unverified
10	PromptSRC	Harmonic mean	80.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	86.1	—	Unverified
2	MMRL	Harmonic mean	83.89	—	Unverified
3	HPT++	Harmonic mean	83.81	—	Unverified
4	MMRL++	Harmonic mean	83.81	—	Unverified
5	ProMetaR	Harmonic mean	83.25	—	Unverified
6	HPT	Harmonic mean	83.16	—	Unverified
7	CoPrompt	Harmonic mean	83.07	—	Unverified
8	PromptSRC	Harmonic mean	82.74	—	Unverified
9	DePT	Harmonic mean	82.46	—	Unverified
10	MetaPrompt	Harmonic mean	81.35	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	93.05	—	Unverified
2	CoPrompt	Harmonic mean	91.4	—	Unverified
3	MaPLe	Harmonic mean	91.38	—	Unverified
4	ProMetaR	Harmonic mean	91.34	—	Unverified
5	MetaPrompt	Harmonic mean	91.29	—	Unverified
6	DePT	Harmonic mean	91.22	—	Unverified
7	MMRL++	Harmonic mean	91.1	—	Unverified
8	PromptSRC	Harmonic mean	91.1	—	Unverified
9	HPT++	Harmonic mean	91.09	—	Unverified
10	MMRL	Harmonic mean	91.03	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Top-1 accuracy %	51.6	—	Unverified
2	MMRL	Top-1 accuracy %	51.2	—	Unverified
3	HPT++	Top-1 accuracy %	51.18	—	Unverified
4	MaPLe	Top-1 accuracy %	50.9	—	Unverified
5	PromptSRC	Top-1 accuracy %	50.9	—	Unverified
6	HPT	Top-1 accuracy %	50.85	—	Unverified
7	CoCoOp	Top-1 accuracy %	50.63	—	Unverified
8	CoPrompt	Top-1 accuracy %	50.5	—	Unverified
9	CLIP	Top-1 accuracy %	47.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Top-1 accuracy %	77.9	—	Unverified
2	PromptSRC	Top-1 accuracy %	77.8	—	Unverified
3	MMRL	Top-1 accuracy %	77.53	—	Unverified
4	HPT++	Top-1 accuracy %	77.52	—	Unverified
5	CoPrompt	Top-1 accuracy %	77.51	—	Unverified
6	HPT	Top-1 accuracy %	77.38	—	Unverified
7	MaPLe	Top-1 accuracy %	76.98	—	Unverified
8	CoCoOP	Top-1 accuracy %	76.18	—	Unverified
9	CLIP	Top-1 accuracy %	73.96	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Top-1 accuracy %	49.8	—	Unverified
2	PromptSRC	Top-1 accuracy %	49.55	—	Unverified
3	CoPrompt	Top-1 accuracy %	49.43	—	Unverified
4	HPT	Top-1 accuracy %	49.36	—	Unverified
5	HPT++	Top-1 accuracy %	49.28	—	Unverified
6	MMRL	Top-1 accuracy %	49.17	—	Unverified
7	MaPLe	Top-1 accuracy %	49.15	—	Unverified
8	CoCoOp	Top-1 accuracy %	48.75	—	Unverified
9	CLIP	Top-1 accuracy %	46.15	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	HPT++	Top-1 accuracy %	65.31	—	Unverified
2	HPT	Top-1 accuracy %	65.25	—	Unverified
3	MMRL	Top-1 accuracy %	64.47	—	Unverified
4	PromptSRC	Top-1 accuracy %	64.35	—	Unverified
5	CoCoOp	Top-1 accuracy %	64.07	—	Unverified
6	MaPLe	Top-1 accuracy %	64.07	—	Unverified
7	POMP	Top-1 accuracy %	63.8	—	Unverified
8	CLIP	Top-1 accuracy %	60.83	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Accuracy	25.3	—	Unverified
2	VPT	Accuracy	24.8	—	Unverified