Prompt Engineering

Prompt engineering is the process of designing and refining the prompts used to generate text from language models, such as GPT-3 or similar models. The goal of prompt engineering is to improve the quality and relevance of the generated text by carefully crafting the prompts to elicit the desired responses from the model.

Prompt engineering involves several steps, including selecting the appropriate model architecture and parameters, designing the prompt format and structure, selecting the appropriate task and training data, and fine-tuning the model using the selected prompt and data.

Prompt engineering is a crucial step in the development of language models, as it can greatly influence the quality and effectiveness of the model's responses. By carefully designing and refining the prompts used to generate text, researchers and developers can improve the accuracy and relevance of the model's output, making it more useful for a wide range of applications, including chatbots, language translation, content creation, and more.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 501–550 of 1236 papers

Title	Date	Tasks	Status
FiSTECH: Financial Style Transfer to Enhance Creativity without Hallucinations in LLMs	Aug 9, 2024	ChatbotHallucination	—Unverified
Flickr30K-CFQ: A Compact and Fragmented Query Dataset for Text-image Retrieval	Mar 20, 2024	Image RetrievalPrompt Engineering	—Unverified
Flipping Against All Odds: Reducing LLM Coin Flip Bias via Verbalized Rejection Sampling	Jun 11, 2025	AllDecision Making	—Unverified
Adversarial Text Purification: A Large Language Model Approach for Defense	Feb 5, 2024	Adversarial PurificationAdversarial Text	—Unverified
Improving face generation quality and prompt following with synthetic captions	May 17, 2024	Face GenerationImage Generation	—Unverified
Framing the News:From Human Perception to Large Language Model Inferences	Apr 27, 2023	ArticlesLanguage Modeling	—Unverified
From Chatbots to PhishBots? -- Preventing Phishing scams created using ChatGPT, Google Bard and Claude	Oct 29, 2023	Prompt Engineering	—Unverified
From Code to Compliance: Assessing ChatGPT's Utility in Designing an Accessible Webpage -- A Case Study	Jan 7, 2025	Prompt EngineeringVisual Reasoning	—Unverified
From Cool Demos to Production-Ready FMware: Core Challenges and a Technology Roadmap	Oct 28, 2024	Prompt Engineering	—Unverified
From Knowledge Generation to Knowledge Verification: Examining the BioMedical Generative Capabilities of ChatGPT	Feb 20, 2025	Prompt Engineering	—Unverified
DMRL: Data- and Model-aware Reward Learning for Data Extraction	May 7, 2025	Prompt EngineeringRed Teaming	—Unverified
Diverse Prompts: Illuminating the Prompt Space of Large Language Models with MAP-Elites	Apr 19, 2025	DiversityPrompt Engineering	—Unverified
Disentangling Exploration of Large Language Models by Optimal Exploitation	Jan 15, 2025	Prompt Engineering	—Unverified
Beyond designer's knowledge: Generating materials design hypotheses via large language models	Sep 10, 2024	Data IntegrationPrompt Engineering	—Unverified
A Pedestrian is Worth One Prompt: Towards Language Guidance Person Re-Identification	Jan 1, 2024	AttributePerson Re-Identification	—Unverified
DiffLM: Controllable Synthetic Data Generation via Diffusion Language Models	Nov 5, 2024	Prompt EngineeringSynthetic Data Generation	—Unverified
AoP-SAM: Automation of Prompts for Efficient Segmentation	May 17, 2025	Image SegmentationPrompt Engineering	—Unverified
DiffChat: Learning to Chat with Text-to-Image Synthesis Models for Interactive Image Creation	Mar 8, 2024	Image GenerationInstruction Following	—Unverified
Best Practices for Text Annotation with Large Language Models	Feb 5, 2024	Model SelectionPrompt Engineering	—Unverified
ACCESS: Prompt Engineering for Automated Web Accessibility Violation Corrections	Jan 28, 2024	Prompt Engineering	—Unverified
Unable to Forget: Proactive lnterference Reveals Working Memory Limits in LLMs Beyond Context Length	Jun 9, 2025	Information RetrievalPrompt Engineering	—Unverified
Automatic Semantic Augmentation of Language Model Prompts (for Code Summarization)	Apr 13, 2023	Code SummarizationInformation Retrieval	—Unverified
In-context learning capabilities of Large Language Models to detect suicide risk among adolescents from speech transcripts	May 26, 2025	In-Context LearningPrompt Engineering	—Unverified
Dialectical Alignment: Resolving the Tension of 3H and Security Threats of LLMs	Mar 30, 2024	knowledge editingNavigate	—Unverified
DevBots can co-design APIs	Dec 10, 2023	ArticlesPrompt Engineering	—Unverified
Determinants of LLM-assisted Decision-Making	Feb 27, 2024	Decision MakingPrompt Engineering	—Unverified
Détection d’anomalies textuelles à base de l’ingénierie d’invite (Prompt Engineering-Based Text Anomaly Detection )	Jun 1, 2022	Anomaly DetectionPrompt Engineering	—Unverified
Antelope: Potent and Concealed Jailbreak Attack Strategy	Dec 11, 2024	Prompt Engineering	—Unverified
Detection and Positive Reconstruction of Cognitive Distortion sentences: Mandarin Dataset and Evaluation	May 24, 2024	Prompt EngineeringTransfer Learning	—Unverified
Detecting Natural Language Biases with Prompt-based Learning	Sep 11, 2023	Language ModelingLanguage Modelling	—Unverified
Benchmarking Prompt Engineering Techniques for Secure Code Generation with GPT Models	Feb 9, 2025	BenchmarkingCode Generation	—Unverified
Atoxia: Red-teaming Large Language Models with Target Toxic Answers	Aug 27, 2024	Prompt EngineeringRed Teaming	—Unverified
AnnotatedTables: A Large Tabular Dataset with Language Model Annotations	Jun 24, 2024	AutoMLFew-Shot Learning	—Unverified
Advancing Building Energy Modeling with Large Language Models: Exploration and Case Studies	Feb 14, 2024	Language ModellingLarge Language Model	—Unverified
VLM Agents Generate Their Own Memories: Distilling Experience into Embodied Programs of Thought	Jun 20, 2024	Action AnticipationContinual Learning	—Unverified
Benchmarking Chinese Medical LLMs: A Medbench-based Analysis of Performance Gaps and Hierarchical Optimization Strategies	Mar 10, 2025	BenchmarkingEthics	—Unverified
Demonstration Notebook: Finding the Most Suited In-Context Learning Example from Interactions	Jun 16, 2024	In-Context LearningPrompt Engineering	—Unverified
Defining and Evaluating Physical Safety for Large Language Models	Nov 4, 2024	Code GenerationIn-Context Learning	—Unverified
Benchmarking Causal Study to Interpret Large Language Models for Source Code	Aug 23, 2023	BenchmarkingCausal Inference	—Unverified
An Initial Exploration of Default Images in Text-to-Image Generation	May 14, 2025	Image GenerationPrompt Engineering	—Unverified
An Information-theoretic Approach to Prompt Engineering Without Ground Truth Labels	Mar 21, 2022	Prompt Engineering	—Unverified
DeepLocalization: Using change point detection for Temporal Action Localization	Apr 18, 2024	Action LocalizationChange Point Detection	—Unverified
BEAVER: An Enterprise Benchmark for Text-to-SQL	Sep 3, 2024	Natural Language QueriesPrompt Engineering	—Unverified
ADO: Automatic Data Optimization for Inputs in LLM Prompts	Feb 17, 2025	Missing ValuesPrompt Engineering	—Unverified
Accelerating Complex Disease Treatment through Network Medicine and GenAI: A Case Study on Drug Repurposing for Breast Cancer	Jun 18, 2024	Prompt EngineeringSpecificity	—Unverified
Illuminate: A novel approach for depression detection with explainable analysis and proactive therapy using prompt engineering	Feb 5, 2024	Depression DetectionDialogue Management	—Unverified
DDPT: Diffusion-Driven Prompt Tuning for Large Language Model Code Generation	Apr 6, 2025	Code GenerationLanguage Modeling	—Unverified
BeautifulPrompt: Towards Automatic Prompt Engineering for Text-to-Image Synthesis	Nov 12, 2023	Image GenerationPrompt Engineering	—Unverified
Data-Driven Approach for Formality-Sensitive Machine Translation: Language-Specific Handling and Synthetic Data Generation	Jun 26, 2023	Machine TranslationPrompt Engineering	—Unverified
An Information-theoretic Approach to Prompt Engineering Without Ground Truth Labels	Nov 16, 2021	Prompt Engineering	—Unverified

Show:10 25 50

← PrevPage 11 of 25Next →

All datasets ImageNet Caltech-101 DTD EuroSAT FGVC-Aircraft Oxford 102 Flower Oxford-IIIT Pet Dataset Stanford Cars SUN397 UCF101 Food-101 ImageNet-A

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	77.62	—	Unverified
2	Customized Ensemble	Harmonic mean	75.49	—	Unverified
3	MMRL	Harmonic mean	74.45	—	Unverified
4	MMRL++	Harmonic mean	74.44	—	Unverified
5	CoPrompt	Harmonic mean	74.33	—	Unverified
6	HPT++	Harmonic mean	74.24	—	Unverified
7	HPT	Harmonic mean	74.17	—	Unverified
8	ProMetaR	Harmonic mean	74.09	—	Unverified
9	MetaPrompt	Harmonic mean	74.02	—	Unverified
10	DePT	Harmonic mean	74.02	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	97.77	—	Unverified
2	HPT++	Harmonic mean	96.96	—	Unverified
3	MMRL++	Harmonic mean	96.75	—	Unverified
4	MMRL	Harmonic mean	96.68	—	Unverified
5	HPT	Harmonic mean	96.65	—	Unverified
6	CoPrompt	Harmonic mean	96.55	—	Unverified
7	MetaPrompt	Harmonic mean	96.32	—	Unverified
8	DePT	Harmonic mean	96.28	—	Unverified
9	ProMetaR	Harmonic mean	96.16	—	Unverified
10	RPO	Harmonic mean	96.03	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	77.94	—	Unverified
2	MMRL++	Harmonic mean	74.46	—	Unverified
3	HPT++	Harmonic mean	74.23	—	Unverified
4	MMRL	Harmonic mean	73.82	—	Unverified
5	CoPrompt	Harmonic mean	72.79	—	Unverified
6	ProMetaR	Harmonic mean	72.31	—	Unverified
7	HPT	Harmonic mean	72.16	—	Unverified
8	PromptSRC	Harmonic mean	71.75	—	Unverified
9	DePT	Harmonic mean	71.09	—	Unverified
10	RPO	Harmonic mean	68.61	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MMRL++	Harmonic mean	91.94	—	Unverified
2	PromptKD	Harmonic mean	89.14	—	Unverified
3	HPT++	Harmonic mean	87.36	—	Unverified
4	MMRL	Harmonic mean	87.21	—	Unverified
5	CoPrompt	Harmonic mean	85.84	—	Unverified
6	ProMetaR	Harmonic mean	85.3	—	Unverified
7	DePT	Harmonic mean	84.88	—	Unverified
8	HPT	Harmonic mean	84.82	—	Unverified
9	MetaPrompt	Harmonic mean	83.38	—	Unverified
10	MaPLe	Harmonic mean	82.35	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	45.17	—	Unverified
2	MMRL++	Harmonic mean	42.24	—	Unverified
3	HPT++	Harmonic mean	41.33	—	Unverified
4	MMRL	Harmonic mean	41.15	—	Unverified
5	DePT	Harmonic mean	40.73	—	Unverified
6	HPT	Harmonic mean	40.28	—	Unverified
7	ProMetaR	Harmonic mean	40.25	—	Unverified
8	PromptSRC	Harmonic mean	40.15	—	Unverified
9	CoPrompt	Harmonic mean	39.76	—	Unverified
10	MetaPrompt	Harmonic mean	38.24	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	90.24	—	Unverified
2	HPT	Harmonic mean	87.16	—	Unverified
3	MMRL++	Harmonic mean	87.01	—	Unverified
4	MMRL	Harmonic mean	86.78	—	Unverified
5	ProMetaR	Harmonic mean	86.7	—	Unverified
6	DePT	Harmonic mean	86.46	—	Unverified
7	PromptSRC	Harmonic mean	85.95	—	Unverified
8	HPT++	Harmonic mean	85.85	—	Unverified
9	CoPrompt	Harmonic mean	85.71	—	Unverified
10	MetaPrompt	Harmonic mean	84.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	97.15	—	Unverified
2	HPT++	Harmonic mean	96.91	—	Unverified
3	CoPrompt	Harmonic mean	96.87	—	Unverified
4	MMRL	Harmonic mean	96.74	—	Unverified
5	HPT	Harmonic mean	96.71	—	Unverified
6	MaPLe	Harmonic mean	96.58	—	Unverified
7	MMRL++	Harmonic mean	96.51	—	Unverified
8	ProMetaR	Harmonic mean	96.49	—	Unverified
9	CoCoOp	Harmonic mean	96.43	—	Unverified
10	DePT	Harmonic mean	96.37	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	83.13	—	Unverified
2	MMRL++	Harmonic mean	78.18	—	Unverified
3	MMRL	Harmonic mean	78.06	—	Unverified
4	DePT	Harmonic mean	77.79	—	Unverified
5	ProMetaR	Harmonic mean	76.72	—	Unverified
6	PromptSRC	Harmonic mean	76.58	—	Unverified
7	CoPrompt	Harmonic mean	75.66	—	Unverified
8	HPT++	Harmonic mean	75.59	—	Unverified
9	HPT	Harmonic mean	75.57	—	Unverified
10	MetaPrompt	Harmonic mean	75.48	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	82.6	—	Unverified
2	CoPrompt	Harmonic mean	81.31	—	Unverified
3	MMRL++	Harmonic mean	81.28	—	Unverified
4	MMRL	Harmonic mean	81.2	—	Unverified
5	HPT++	Harmonic mean	81.11	—	Unverified
6	DePT	Harmonic mean	81.06	—	Unverified
7	HPT	Harmonic mean	80.88	—	Unverified
8	ProMetaR	Harmonic mean	80.82	—	Unverified
9	MetaPrompt	Harmonic mean	80.62	—	Unverified
10	PromptSRC	Harmonic mean	80.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	86.1	—	Unverified
2	MMRL	Harmonic mean	83.89	—	Unverified
3	HPT++	Harmonic mean	83.81	—	Unverified
4	MMRL++	Harmonic mean	83.81	—	Unverified
5	ProMetaR	Harmonic mean	83.25	—	Unverified
6	HPT	Harmonic mean	83.16	—	Unverified
7	CoPrompt	Harmonic mean	83.07	—	Unverified
8	PromptSRC	Harmonic mean	82.74	—	Unverified
9	DePT	Harmonic mean	82.46	—	Unverified
10	MetaPrompt	Harmonic mean	81.35	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	93.05	—	Unverified
2	CoPrompt	Harmonic mean	91.4	—	Unverified
3	MaPLe	Harmonic mean	91.38	—	Unverified
4	ProMetaR	Harmonic mean	91.34	—	Unverified
5	MetaPrompt	Harmonic mean	91.29	—	Unverified
6	DePT	Harmonic mean	91.22	—	Unverified
7	MMRL++	Harmonic mean	91.1	—	Unverified
8	PromptSRC	Harmonic mean	91.1	—	Unverified
9	HPT++	Harmonic mean	91.09	—	Unverified
10	MMRL	Harmonic mean	91.03	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Top-1 accuracy %	51.6	—	Unverified
2	MMRL	Top-1 accuracy %	51.2	—	Unverified
3	HPT++	Top-1 accuracy %	51.18	—	Unverified
4	MaPLe	Top-1 accuracy %	50.9	—	Unverified
5	PromptSRC	Top-1 accuracy %	50.9	—	Unverified
6	HPT	Top-1 accuracy %	50.85	—	Unverified
7	CoCoOp	Top-1 accuracy %	50.63	—	Unverified
8	CoPrompt	Top-1 accuracy %	50.5	—	Unverified
9	CLIP	Top-1 accuracy %	47.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Top-1 accuracy %	77.9	—	Unverified
2	PromptSRC	Top-1 accuracy %	77.8	—	Unverified
3	MMRL	Top-1 accuracy %	77.53	—	Unverified
4	HPT++	Top-1 accuracy %	77.52	—	Unverified
5	CoPrompt	Top-1 accuracy %	77.51	—	Unverified
6	HPT	Top-1 accuracy %	77.38	—	Unverified
7	MaPLe	Top-1 accuracy %	76.98	—	Unverified
8	CoCoOP	Top-1 accuracy %	76.18	—	Unverified
9	CLIP	Top-1 accuracy %	73.96	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Top-1 accuracy %	49.8	—	Unverified
2	PromptSRC	Top-1 accuracy %	49.55	—	Unverified
3	CoPrompt	Top-1 accuracy %	49.43	—	Unverified
4	HPT	Top-1 accuracy %	49.36	—	Unverified
5	HPT++	Top-1 accuracy %	49.28	—	Unverified
6	MMRL	Top-1 accuracy %	49.17	—	Unverified
7	MaPLe	Top-1 accuracy %	49.15	—	Unverified
8	CoCoOp	Top-1 accuracy %	48.75	—	Unverified
9	CLIP	Top-1 accuracy %	46.15	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	HPT++	Top-1 accuracy %	65.31	—	Unverified
2	HPT	Top-1 accuracy %	65.25	—	Unverified
3	MMRL	Top-1 accuracy %	64.47	—	Unverified
4	PromptSRC	Top-1 accuracy %	64.35	—	Unverified
5	CoCoOp	Top-1 accuracy %	64.07	—	Unverified
6	MaPLe	Top-1 accuracy %	64.07	—	Unverified
7	POMP	Top-1 accuracy %	63.8	—	Unverified
8	CLIP	Top-1 accuracy %	60.83	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Accuracy	25.3	—	Unverified
2	VPT	Accuracy	24.8	—	Unverified