Prompt Engineering

Prompt engineering is the process of designing and refining the prompts used to generate text from language models, such as GPT-3 or similar models. The goal of prompt engineering is to improve the quality and relevance of the generated text by carefully crafting the prompts to elicit the desired responses from the model.

Prompt engineering involves several steps, including selecting the appropriate model architecture and parameters, designing the prompt format and structure, selecting the appropriate task and training data, and fine-tuning the model using the selected prompt and data.

Prompt engineering is a crucial step in the development of language models, as it can greatly influence the quality and effectiveness of the model's responses. By carefully designing and refining the prompts used to generate text, researchers and developers can improve the accuracy and relevance of the model's output, making it more useful for a wide range of applications, including chatbots, language translation, content creation, and more.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 451–500 of 1236 papers

Title	Date	Tasks	Status
Do Prompt Patterns Affect Code Quality? A First Empirical Assessment of ChatGPT-Generated Code	Apr 18, 2025	Code GenerationPrompt Engineering	—Unverified
Doppelganger Method: Breaking Role Consistency in LLM Agent via Prompt-based Transferable Adversarial Attack	Jun 17, 2025	Adversarial AttackPrompt Engineering	—Unverified
Explaining Genetic Programming Trees using Large Language Models	Mar 6, 2024	ChatbotDimensionality Reduction	—Unverified
Can LLMs Understand Computer Networks? Towards a Virtual System Administrator	Apr 19, 2024	Prompt Engineering	—Unverified
GS-KGC: A Generative Subgraph-based Framework for Knowledge Graph Completion with Large Language Models	Aug 20, 2024	Knowledge Graph CompletionKnowledge Graphs	—Unverified
Can Open-source LLMs Enhance Data Synthesis for Toxic Detection?: An Experimental Study	Nov 18, 2024	Data AugmentationHallucination	—Unverified
Exploring Critical Testing Scenarios for Decision-Making Policies: An LLM Approach	Dec 9, 2024	Autonomous DrivingDecision Making	—Unverified
Exploring EFL students' prompt engineering in human-AI story writing: an Activity Theory perspective	Jun 1, 2023	Prompt Engineering	—Unverified
Affective Computing in the Era of Large Language Models: A Survey from the NLP Perspective	Jul 30, 2024	Common Sense ReasoningIn-Context Learning	—Unverified
Exploring Large Language Models for Semantic Analysis and Categorization of Android Malware	Jan 8, 2025	Malware AnalysisPrompt Engineering	—Unverified
Exploring Large Language Models in Healthcare: Insights into Corpora Sources, Customization Strategies, and Evaluation Metrics	Feb 17, 2025	ArticlesFairness	—Unverified
Exploring Prompt Engineering: A Systematic Review with SWOT Analysis	Oct 9, 2024	Language ModelingLanguage Modelling	—Unverified
A Chat About Boring Problems: Studying GPT-based text normalization	Sep 23, 2023	Prompt EngineeringText Normalization	—Unverified
Exploring Prompt Engineering Practices in the Enterprise	Mar 13, 2024	Prompt Engineering	—Unverified
Exploring prompts to elicit memorization in masked language model-based named entity recognition	May 5, 2024	Language ModelingLanguage Modelling	—Unverified
Exploring Small Language Models with Prompt-Learning Paradigm for Efficient Domain-Specific Text Classification	Sep 26, 2023	Prompt EngineeringPrompt Learning	—Unverified
LocalValueBench: A Collaboratively Built and Extensible Benchmark for Evaluating Localized Value Alignment and Ethical Safety in Large Language Models	Jul 27, 2024	Prompt Engineering	—Unverified
Generative Language Models with Retrieval Augmented Generation for Automated Short Answer Scoring	Aug 7, 2024	Prompt EngineeringRetrieval	—Unverified
Exploring the Capabilities of the Frontier Large Language Models for Nuclear Energy Research	Jun 10, 2025	Code GenerationPrompt Engineering	—Unverified
Exploring the Effectiveness of Dataset Synthesis: An application of Apple Detection in Orchards	Jun 20, 2023	Objectobject-detection	—Unverified
Exploring the extent of similarities in software failures across industries using LLMs	Aug 7, 2024	ArticlesData Visualization	—Unverified
AI Foundation Models for Weather and Climate: Applications, Design, and Implementation	Sep 19, 2023	Language ModelingLanguage Modelling	—Unverified
Generative Sign-description Prompts with Multi-positive Contrastive Learning for Sign Language Recognition	May 5, 2025	Contrastive LearningPrompt Engineering	—Unverified
A Personalised Learning Tool for Physics Undergraduate Students Built On a Large Language Model for Symbolic Regression	Jun 17, 2024	Language ModelingLanguage Modelling	—Unverified
Domain Knowledge Distillation from Large Language Model: An Empirical Study in the Autonomous Driving Domain	Jul 17, 2023	Autonomous DrivingKnowledge Distillation	—Unverified
Exploring the Potential of Conversational AI Support for Agent-Based Social Simulation Model Design	May 12, 2024	ChatbotPrompt Engineering	—Unverified
Extending Interactive Science Exhibits into the Classroom using Anthropomorphized Chatbots and Bloom's Taxonomy	Feb 1, 2024	Prompt EngineeringQuestion Generation	—Unverified
Extract Information from Hybrid Long Documents Leveraging LLMs: A Framework and Dataset	Dec 28, 2024	Prompt Engineering	—Unverified
Beyond One-Size-Fits-All: Inversion Learning for Highly Effective NLG Evaluation Prompts	Apr 29, 2025	AllDiversity	—Unverified
Generative AI in Health Economics and Outcomes Research: A Taxonomy of Key Definitions and Emerging Applications, an ISPOR Working Group Report	Oct 26, 2024	Prompt EngineeringRetrieval-augmented Generation	—Unverified
FACTER: Fairness-Aware Conformal Thresholding and Prompt Engineering for Enabling Fair LLM-Based Recommender Systems	Feb 5, 2025	Conformal PredictionFairness	—Unverified
Chaining text-to-image and large language model: A novel approach for generating personalized e-commerce banners	Feb 28, 2024	Language ModelingLanguage Modelling	—Unverified
Does Prompt Design Impact Quality of Data Imputation by LLMs?	Jun 4, 2025	Binary ClassificationImputation	—Unverified
Beyond General Prompts: Automated Prompt Refinement using Contrastive Class Alignment Scores for Disambiguating Objects in Vision-Language Models	May 14, 2025	Language ModelingLanguage Modelling	—Unverified
FanCric : Multi-Agentic Framework for Crafting Fantasy 11 Cricket Teams	Oct 2, 2024	Prompt Engineering	—Unverified
Fast Training Dataset Attribution via In-Context Learning	Aug 14, 2024	In-Context LearningPrompt Engineering	—Unverified
Document-Level Event Extraction with Definition-Driven ICL	Aug 10, 2024	Document-level Event ExtractionEvent Extraction	—Unverified
Beyond Fine-tuning: Unleashing the Potential of Continuous Pretraining for Clinical LLMs	Sep 23, 2024	Prompt Engineering	—Unverified
Federated Foundation Models: Privacy-Preserving and Collaborative Learning for Large Models	May 19, 2023	Federated LearningLifelong learning	—Unverified
Integration of Large Language Models and Federated Learning	Jul 18, 2023	Federated LearningLanguage Modelling	—Unverified
Few-shot clinical entity recognition in English, French and Spanish: masked language models outperform generative model prompting	Feb 20, 2024	Few-Shot Learningnamed-entity-recognition	—Unverified
Few-Shot Learning for Chronic Disease Management: Leveraging Large Language Models and Multi-Prompt Engineering with Medical Knowledge Injection	Jan 16, 2024	Depression DetectionFeature Engineering	—Unverified
Few-shot Multimodal Multitask Multilingual Learning	Feb 19, 2023	Few-Shot LearningIn-Context Learning	—Unverified
Few-Shot Optimized Framework for Hallucination Detection in Resource-Limited NLP Systems	Jan 28, 2025	Ensemble LearningHallucination	—Unverified
APEER: Automatic Prompt Engineering Enhances Large Language Model Reranking	Jun 20, 2024	Information RetrievalLanguage Modeling	—Unverified
Financial Sentiment Analysis on News and Reports Using Large Language Models and FinBERT	Oct 2, 2024	ArticlesPrompt Engineering	—Unverified
ChatGPT4PCG 2 Competition: Prompt Engineering for Science Birds Level Generation	Mar 5, 2024	Prompt Engineering	—Unverified
Fine-tuning and Prompt Engineering with Cognitive Knowledge Graphs for Scholarly Knowledge Organization	Sep 10, 2024	ArticlesKnowledge Graphs	—Unverified
Fine-Tuning Large Language Models for Answering Programming Questions with Code Snippets	Jun 26, 2023	Code GenerationLanguage Modelling	—Unverified
Adversarial Text Purification: A Large Language Model Approach for Defense	Feb 5, 2024	Adversarial PurificationAdversarial Text	—Unverified

Show:10 25 50

← PrevPage 10 of 25Next →

All datasets ImageNet Caltech-101 DTD EuroSAT FGVC-Aircraft Oxford 102 Flower Oxford-IIIT Pet Dataset Stanford Cars SUN397 UCF101 Food-101 ImageNet-A

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	77.62	—	Unverified
2	Customized Ensemble	Harmonic mean	75.49	—	Unverified
3	MMRL	Harmonic mean	74.45	—	Unverified
4	MMRL++	Harmonic mean	74.44	—	Unverified
5	CoPrompt	Harmonic mean	74.33	—	Unverified
6	HPT++	Harmonic mean	74.24	—	Unverified
7	HPT	Harmonic mean	74.17	—	Unverified
8	ProMetaR	Harmonic mean	74.09	—	Unverified
9	MetaPrompt	Harmonic mean	74.02	—	Unverified
10	DePT	Harmonic mean	74.02	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	97.77	—	Unverified
2	HPT++	Harmonic mean	96.96	—	Unverified
3	MMRL++	Harmonic mean	96.75	—	Unverified
4	MMRL	Harmonic mean	96.68	—	Unverified
5	HPT	Harmonic mean	96.65	—	Unverified
6	CoPrompt	Harmonic mean	96.55	—	Unverified
7	MetaPrompt	Harmonic mean	96.32	—	Unverified
8	DePT	Harmonic mean	96.28	—	Unverified
9	ProMetaR	Harmonic mean	96.16	—	Unverified
10	RPO	Harmonic mean	96.03	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	77.94	—	Unverified
2	MMRL++	Harmonic mean	74.46	—	Unverified
3	HPT++	Harmonic mean	74.23	—	Unverified
4	MMRL	Harmonic mean	73.82	—	Unverified
5	CoPrompt	Harmonic mean	72.79	—	Unverified
6	ProMetaR	Harmonic mean	72.31	—	Unverified
7	HPT	Harmonic mean	72.16	—	Unverified
8	PromptSRC	Harmonic mean	71.75	—	Unverified
9	DePT	Harmonic mean	71.09	—	Unverified
10	RPO	Harmonic mean	68.61	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MMRL++	Harmonic mean	91.94	—	Unverified
2	PromptKD	Harmonic mean	89.14	—	Unverified
3	HPT++	Harmonic mean	87.36	—	Unverified
4	MMRL	Harmonic mean	87.21	—	Unverified
5	CoPrompt	Harmonic mean	85.84	—	Unverified
6	ProMetaR	Harmonic mean	85.3	—	Unverified
7	DePT	Harmonic mean	84.88	—	Unverified
8	HPT	Harmonic mean	84.82	—	Unverified
9	MetaPrompt	Harmonic mean	83.38	—	Unverified
10	MaPLe	Harmonic mean	82.35	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	45.17	—	Unverified
2	MMRL++	Harmonic mean	42.24	—	Unverified
3	HPT++	Harmonic mean	41.33	—	Unverified
4	MMRL	Harmonic mean	41.15	—	Unverified
5	DePT	Harmonic mean	40.73	—	Unverified
6	HPT	Harmonic mean	40.28	—	Unverified
7	ProMetaR	Harmonic mean	40.25	—	Unverified
8	PromptSRC	Harmonic mean	40.15	—	Unverified
9	CoPrompt	Harmonic mean	39.76	—	Unverified
10	MetaPrompt	Harmonic mean	38.24	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	90.24	—	Unverified
2	HPT	Harmonic mean	87.16	—	Unverified
3	MMRL++	Harmonic mean	87.01	—	Unverified
4	MMRL	Harmonic mean	86.78	—	Unverified
5	ProMetaR	Harmonic mean	86.7	—	Unverified
6	DePT	Harmonic mean	86.46	—	Unverified
7	PromptSRC	Harmonic mean	85.95	—	Unverified
8	HPT++	Harmonic mean	85.85	—	Unverified
9	CoPrompt	Harmonic mean	85.71	—	Unverified
10	MetaPrompt	Harmonic mean	84.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	97.15	—	Unverified
2	HPT++	Harmonic mean	96.91	—	Unverified
3	CoPrompt	Harmonic mean	96.87	—	Unverified
4	MMRL	Harmonic mean	96.74	—	Unverified
5	HPT	Harmonic mean	96.71	—	Unverified
6	MaPLe	Harmonic mean	96.58	—	Unverified
7	MMRL++	Harmonic mean	96.51	—	Unverified
8	ProMetaR	Harmonic mean	96.49	—	Unverified
9	CoCoOp	Harmonic mean	96.43	—	Unverified
10	DePT	Harmonic mean	96.37	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	83.13	—	Unverified
2	MMRL++	Harmonic mean	78.18	—	Unverified
3	MMRL	Harmonic mean	78.06	—	Unverified
4	DePT	Harmonic mean	77.79	—	Unverified
5	ProMetaR	Harmonic mean	76.72	—	Unverified
6	PromptSRC	Harmonic mean	76.58	—	Unverified
7	CoPrompt	Harmonic mean	75.66	—	Unverified
8	HPT++	Harmonic mean	75.59	—	Unverified
9	HPT	Harmonic mean	75.57	—	Unverified
10	MetaPrompt	Harmonic mean	75.48	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	82.6	—	Unverified
2	CoPrompt	Harmonic mean	81.31	—	Unverified
3	MMRL++	Harmonic mean	81.28	—	Unverified
4	MMRL	Harmonic mean	81.2	—	Unverified
5	HPT++	Harmonic mean	81.11	—	Unverified
6	DePT	Harmonic mean	81.06	—	Unverified
7	HPT	Harmonic mean	80.88	—	Unverified
8	ProMetaR	Harmonic mean	80.82	—	Unverified
9	MetaPrompt	Harmonic mean	80.62	—	Unverified
10	PromptSRC	Harmonic mean	80.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	86.1	—	Unverified
2	MMRL	Harmonic mean	83.89	—	Unverified
3	HPT++	Harmonic mean	83.81	—	Unverified
4	MMRL++	Harmonic mean	83.81	—	Unverified
5	ProMetaR	Harmonic mean	83.25	—	Unverified
6	HPT	Harmonic mean	83.16	—	Unverified
7	CoPrompt	Harmonic mean	83.07	—	Unverified
8	PromptSRC	Harmonic mean	82.74	—	Unverified
9	DePT	Harmonic mean	82.46	—	Unverified
10	MetaPrompt	Harmonic mean	81.35	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	93.05	—	Unverified
2	CoPrompt	Harmonic mean	91.4	—	Unverified
3	MaPLe	Harmonic mean	91.38	—	Unverified
4	ProMetaR	Harmonic mean	91.34	—	Unverified
5	MetaPrompt	Harmonic mean	91.29	—	Unverified
6	DePT	Harmonic mean	91.22	—	Unverified
7	MMRL++	Harmonic mean	91.1	—	Unverified
8	PromptSRC	Harmonic mean	91.1	—	Unverified
9	HPT++	Harmonic mean	91.09	—	Unverified
10	MMRL	Harmonic mean	91.03	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Top-1 accuracy %	51.6	—	Unverified
2	MMRL	Top-1 accuracy %	51.2	—	Unverified
3	HPT++	Top-1 accuracy %	51.18	—	Unverified
4	MaPLe	Top-1 accuracy %	50.9	—	Unverified
5	PromptSRC	Top-1 accuracy %	50.9	—	Unverified
6	HPT	Top-1 accuracy %	50.85	—	Unverified
7	CoCoOp	Top-1 accuracy %	50.63	—	Unverified
8	CoPrompt	Top-1 accuracy %	50.5	—	Unverified
9	CLIP	Top-1 accuracy %	47.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Top-1 accuracy %	77.9	—	Unverified
2	PromptSRC	Top-1 accuracy %	77.8	—	Unverified
3	MMRL	Top-1 accuracy %	77.53	—	Unverified
4	HPT++	Top-1 accuracy %	77.52	—	Unverified
5	CoPrompt	Top-1 accuracy %	77.51	—	Unverified
6	HPT	Top-1 accuracy %	77.38	—	Unverified
7	MaPLe	Top-1 accuracy %	76.98	—	Unverified
8	CoCoOP	Top-1 accuracy %	76.18	—	Unverified
9	CLIP	Top-1 accuracy %	73.96	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Top-1 accuracy %	49.8	—	Unverified
2	PromptSRC	Top-1 accuracy %	49.55	—	Unverified
3	CoPrompt	Top-1 accuracy %	49.43	—	Unverified
4	HPT	Top-1 accuracy %	49.36	—	Unverified
5	HPT++	Top-1 accuracy %	49.28	—	Unverified
6	MMRL	Top-1 accuracy %	49.17	—	Unverified
7	MaPLe	Top-1 accuracy %	49.15	—	Unverified
8	CoCoOp	Top-1 accuracy %	48.75	—	Unverified
9	CLIP	Top-1 accuracy %	46.15	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	HPT++	Top-1 accuracy %	65.31	—	Unverified
2	HPT	Top-1 accuracy %	65.25	—	Unverified
3	MMRL	Top-1 accuracy %	64.47	—	Unverified
4	PromptSRC	Top-1 accuracy %	64.35	—	Unverified
5	CoCoOp	Top-1 accuracy %	64.07	—	Unverified
6	MaPLe	Top-1 accuracy %	64.07	—	Unverified
7	POMP	Top-1 accuracy %	63.8	—	Unverified
8	CLIP	Top-1 accuracy %	60.83	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Accuracy	25.3	—	Unverified
2	VPT	Accuracy	24.8	—	Unverified