Prompt Engineering

Prompt engineering is the process of designing and refining the prompts used to generate text from language models, such as GPT-3 or similar models. The goal of prompt engineering is to improve the quality and relevance of the generated text by carefully crafting the prompts to elicit the desired responses from the model.

Prompt engineering involves several steps, including selecting the appropriate model architecture and parameters, designing the prompt format and structure, selecting the appropriate task and training data, and fine-tuning the model using the selected prompt and data.

Prompt engineering is a crucial step in the development of language models, as it can greatly influence the quality and effectiveness of the model's responses. By carefully designing and refining the prompts used to generate text, researchers and developers can improve the accuracy and relevance of the model's output, making it more useful for a wide range of applications, including chatbots, language translation, content creation, and more.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 801–850 of 1236 papers

Title	Date	Tasks	Status
Achieving Tool Calling Functionality in LLMs Using Only Prompt Engineering Without Fine-Tuning	Jul 6, 2024	Prompt Engineering	—Unverified
A Communication Theory Perspective on Prompting Engineering Methods for Large Language Models	Oct 24, 2023	Multi-Task LearningPrompt Engineering	—Unverified
A Comprehensive Evaluation of Large Language Models on Mental Illnesses	Sep 24, 2024	Prompt Engineering	—Unverified
A Comprehensive Evaluation of Large Language Models on Mental Illnesses in Arabic Context	Jan 12, 2025	Binary ClassificationDiagnostic	—Unverified
Actionable Cyber Threat Intelligence using Knowledge Graphs and Large Language Models	Jun 30, 2024	Knowledge GraphsLink Prediction	—Unverified
AdaptaGen: Domain-Specific Image Generation through Hierarchical Semantic Optimization Framework	Jul 8, 2025	DiversityImage Generation	—Unverified
Adaptive Deep Reasoning: Triggering Deep Thinking When Needed	May 26, 2025	Prompt Engineeringreinforcement-learning	—Unverified
Adaptive Learn-then-Test: Statistically Valid and Efficient Hyperparameter Selection	Sep 24, 2024	Prompt Engineeringvalid	—Unverified
Addressing single object tracking in satellite imagery through prompt-engineered solutions	Jul 7, 2024	ObjectObject Tracking	—Unverified
ADO: Automatic Data Optimization for Inputs in LLM Prompts	Feb 17, 2025	Missing ValuesPrompt Engineering	—Unverified
Advancing Building Energy Modeling with Large Language Models: Exploration and Case Studies	Feb 14, 2024	Language ModellingLarge Language Model	—Unverified
Adversarial Text Purification: A Large Language Model Approach for Defense	Feb 5, 2024	Adversarial PurificationAdversarial Text	—Unverified
Affective Computing in the Era of Large Language Models: A Survey from the NLP Perspective	Jul 30, 2024	Common Sense ReasoningIn-Context Learning	—Unverified
A Foundation Model for Cell Segmentation	Nov 18, 2023	Cell Segmentationmodel	—Unverified
A Framework for Collaborating a Large Language Model Tool in Brainstorming for Triggering Creative Thoughts	Oct 10, 2024	Language ModelingLanguage Modelling	—Unverified
A Framework for Critical Evaluation of Text-to-Image Models: Integrating Art Historical Analysis, Artistic Exploration, and Critical Prompt Engineering	Dec 17, 2024	Prompt Engineering	—Unverified
A Framework for Ranking Content Providers Using Prompt Engineering and Self-Attention Network	Sep 17, 2024	DiversityLearning-To-Rank	—Unverified
AgentMisalignment: Measuring the Propensity for Misaligned Behaviour in LLM-Based Agents	Jun 4, 2025	Large Language ModelPrompt Engineering	—Unverified
AI Agents vs. Agentic AI: A Conceptual Taxonomy, Applications and Challenges	May 15, 2025	AI AgentData Summarization	—Unverified
AI-Copilot for Business Optimisation: A Framework and A Case Study in Production Scheduling	Sep 22, 2023	Prompt EngineeringScheduling	—Unverified
AI-Driven Scholarly Peer Review via Persistent Workflow Prompting, Meta-Prompting, and Meta-Reasoning	May 6, 2025	Prompt Engineering	—Unverified
AI-Driven Virtual Teacher for Enhanced Educational Efficiency: Leveraging Large Pretrain Models for Autonomous Error Analysis and Correction	Sep 14, 2024	Elementary MathematicsPrompt Engineering	—Unverified
AI Foundation Models for Weather and Climate: Applications, Design, and Implementation	Sep 19, 2023	Language ModelingLanguage Modelling	—Unverified
AI/ML Based Detection and Categorization of Covert Communication in IPv6 Network	Jan 18, 2025	Prompt Engineering	—Unverified
AI on AI: Exploring the Utility of GPT as an Expert Annotator of AI Publications	Mar 14, 2024	ChatbotLanguage Modelling	—Unverified
A Large Language Model Pipeline for Breast Cancer Oncology	Jun 10, 2024	Language ModelingLanguage Modelling	—Unverified
FRANC: A Lightweight Framework for High-Quality Code Generation	Jul 17, 2023	Code GenerationPrompt Engineering	—Unverified
A Looming Replication Crisis in Evaluating Behavior in Language Models? Evidence and Solutions	Sep 30, 2024	Prompt EngineeringStrategyQA	—Unverified
A Lost Opportunity for Vision-Language Models: A Comparative Study of Online Test-Time Adaptation for Vision-Language Models	May 23, 2024	Image ClassificationPrompt Engineering	—Unverified
Alpha-GPT: Human-AI Interactive Alpha Mining for Quantitative Investment	Jul 31, 2023	Prompt Engineering	—Unverified
A Machine Learning Approach for Emergency Detection in Medical Scenarios Using Large Language Models	Dec 20, 2024	Prompt Engineering	—Unverified
A Measure Based Generalizable Approach to Understandability	Mar 27, 2025	Prompt Engineering	—Unverified
A Mechanism-Based Approach to Mitigating Harms from Persuasive Generative AI	Apr 23, 2024	Prompt EngineeringRed Teaming	—Unverified
AMPO: Automatic Multi-Branched Prompt Optimization	Oct 11, 2024	Prompt Engineering	—Unverified
Analyzing Prompt Influence on Automated Method Generation: An Empirical Study with Copilot	Feb 13, 2024	Prompt Engineering	—Unverified
An Empirical Categorization of Prompting Techniques for Large Language Models: A Practitioner's Guide	Feb 18, 2024	Prompt Engineering	—Unverified
An Empirical Evaluation of Prompting Strategies for Large Language Models in Zero-Shot Clinical Natural Language Processing	Sep 14, 2023	AttributeAttribute Extraction	—Unverified
An Empirical Study of NetOps Capability of Pre-Trained Large Language Models	Sep 11, 2023	Code GenerationPrompt Engineering	—Unverified
An Empirical Study of OpenAI API Discussions on Stack Overflow	May 7, 2025	Prompt Engineering	—Unverified
A New Type of Foundation Model Based on Recordings of People's Emotions and Physiology	Jul 31, 2024	Prompt EngineeringRAG	—Unverified
An Exploration of Higher Education Course Evaluation by Large Language Models	Nov 3, 2024	Decision MakingPrompt Engineering	—Unverified
An Information-theoretic Approach to Prompt Engineering Without Ground Truth Labels	Nov 16, 2021	Prompt Engineering	—Unverified
An Information-theoretic Approach to Prompt Engineering Without Ground Truth Labels	Mar 21, 2022	Prompt Engineering	—Unverified
An Initial Exploration of Default Images in Text-to-Image Generation	May 14, 2025	Image GenerationPrompt Engineering	—Unverified
AnnotatedTables: A Large Tabular Dataset with Language Model Annotations	Jun 24, 2024	AutoMLFew-Shot Learning	—Unverified
Antelope: Potent and Concealed Jailbreak Attack Strategy	Dec 11, 2024	Prompt Engineering	—Unverified
AoP-SAM: Automation of Prompts for Efficient Segmentation	May 17, 2025	Image SegmentationPrompt Engineering	—Unverified
A Pedestrian is Worth One Prompt: Towards Language Guidance Person Re-Identification	Jan 1, 2024	AttributePerson Re-Identification	—Unverified
APEER: Automatic Prompt Engineering Enhances Large Language Model Reranking	Jun 20, 2024	Information RetrievalLanguage Modeling	—Unverified
A Personalised Learning Tool for Physics Undergraduate Students Built On a Large Language Model for Symbolic Regression	Jun 17, 2024	Language ModelingLanguage Modelling	—Unverified

Show:10 25 50

← PrevPage 17 of 25Next →

All datasets ImageNet Caltech-101 DTD EuroSAT FGVC-Aircraft Oxford 102 Flower Oxford-IIIT Pet Dataset Stanford Cars SUN397 UCF101 Food-101 ImageNet-A

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	77.62	—	Unverified
2	Customized Ensemble	Harmonic mean	75.49	—	Unverified
3	MMRL	Harmonic mean	74.45	—	Unverified
4	MMRL++	Harmonic mean	74.44	—	Unverified
5	CoPrompt	Harmonic mean	74.33	—	Unverified
6	HPT++	Harmonic mean	74.24	—	Unverified
7	HPT	Harmonic mean	74.17	—	Unverified
8	ProMetaR	Harmonic mean	74.09	—	Unverified
9	MetaPrompt	Harmonic mean	74.02	—	Unverified
10	DePT	Harmonic mean	74.02	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	97.77	—	Unverified
2	HPT++	Harmonic mean	96.96	—	Unverified
3	MMRL++	Harmonic mean	96.75	—	Unverified
4	MMRL	Harmonic mean	96.68	—	Unverified
5	HPT	Harmonic mean	96.65	—	Unverified
6	CoPrompt	Harmonic mean	96.55	—	Unverified
7	MetaPrompt	Harmonic mean	96.32	—	Unverified
8	DePT	Harmonic mean	96.28	—	Unverified
9	ProMetaR	Harmonic mean	96.16	—	Unverified
10	RPO	Harmonic mean	96.03	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	77.94	—	Unverified
2	MMRL++	Harmonic mean	74.46	—	Unverified
3	HPT++	Harmonic mean	74.23	—	Unverified
4	MMRL	Harmonic mean	73.82	—	Unverified
5	CoPrompt	Harmonic mean	72.79	—	Unverified
6	ProMetaR	Harmonic mean	72.31	—	Unverified
7	HPT	Harmonic mean	72.16	—	Unverified
8	PromptSRC	Harmonic mean	71.75	—	Unverified
9	DePT	Harmonic mean	71.09	—	Unverified
10	RPO	Harmonic mean	68.61	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MMRL++	Harmonic mean	91.94	—	Unverified
2	PromptKD	Harmonic mean	89.14	—	Unverified
3	HPT++	Harmonic mean	87.36	—	Unverified
4	MMRL	Harmonic mean	87.21	—	Unverified
5	CoPrompt	Harmonic mean	85.84	—	Unverified
6	ProMetaR	Harmonic mean	85.3	—	Unverified
7	DePT	Harmonic mean	84.88	—	Unverified
8	HPT	Harmonic mean	84.82	—	Unverified
9	MetaPrompt	Harmonic mean	83.38	—	Unverified
10	MaPLe	Harmonic mean	82.35	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	45.17	—	Unverified
2	MMRL++	Harmonic mean	42.24	—	Unverified
3	HPT++	Harmonic mean	41.33	—	Unverified
4	MMRL	Harmonic mean	41.15	—	Unverified
5	DePT	Harmonic mean	40.73	—	Unverified
6	HPT	Harmonic mean	40.28	—	Unverified
7	ProMetaR	Harmonic mean	40.25	—	Unverified
8	PromptSRC	Harmonic mean	40.15	—	Unverified
9	CoPrompt	Harmonic mean	39.76	—	Unverified
10	MetaPrompt	Harmonic mean	38.24	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	90.24	—	Unverified
2	HPT	Harmonic mean	87.16	—	Unverified
3	MMRL++	Harmonic mean	87.01	—	Unverified
4	MMRL	Harmonic mean	86.78	—	Unverified
5	ProMetaR	Harmonic mean	86.7	—	Unverified
6	DePT	Harmonic mean	86.46	—	Unverified
7	PromptSRC	Harmonic mean	85.95	—	Unverified
8	HPT++	Harmonic mean	85.85	—	Unverified
9	CoPrompt	Harmonic mean	85.71	—	Unverified
10	MetaPrompt	Harmonic mean	84.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	97.15	—	Unverified
2	HPT++	Harmonic mean	96.91	—	Unverified
3	CoPrompt	Harmonic mean	96.87	—	Unverified
4	MMRL	Harmonic mean	96.74	—	Unverified
5	HPT	Harmonic mean	96.71	—	Unverified
6	MaPLe	Harmonic mean	96.58	—	Unverified
7	MMRL++	Harmonic mean	96.51	—	Unverified
8	ProMetaR	Harmonic mean	96.49	—	Unverified
9	CoCoOp	Harmonic mean	96.43	—	Unverified
10	DePT	Harmonic mean	96.37	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	83.13	—	Unverified
2	MMRL++	Harmonic mean	78.18	—	Unverified
3	MMRL	Harmonic mean	78.06	—	Unverified
4	DePT	Harmonic mean	77.79	—	Unverified
5	ProMetaR	Harmonic mean	76.72	—	Unverified
6	PromptSRC	Harmonic mean	76.58	—	Unverified
7	CoPrompt	Harmonic mean	75.66	—	Unverified
8	HPT++	Harmonic mean	75.59	—	Unverified
9	HPT	Harmonic mean	75.57	—	Unverified
10	MetaPrompt	Harmonic mean	75.48	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	82.6	—	Unverified
2	CoPrompt	Harmonic mean	81.31	—	Unverified
3	MMRL++	Harmonic mean	81.28	—	Unverified
4	MMRL	Harmonic mean	81.2	—	Unverified
5	HPT++	Harmonic mean	81.11	—	Unverified
6	DePT	Harmonic mean	81.06	—	Unverified
7	HPT	Harmonic mean	80.88	—	Unverified
8	ProMetaR	Harmonic mean	80.82	—	Unverified
9	MetaPrompt	Harmonic mean	80.62	—	Unverified
10	PromptSRC	Harmonic mean	80.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	86.1	—	Unverified
2	MMRL	Harmonic mean	83.89	—	Unverified
3	HPT++	Harmonic mean	83.81	—	Unverified
4	MMRL++	Harmonic mean	83.81	—	Unverified
5	ProMetaR	Harmonic mean	83.25	—	Unverified
6	HPT	Harmonic mean	83.16	—	Unverified
7	CoPrompt	Harmonic mean	83.07	—	Unverified
8	PromptSRC	Harmonic mean	82.74	—	Unverified
9	DePT	Harmonic mean	82.46	—	Unverified
10	MetaPrompt	Harmonic mean	81.35	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	93.05	—	Unverified
2	CoPrompt	Harmonic mean	91.4	—	Unverified
3	MaPLe	Harmonic mean	91.38	—	Unverified
4	ProMetaR	Harmonic mean	91.34	—	Unverified
5	MetaPrompt	Harmonic mean	91.29	—	Unverified
6	DePT	Harmonic mean	91.22	—	Unverified
7	PromptSRC	Harmonic mean	91.1	—	Unverified
8	MMRL++	Harmonic mean	91.1	—	Unverified
9	HPT++	Harmonic mean	91.09	—	Unverified
10	MMRL	Harmonic mean	91.03	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Top-1 accuracy %	51.6	—	Unverified
2	MMRL	Top-1 accuracy %	51.2	—	Unverified
3	HPT++	Top-1 accuracy %	51.18	—	Unverified
4	PromptSRC	Top-1 accuracy %	50.9	—	Unverified
5	MaPLe	Top-1 accuracy %	50.9	—	Unverified
6	HPT	Top-1 accuracy %	50.85	—	Unverified
7	CoCoOp	Top-1 accuracy %	50.63	—	Unverified
8	CoPrompt	Top-1 accuracy %	50.5	—	Unverified
9	CLIP	Top-1 accuracy %	47.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Top-1 accuracy %	77.9	—	Unverified
2	PromptSRC	Top-1 accuracy %	77.8	—	Unverified
3	MMRL	Top-1 accuracy %	77.53	—	Unverified
4	HPT++	Top-1 accuracy %	77.52	—	Unverified
5	CoPrompt	Top-1 accuracy %	77.51	—	Unverified
6	HPT	Top-1 accuracy %	77.38	—	Unverified
7	MaPLe	Top-1 accuracy %	76.98	—	Unverified
8	CoCoOP	Top-1 accuracy %	76.18	—	Unverified
9	CLIP	Top-1 accuracy %	73.96	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Top-1 accuracy %	49.8	—	Unverified
2	PromptSRC	Top-1 accuracy %	49.55	—	Unverified
3	CoPrompt	Top-1 accuracy %	49.43	—	Unverified
4	HPT	Top-1 accuracy %	49.36	—	Unverified
5	HPT++	Top-1 accuracy %	49.28	—	Unverified
6	MMRL	Top-1 accuracy %	49.17	—	Unverified
7	MaPLe	Top-1 accuracy %	49.15	—	Unverified
8	CoCoOp	Top-1 accuracy %	48.75	—	Unverified
9	CLIP	Top-1 accuracy %	46.15	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	HPT++	Top-1 accuracy %	65.31	—	Unverified
2	HPT	Top-1 accuracy %	65.25	—	Unverified
3	MMRL	Top-1 accuracy %	64.47	—	Unverified
4	PromptSRC	Top-1 accuracy %	64.35	—	Unverified
5	CoCoOp	Top-1 accuracy %	64.07	—	Unverified
6	MaPLe	Top-1 accuracy %	64.07	—	Unverified
7	POMP	Top-1 accuracy %	63.8	—	Unverified
8	CLIP	Top-1 accuracy %	60.83	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Accuracy	25.3	—	Unverified
2	VPT	Accuracy	24.8	—	Unverified