Prompt Engineering

Prompt engineering is the process of designing and refining the prompts used to generate text from language models, such as GPT-3 or similar models. The goal of prompt engineering is to improve the quality and relevance of the generated text by carefully crafting the prompts to elicit the desired responses from the model.

Prompt engineering involves several steps, including selecting the appropriate model architecture and parameters, designing the prompt format and structure, selecting the appropriate task and training data, and fine-tuning the model using the selected prompt and data.

Prompt engineering is a crucial step in the development of language models, as it can greatly influence the quality and effectiveness of the model's responses. By carefully designing and refining the prompts used to generate text, researchers and developers can improve the accuracy and relevance of the model's output, making it more useful for a wide range of applications, including chatbots, language translation, content creation, and more.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 301–350 of 1236 papers

Title	Date	Tasks	Status
Can Prompt Learning Benefit Radiology Report Generation?	Aug 30, 2023	Image CaptioningPrompt Engineering	—Unverified
Can Open-source LLMs Enhance Data Synthesis for Toxic Detection?: An Experimental Study	Nov 18, 2024	Data AugmentationHallucination	—Unverified
AI-Driven Scholarly Peer Review via Persistent Workflow Prompting, Meta-Prompting, and Meta-Reasoning	May 6, 2025	Prompt Engineering	—Unverified
Enhancing Generalization in Chain of Thought Reasoning for Smaller Models	Jan 16, 2025	Knowledge DistillationMemorization	—Unverified
Can LLMs Understand Computer Networks? Towards a Virtual System Administrator	Apr 19, 2024	Prompt Engineering	—Unverified
A Simple Zero-shot Prompt Weighting Technique to Improve Prompt Ensembling in Text-Image Models	Feb 13, 2023	Prompt Engineeringzero-shot-classification	—Unverified
AI-Copilot for Business Optimisation: A Framework and A Case Study in Production Scheduling	Sep 22, 2023	Prompt EngineeringScheduling	—Unverified
A Sign Language Recognition System with Pepper, Lightweight-Transformer, and LLM	Sep 28, 2023	Prompt EngineeringSign Language Recognition	—Unverified
Enhancing Computer Programming Education with LLMs: A Study on Effective Prompt Engineering for Python Code Generation	Jul 7, 2024	Code GenerationPrompt Engineering	—Unverified
Enhancing LLMs' Reasoning-Intensive Multimedia Search Capabilities through Fine-Tuning and Reinforcement Learning	May 24, 2025	Multiple-choicePrompt Engineering	—Unverified
Enhancing Summarization Performance through Transformer-Based Prompt Engineering in Automated Medical Reporting	Nov 22, 2023	Prompt Engineering	—Unverified
Evaluating and Mitigating Discrimination in Language Model Decisions	Dec 6, 2023	Language ModelingLanguage Modelling	—Unverified
Can LLMs Grade Short-Answer Reading Comprehension Questions : An Empirical Study with a Novel Dataset	Oct 26, 2023	Decision MakingPrompt Engineering	—Unverified
Can LLM be a Good Path Planner based on Prompt Engineering? Mitigating the Hallucination for Path Planning	Aug 23, 2024	HallucinationPrompt Engineering	—Unverified
A Sequential Optimal Learning Approach to Automated Prompt Engineering in Large Language Models	Jan 7, 2025	Prompt EngineeringPrompt Learning	—Unverified
Can Large Vision-Language Models Detect Images Copyright Infringement from GenAI?	Feb 23, 2025	Prompt Engineering	—Unverified
Artificial Intelligence for Health Message Generation: Theory, Method, and an Empirical Study Using Prompt Engineering	Dec 14, 2022	Prompt Engineering	—Unverified
AI Agents vs. Agentic AI: A Conceptual Taxonomy, Applications and Challenges	May 15, 2025	AI AgentData Summarization	—Unverified
Arguments to Key Points Mapping with Prompt-based Learning	Nov 28, 2022	NegationPrompt Engineering	—Unverified
Can Large Language Models Make the Grade? An Empirical Study Evaluating LLMs Ability to Mark Short Answer Questions in K-12 Education	May 5, 2024	Prompt EngineeringReading Comprehension	—Unverified
Enabling On-Device LLMs Personalization with Smartphone Sensing	Jul 5, 2024	Prompt Engineering	—Unverified
Can Large Language Models Extract Customer Needs as well as Professional Analysts?	Feb 25, 2025	MarketingPrompt Engineering	—Unverified
Can Large Language Models Detect Misinformation in Scientific News Reporting?	Feb 22, 2024	ArticlesClaim Verification	—Unverified
A Reward-driven Automated Webshell Malicious-code Generator for Red-teaming	May 30, 2025	Code GenerationDiversity	—Unverified
Can Large Language Models Capture Public Opinion about Global Warming? An Empirical Assessment of Algorithmic Fidelity and Bias	Nov 1, 2023	Model SelectionPrompt Engineering	—Unverified
A Review of Multi-Modal Large Language and Vision Models	Mar 28, 2024	Image CaptioningPrompt Engineering	—Unverified
A Review of 3D Object Detection with Vision-Language Models	Apr 25, 2025	3D Object DetectionObject	—Unverified
Can GPT tell us why these images are synthesized? Empowering Multimodal Large Language Models for Forensics	Apr 16, 2025	Few-Shot LearningImage Manipulation	—Unverified
Emotional Support with LLM-based Empathetic Dialogue Generation	Jul 17, 2025	Dialogue GenerationPrompt Engineering	—Unverified
Can GPT-4 Models Detect Misleading Visualizations?	Aug 8, 2024	MisinformationPrompt Engineering	—Unverified
Can Generated Images Serve as a Viable Modality for Text-Centric Multimodal Learning?	Jun 21, 2025	Language ModelingLanguage Modelling	—Unverified
A Reliable Knowledge Processing Framework for Combustion Science using Foundation Models	Dec 31, 2023	ArticlesPrompt Engineering	—Unverified
AgentMisalignment: Measuring the Propensity for Misaligned Behaviour in LLM-Based Agents	Jun 4, 2025	Large Language ModelPrompt Engineering	—Unverified
From Legal Texts to Defeasible Deontic Logic via LLMs: A Study in Automated Semantic Analysis	Jun 10, 2025	Prompt Engineering	—Unverified
Emotional Manipulation Through Prompt Engineering Amplifies Disinformation Generation in AI Large Language Models	Mar 6, 2024	Prompt EngineeringText Generation	—Unverified
Empowering ChatGPT-Like Large-Scale Language Models with Local Knowledge Base for Industrial Prognostics and Health Management	Dec 6, 2023	Language ModellingManagement	—Unverified
Enhancing Agricultural Machinery Management through Advanced LLM Integration	Jul 30, 2024	Decision MakingManagement	—Unverified
Convergences and Divergences between Automatic Assessment and Human Evaluation: Insights from Comparing ChatGPT-Generated Translation and Neural Machine Translation	Jan 10, 2024	Machine TranslationNMT	—Unverified
Can ChatGPT Overcome Behavioral Biases in the Financial Sector? Classify-and-Rethink: Multi-Step Zero-Shot Reasoning in the Gold Investment	Nov 19, 2024	Prompt Engineering	—Unverified
Are Frontier Large Language Models Suitable for Q&A in Science Centres?	Dec 6, 2024	Prompt Engineering	—Unverified
Can ChatGPT implement finite element models for geotechnical engineering applications?	Jan 4, 2025	Large Language ModelPrompt Engineering	—Unverified
A Communication Theory Perspective on Prompting Engineering Methods for Large Language Models	Oct 24, 2023	Multi-Task LearningPrompt Engineering	—Unverified
Can Artificial Intelligence Generate Quality Research Topics Reflecting Patient Concerns?	Nov 15, 2024	ArticlesPrompt Engineering	—Unverified
Can AI Read Between The Lines? Benchmarking LLMs On Financial Nuance	May 22, 2025	BenchmarkingPrompt Engineering	—Unverified
Arbitrary Data as Images: Fusion of Patient Data Across Modalities and Irregular Intervals with Vision Transformers	Jan 30, 2025	Prompt Engineering	—Unverified
Can a GPT4-Powered AI Agent Be a Good Enough Performance Attribution Analyst?	Mar 15, 2024	AI AgentManagement	—Unverified
CallNavi, A Challenge and Empirical Study on LLM Function Calling and Routing	Jan 9, 2025	BenchmarkingChatbot	—Unverified
A Prompt Refinement-based Large Language Model for Metro Passenger Flow Forecasting under Delay Conditions	Oct 19, 2024	DescriptiveFew-Shot Learning	—Unverified
A Framework for Ranking Content Providers Using Prompt Engineering and Self-Attention Network	Sep 17, 2024	DiversityLearning-To-Rank	—Unverified
Recording First-person Experiences to Build a New Type of Foundation Model	Jul 31, 2024	EEGPrompt Engineering	—Unverified

Show:10 25 50

← PrevPage 7 of 25Next →

All datasets ImageNet Caltech-101 DTD EuroSAT FGVC-Aircraft Oxford 102 Flower Oxford-IIIT Pet Dataset Stanford Cars SUN397 UCF101 Food-101 ImageNet-A

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	77.62	—	Unverified
2	Customized Ensemble	Harmonic mean	75.49	—	Unverified
3	MMRL	Harmonic mean	74.45	—	Unverified
4	MMRL++	Harmonic mean	74.44	—	Unverified
5	CoPrompt	Harmonic mean	74.33	—	Unverified
6	HPT++	Harmonic mean	74.24	—	Unverified
7	HPT	Harmonic mean	74.17	—	Unverified
8	ProMetaR	Harmonic mean	74.09	—	Unverified
9	MetaPrompt	Harmonic mean	74.02	—	Unverified
10	DePT	Harmonic mean	74.02	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	97.77	—	Unverified
2	HPT++	Harmonic mean	96.96	—	Unverified
3	MMRL++	Harmonic mean	96.75	—	Unverified
4	MMRL	Harmonic mean	96.68	—	Unverified
5	HPT	Harmonic mean	96.65	—	Unverified
6	CoPrompt	Harmonic mean	96.55	—	Unverified
7	MetaPrompt	Harmonic mean	96.32	—	Unverified
8	DePT	Harmonic mean	96.28	—	Unverified
9	ProMetaR	Harmonic mean	96.16	—	Unverified
10	RPO	Harmonic mean	96.03	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	77.94	—	Unverified
2	MMRL++	Harmonic mean	74.46	—	Unverified
3	HPT++	Harmonic mean	74.23	—	Unverified
4	MMRL	Harmonic mean	73.82	—	Unverified
5	CoPrompt	Harmonic mean	72.79	—	Unverified
6	ProMetaR	Harmonic mean	72.31	—	Unverified
7	HPT	Harmonic mean	72.16	—	Unverified
8	PromptSRC	Harmonic mean	71.75	—	Unverified
9	DePT	Harmonic mean	71.09	—	Unverified
10	RPO	Harmonic mean	68.61	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MMRL++	Harmonic mean	91.94	—	Unverified
2	PromptKD	Harmonic mean	89.14	—	Unverified
3	HPT++	Harmonic mean	87.36	—	Unverified
4	MMRL	Harmonic mean	87.21	—	Unverified
5	CoPrompt	Harmonic mean	85.84	—	Unverified
6	ProMetaR	Harmonic mean	85.3	—	Unverified
7	DePT	Harmonic mean	84.88	—	Unverified
8	HPT	Harmonic mean	84.82	—	Unverified
9	MetaPrompt	Harmonic mean	83.38	—	Unverified
10	MaPLe	Harmonic mean	82.35	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	45.17	—	Unverified
2	MMRL++	Harmonic mean	42.24	—	Unverified
3	HPT++	Harmonic mean	41.33	—	Unverified
4	MMRL	Harmonic mean	41.15	—	Unverified
5	DePT	Harmonic mean	40.73	—	Unverified
6	HPT	Harmonic mean	40.28	—	Unverified
7	ProMetaR	Harmonic mean	40.25	—	Unverified
8	PromptSRC	Harmonic mean	40.15	—	Unverified
9	CoPrompt	Harmonic mean	39.76	—	Unverified
10	MetaPrompt	Harmonic mean	38.24	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	90.24	—	Unverified
2	HPT	Harmonic mean	87.16	—	Unverified
3	MMRL++	Harmonic mean	87.01	—	Unverified
4	MMRL	Harmonic mean	86.78	—	Unverified
5	ProMetaR	Harmonic mean	86.7	—	Unverified
6	DePT	Harmonic mean	86.46	—	Unverified
7	PromptSRC	Harmonic mean	85.95	—	Unverified
8	HPT++	Harmonic mean	85.85	—	Unverified
9	CoPrompt	Harmonic mean	85.71	—	Unverified
10	MetaPrompt	Harmonic mean	84.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	97.15	—	Unverified
2	HPT++	Harmonic mean	96.91	—	Unverified
3	CoPrompt	Harmonic mean	96.87	—	Unverified
4	MMRL	Harmonic mean	96.74	—	Unverified
5	HPT	Harmonic mean	96.71	—	Unverified
6	MaPLe	Harmonic mean	96.58	—	Unverified
7	MMRL++	Harmonic mean	96.51	—	Unverified
8	ProMetaR	Harmonic mean	96.49	—	Unverified
9	CoCoOp	Harmonic mean	96.43	—	Unverified
10	DePT	Harmonic mean	96.37	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	83.13	—	Unverified
2	MMRL++	Harmonic mean	78.18	—	Unverified
3	MMRL	Harmonic mean	78.06	—	Unverified
4	DePT	Harmonic mean	77.79	—	Unverified
5	ProMetaR	Harmonic mean	76.72	—	Unverified
6	PromptSRC	Harmonic mean	76.58	—	Unverified
7	CoPrompt	Harmonic mean	75.66	—	Unverified
8	HPT++	Harmonic mean	75.59	—	Unverified
9	HPT	Harmonic mean	75.57	—	Unverified
10	MetaPrompt	Harmonic mean	75.48	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	82.6	—	Unverified
2	CoPrompt	Harmonic mean	81.31	—	Unverified
3	MMRL++	Harmonic mean	81.28	—	Unverified
4	MMRL	Harmonic mean	81.2	—	Unverified
5	HPT++	Harmonic mean	81.11	—	Unverified
6	DePT	Harmonic mean	81.06	—	Unverified
7	HPT	Harmonic mean	80.88	—	Unverified
8	ProMetaR	Harmonic mean	80.82	—	Unverified
9	MetaPrompt	Harmonic mean	80.62	—	Unverified
10	PromptSRC	Harmonic mean	80.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	86.1	—	Unverified
2	MMRL	Harmonic mean	83.89	—	Unverified
3	HPT++	Harmonic mean	83.81	—	Unverified
4	MMRL++	Harmonic mean	83.81	—	Unverified
5	ProMetaR	Harmonic mean	83.25	—	Unverified
6	HPT	Harmonic mean	83.16	—	Unverified
7	CoPrompt	Harmonic mean	83.07	—	Unverified
8	PromptSRC	Harmonic mean	82.74	—	Unverified
9	DePT	Harmonic mean	82.46	—	Unverified
10	MetaPrompt	Harmonic mean	81.35	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	93.05	—	Unverified
2	CoPrompt	Harmonic mean	91.4	—	Unverified
3	MaPLe	Harmonic mean	91.38	—	Unverified
4	ProMetaR	Harmonic mean	91.34	—	Unverified
5	MetaPrompt	Harmonic mean	91.29	—	Unverified
6	DePT	Harmonic mean	91.22	—	Unverified
7	MMRL++	Harmonic mean	91.1	—	Unverified
8	PromptSRC	Harmonic mean	91.1	—	Unverified
9	HPT++	Harmonic mean	91.09	—	Unverified
10	MMRL	Harmonic mean	91.03	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Top-1 accuracy %	51.6	—	Unverified
2	MMRL	Top-1 accuracy %	51.2	—	Unverified
3	HPT++	Top-1 accuracy %	51.18	—	Unverified
4	MaPLe	Top-1 accuracy %	50.9	—	Unverified
5	PromptSRC	Top-1 accuracy %	50.9	—	Unverified
6	HPT	Top-1 accuracy %	50.85	—	Unverified
7	CoCoOp	Top-1 accuracy %	50.63	—	Unverified
8	CoPrompt	Top-1 accuracy %	50.5	—	Unverified
9	CLIP	Top-1 accuracy %	47.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Top-1 accuracy %	77.9	—	Unverified
2	PromptSRC	Top-1 accuracy %	77.8	—	Unverified
3	MMRL	Top-1 accuracy %	77.53	—	Unverified
4	HPT++	Top-1 accuracy %	77.52	—	Unverified
5	CoPrompt	Top-1 accuracy %	77.51	—	Unverified
6	HPT	Top-1 accuracy %	77.38	—	Unverified
7	MaPLe	Top-1 accuracy %	76.98	—	Unverified
8	CoCoOP	Top-1 accuracy %	76.18	—	Unverified
9	CLIP	Top-1 accuracy %	73.96	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Top-1 accuracy %	49.8	—	Unverified
2	PromptSRC	Top-1 accuracy %	49.55	—	Unverified
3	CoPrompt	Top-1 accuracy %	49.43	—	Unverified
4	HPT	Top-1 accuracy %	49.36	—	Unverified
5	HPT++	Top-1 accuracy %	49.28	—	Unverified
6	MMRL	Top-1 accuracy %	49.17	—	Unverified
7	MaPLe	Top-1 accuracy %	49.15	—	Unverified
8	CoCoOp	Top-1 accuracy %	48.75	—	Unverified
9	CLIP	Top-1 accuracy %	46.15	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	HPT++	Top-1 accuracy %	65.31	—	Unverified
2	HPT	Top-1 accuracy %	65.25	—	Unverified
3	MMRL	Top-1 accuracy %	64.47	—	Unverified
4	PromptSRC	Top-1 accuracy %	64.35	—	Unverified
5	CoCoOp	Top-1 accuracy %	64.07	—	Unverified
6	MaPLe	Top-1 accuracy %	64.07	—	Unverified
7	POMP	Top-1 accuracy %	63.8	—	Unverified
8	CLIP	Top-1 accuracy %	60.83	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Accuracy	25.3	—	Unverified
2	VPT	Accuracy	24.8	—	Unverified