Prompt Engineering

Prompt engineering is the process of designing and refining the prompts used to generate text from language models, such as GPT-3 or similar models. The goal of prompt engineering is to improve the quality and relevance of the generated text by carefully crafting the prompts to elicit the desired responses from the model.

Prompt engineering involves several steps, including selecting the appropriate model architecture and parameters, designing the prompt format and structure, selecting the appropriate task and training data, and fine-tuning the model using the selected prompt and data.

Prompt engineering is a crucial step in the development of language models, as it can greatly influence the quality and effectiveness of the model's responses. By carefully designing and refining the prompts used to generate text, researchers and developers can improve the accuracy and relevance of the model's output, making it more useful for a wide range of applications, including chatbots, language translation, content creation, and more.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 201–250 of 1236 papers

Title	Date	Tasks	Status	Hype
Evaluation of the Automated Labeling Method for Taxonomic Nomenclature Through Prompt-Optimized Large Language Model	Mar 8, 2025	Few-Shot LearningLanguage Modeling	—Unverified	0
LimTopic: LLM-based Topic Modeling and Text Summarization for Analyzing Scientific Articles limitations	Mar 8, 2025	ArticlesPrompt Engineering	CodeCode Available	0
Generation of Optimized Solidity Code for Machine Learning Models using LLMs	Mar 8, 2025	Code TranslationPrompt Engineering	—Unverified	0
Jailbreaking is (Mostly) Simpler Than You Think	Mar 7, 2025	Prompt Engineering	—Unverified	0
Cognitive Bias Detection Using Advanced Prompt Engineering	Mar 7, 2025	Bias DetectionDecision Making	—Unverified	0
ToolFuzz -- Automated Agent Tool Testing	Mar 6, 2025	Large Language ModelPrompt Engineering	—Unverified	0
InterChat: Enhancing Generative Visual Analytics using Multimodal Interactions	Mar 6, 2025	Prompt Engineering	—Unverified	0
Can Frontier LLMs Replace Annotators in Biomedical Text Mining? Analyzing Challenges and Exploring Solutions	Mar 5, 2025	In-Context LearningPrompt Engineering	CodeCode Available	0
Self-Evolved Preference Optimization for Enhancing Mathematical Reasoning in Small Language Models	Mar 4, 2025	GSM8KMath	—Unverified	0
Text2Scenario: Text-Driven Scenario Generation for Autonomous Driving Test	Mar 4, 2025	Autonomous DrivingDescriptive	—Unverified	0
Bandit-Based Prompt Design Strategy Selection Improves Prompt Optimizers	Mar 3, 2025	Prompt EngineeringThompson Sampling	CodeCode Available	0
Language-agnostic, automated assessment of listeners' speech recall using large language models	Mar 2, 2025	Prompt EngineeringSemantic Similarity	—Unverified	0
NutriGen: Personalized Meal Plan Generator Leveraging Large Language Models to Enhance Dietary and Nutritional Adherence	Feb 28, 2025	NutritionPrompt Engineering	CodeCode Available	0
Static Vs. Agentic Game Master AI for Facilitating Solo Role-Playing Experiences	Feb 26, 2025	Prompt Engineering	—Unverified	0
Automatic Prompt Optimization via Heuristic Search: A Survey	Feb 26, 2025	Heuristic SearchPrompt Engineering	—Unverified	0
Can Large Language Models Extract Customer Needs as well as Professional Analysts?	Feb 25, 2025	MarketingPrompt Engineering	—Unverified	0
Representation Engineering for Large-Language Models: Survey and Research Challenges	Feb 24, 2025	Prompt EngineeringSurvey	—Unverified	0
Language Model Fine-Tuning on Scaled Survey Data for Predicting Distributions of Public Opinions	Feb 24, 2025	Language ModelingLanguage Modelling	CodeCode Available	1
A Systematic Survey of Automatic Prompt Optimization Techniques	Feb 24, 2025	Prompt EngineeringSurvey	—Unverified	0
Code Summarization Beyond Function Level	Feb 23, 2025	Code SummarizationFew-Shot Learning	CodeCode Available	1
Can Large Vision-Language Models Detect Images Copyright Infringement from GenAI?	Feb 23, 2025	Prompt Engineering	—Unverified	0
Navigation-GPT: A Robust and Adaptive Framework Utilizing Large Language Models for Navigation Applications	Feb 23, 2025	Collision AvoidanceLarge Language Model	—Unverified	0
Chats-Grid: An Iterative Retrieval Q&A Optimization Scheme Leveraging Large Model and Retrieval Enhancement Generation in smart grid	Feb 21, 2025	Large Language ModelPrompt Engineering	—Unverified	0
Control Illusion: The Failure of Instruction Hierarchies in Large Language Models	Feb 21, 2025	Prompt Engineering	CodeCode Available	0
AutoMedPrompt: A New Framework for Optimizing LLM Medical Prompts Using Textual Gradients	Feb 21, 2025	MedQAPrompt Engineering	—Unverified	0
Automated Query-Product Relevance Labeling using Large Language Models for E-commerce Search	Feb 21, 2025	In-Context LearningInformation Retrieval	—Unverified	0
From Knowledge Generation to Knowledge Verification: Examining the BioMedical Generative Capabilities of ChatGPT	Feb 20, 2025	Prompt Engineering	—Unverified	0
Effects of Prompt Length on Domain-specific Tasks for Large Language Models	Feb 20, 2025	Machine TranslationPrompt Engineering	—Unverified	0
Can LLMs Predict Citation Intent? An Experimental Analysis of In-context Learning and Fine-tuning on Open LLMs	Feb 20, 2025	ARCIn-Context Learning	CodeCode Available	0
QUAD-LLM-MLTC: Large Language Models Ensemble Learning for Healthcare Text Multi-Label Classification	Feb 20, 2025	Computational EfficiencyEnsemble Learning	—Unverified	0
Prompting a Weighting Mechanism into LLM-as-a-Judge in Two-Step: A Case Study	Feb 19, 2025	Prompt EngineeringText Generation	—Unverified	0
Navigating Semantic Relations: Challenges for Language Models in Abstract Common-Sense Reasoning	Feb 19, 2025	Common Sense ReasoningMathematical Problem-Solving	—Unverified	0
Personalized Education with Generative AI and Digital Twins: VR, RAG, and Zero-Shot Sentiment Analysis for Industry 4.0 Workforce Development	Feb 19, 2025	Cloud ComputingPrompt Engineering	—Unverified	0
UM_FHS at TREC 2024 PLABA: Exploration of Fine-tuning and AI agent approach for plain language adaptations of biomedical text	Feb 19, 2025	AI AgentPrompt Engineering	—Unverified	0
RAG-Gym: Optimizing Reasoning and Search Agents with Process Supervision	Feb 19, 2025	Prompt EngineeringRAG	—Unverified	0
Exploiting Prefix-Tree in Structured Output Interfaces for Enhancing Jailbreak Attacking	Feb 19, 2025	Prompt EngineeringSafety Alignment	CodeCode Available	0
Testing Prompt Engineering Methods for Knowledge Extraction from Text	Feb 18, 2025	Open Information ExtractionPrompt Engineering	CodeCode Available	0
EDGE: Efficient Data Selection for LLM Agents via Guideline Effectiveness	Feb 18, 2025	Prompt Engineering	—Unverified	0
Exploring Large Language Models in Healthcare: Insights into Corpora Sources, Customization Strategies, and Evaluation Metrics	Feb 17, 2025	ArticlesFairness	—Unverified	0
A Survey of Automatic Prompt Engineering: An Optimization Perspective	Feb 17, 2025	cross-modal alignmentPrompt Engineering	—Unverified	0
ADO: Automatic Data Optimization for Inputs in LLM Prompts	Feb 17, 2025	Missing ValuesPrompt Engineering	—Unverified	0
UnitCoder: Scalable Iterative Code Synthesis with Unit Test Guidance	Feb 17, 2025	Code GenerationHumanEval	—Unverified	0
Intelligent Mobile AI-Generated Content Services via Interactive Prompt Engineering and Dynamic Service Provisioning	Feb 17, 2025	Deep Reinforcement LearningLarge Language Model	—Unverified	0
Prompting in the Dark: Assessing Human Performance in Prompt Engineering for Data Labeling When Gold Labels Are Absent	Feb 16, 2025	Prompt Engineering	—Unverified	0
PCGRLLM: Large Language Model-Driven Reward Design for Procedural Content Generation Reinforcement Learning	Feb 15, 2025	Language ModelingLanguage Modelling	—Unverified	0
Evaluating improvements on using Large Language Models (LLMs) for property extraction in the Open Research Knowledge Graph (ORKG)	Feb 15, 2025	Knowledge GraphsPrompt Engineering	CodeCode Available	0
The Ann Arbor Architecture for Agent-Oriented Programming	Feb 14, 2025	In-Context LearningPrompt Engineering	CodeCode Available	0
Has My System Prompt Been Used? Large Language Model Prompt Membership Inference	Feb 14, 2025	Language ModelingLanguage Modelling	—Unverified	0
Optimizing GPT for Video Understanding: Zero-Shot Performance and Prompt Engineering	Feb 13, 2025	ClassificationPrompt Engineering	—Unverified	0
Proceedings 40th International Conference on Logic Programming	Feb 11, 2025	Inductive logic programmingProbabilistic Programming	—Unverified	0

Show:10 25 50

← PrevPage 5 of 25Next →

All datasets ImageNet Caltech-101 DTD EuroSAT FGVC-Aircraft Oxford 102 Flower Oxford-IIIT Pet Dataset Stanford Cars SUN397 UCF101 Food-101 ImageNet-A

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	77.62	—	Unverified
2	Customized Ensemble	Harmonic mean	75.49	—	Unverified
3	MMRL	Harmonic mean	74.45	—	Unverified
4	MMRL++	Harmonic mean	74.44	—	Unverified
5	CoPrompt	Harmonic mean	74.33	—	Unverified
6	HPT++	Harmonic mean	74.24	—	Unverified
7	HPT	Harmonic mean	74.17	—	Unverified
8	ProMetaR	Harmonic mean	74.09	—	Unverified
9	MetaPrompt	Harmonic mean	74.02	—	Unverified
10	DePT	Harmonic mean	74.02	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	97.77	—	Unverified
2	HPT++	Harmonic mean	96.96	—	Unverified
3	MMRL++	Harmonic mean	96.75	—	Unverified
4	MMRL	Harmonic mean	96.68	—	Unverified
5	HPT	Harmonic mean	96.65	—	Unverified
6	CoPrompt	Harmonic mean	96.55	—	Unverified
7	MetaPrompt	Harmonic mean	96.32	—	Unverified
8	DePT	Harmonic mean	96.28	—	Unverified
9	ProMetaR	Harmonic mean	96.16	—	Unverified
10	RPO	Harmonic mean	96.03	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	77.94	—	Unverified
2	MMRL++	Harmonic mean	74.46	—	Unverified
3	HPT++	Harmonic mean	74.23	—	Unverified
4	MMRL	Harmonic mean	73.82	—	Unverified
5	CoPrompt	Harmonic mean	72.79	—	Unverified
6	ProMetaR	Harmonic mean	72.31	—	Unverified
7	HPT	Harmonic mean	72.16	—	Unverified
8	PromptSRC	Harmonic mean	71.75	—	Unverified
9	DePT	Harmonic mean	71.09	—	Unverified
10	RPO	Harmonic mean	68.61	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MMRL++	Harmonic mean	91.94	—	Unverified
2	PromptKD	Harmonic mean	89.14	—	Unverified
3	HPT++	Harmonic mean	87.36	—	Unverified
4	MMRL	Harmonic mean	87.21	—	Unverified
5	CoPrompt	Harmonic mean	85.84	—	Unverified
6	ProMetaR	Harmonic mean	85.3	—	Unverified
7	DePT	Harmonic mean	84.88	—	Unverified
8	HPT	Harmonic mean	84.82	—	Unverified
9	MetaPrompt	Harmonic mean	83.38	—	Unverified
10	MaPLe	Harmonic mean	82.35	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	45.17	—	Unverified
2	MMRL++	Harmonic mean	42.24	—	Unverified
3	HPT++	Harmonic mean	41.33	—	Unverified
4	MMRL	Harmonic mean	41.15	—	Unverified
5	DePT	Harmonic mean	40.73	—	Unverified
6	HPT	Harmonic mean	40.28	—	Unverified
7	ProMetaR	Harmonic mean	40.25	—	Unverified
8	PromptSRC	Harmonic mean	40.15	—	Unverified
9	CoPrompt	Harmonic mean	39.76	—	Unverified
10	MetaPrompt	Harmonic mean	38.24	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	90.24	—	Unverified
2	HPT	Harmonic mean	87.16	—	Unverified
3	MMRL++	Harmonic mean	87.01	—	Unverified
4	MMRL	Harmonic mean	86.78	—	Unverified
5	ProMetaR	Harmonic mean	86.7	—	Unverified
6	DePT	Harmonic mean	86.46	—	Unverified
7	PromptSRC	Harmonic mean	85.95	—	Unverified
8	HPT++	Harmonic mean	85.85	—	Unverified
9	CoPrompt	Harmonic mean	85.71	—	Unverified
10	MetaPrompt	Harmonic mean	84.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	97.15	—	Unverified
2	HPT++	Harmonic mean	96.91	—	Unverified
3	CoPrompt	Harmonic mean	96.87	—	Unverified
4	MMRL	Harmonic mean	96.74	—	Unverified
5	HPT	Harmonic mean	96.71	—	Unverified
6	MaPLe	Harmonic mean	96.58	—	Unverified
7	MMRL++	Harmonic mean	96.51	—	Unverified
8	ProMetaR	Harmonic mean	96.49	—	Unverified
9	CoCoOp	Harmonic mean	96.43	—	Unverified
10	DePT	Harmonic mean	96.37	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	83.13	—	Unverified
2	MMRL++	Harmonic mean	78.18	—	Unverified
3	MMRL	Harmonic mean	78.06	—	Unverified
4	DePT	Harmonic mean	77.79	—	Unverified
5	ProMetaR	Harmonic mean	76.72	—	Unverified
6	PromptSRC	Harmonic mean	76.58	—	Unverified
7	CoPrompt	Harmonic mean	75.66	—	Unverified
8	HPT++	Harmonic mean	75.59	—	Unverified
9	HPT	Harmonic mean	75.57	—	Unverified
10	MetaPrompt	Harmonic mean	75.48	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	82.6	—	Unverified
2	CoPrompt	Harmonic mean	81.31	—	Unverified
3	MMRL++	Harmonic mean	81.28	—	Unverified
4	MMRL	Harmonic mean	81.2	—	Unverified
5	HPT++	Harmonic mean	81.11	—	Unverified
6	DePT	Harmonic mean	81.06	—	Unverified
7	HPT	Harmonic mean	80.88	—	Unverified
8	ProMetaR	Harmonic mean	80.82	—	Unverified
9	MetaPrompt	Harmonic mean	80.62	—	Unverified
10	PromptSRC	Harmonic mean	80.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	86.1	—	Unverified
2	MMRL	Harmonic mean	83.89	—	Unverified
3	HPT++	Harmonic mean	83.81	—	Unverified
4	MMRL++	Harmonic mean	83.81	—	Unverified
5	ProMetaR	Harmonic mean	83.25	—	Unverified
6	HPT	Harmonic mean	83.16	—	Unverified
7	CoPrompt	Harmonic mean	83.07	—	Unverified
8	PromptSRC	Harmonic mean	82.74	—	Unverified
9	DePT	Harmonic mean	82.46	—	Unverified
10	MetaPrompt	Harmonic mean	81.35	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	93.05	—	Unverified
2	CoPrompt	Harmonic mean	91.4	—	Unverified
3	MaPLe	Harmonic mean	91.38	—	Unverified
4	ProMetaR	Harmonic mean	91.34	—	Unverified
5	MetaPrompt	Harmonic mean	91.29	—	Unverified
6	DePT	Harmonic mean	91.22	—	Unverified
7	MMRL++	Harmonic mean	91.1	—	Unverified
8	PromptSRC	Harmonic mean	91.1	—	Unverified
9	HPT++	Harmonic mean	91.09	—	Unverified
10	MMRL	Harmonic mean	91.03	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Top-1 accuracy %	51.6	—	Unverified
2	MMRL	Top-1 accuracy %	51.2	—	Unverified
3	HPT++	Top-1 accuracy %	51.18	—	Unverified
4	MaPLe	Top-1 accuracy %	50.9	—	Unverified
5	PromptSRC	Top-1 accuracy %	50.9	—	Unverified
6	HPT	Top-1 accuracy %	50.85	—	Unverified
7	CoCoOp	Top-1 accuracy %	50.63	—	Unverified
8	CoPrompt	Top-1 accuracy %	50.5	—	Unverified
9	CLIP	Top-1 accuracy %	47.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Top-1 accuracy %	77.9	—	Unverified
2	PromptSRC	Top-1 accuracy %	77.8	—	Unverified
3	MMRL	Top-1 accuracy %	77.53	—	Unverified
4	HPT++	Top-1 accuracy %	77.52	—	Unverified
5	CoPrompt	Top-1 accuracy %	77.51	—	Unverified
6	HPT	Top-1 accuracy %	77.38	—	Unverified
7	MaPLe	Top-1 accuracy %	76.98	—	Unverified
8	CoCoOP	Top-1 accuracy %	76.18	—	Unverified
9	CLIP	Top-1 accuracy %	73.96	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Top-1 accuracy %	49.8	—	Unverified
2	PromptSRC	Top-1 accuracy %	49.55	—	Unverified
3	CoPrompt	Top-1 accuracy %	49.43	—	Unverified
4	HPT	Top-1 accuracy %	49.36	—	Unverified
5	HPT++	Top-1 accuracy %	49.28	—	Unverified
6	MMRL	Top-1 accuracy %	49.17	—	Unverified
7	MaPLe	Top-1 accuracy %	49.15	—	Unverified
8	CoCoOp	Top-1 accuracy %	48.75	—	Unverified
9	CLIP	Top-1 accuracy %	46.15	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	HPT++	Top-1 accuracy %	65.31	—	Unverified
2	HPT	Top-1 accuracy %	65.25	—	Unverified
3	MMRL	Top-1 accuracy %	64.47	—	Unverified
4	PromptSRC	Top-1 accuracy %	64.35	—	Unverified
5	CoCoOp	Top-1 accuracy %	64.07	—	Unverified
6	MaPLe	Top-1 accuracy %	64.07	—	Unverified
7	POMP	Top-1 accuracy %	63.8	—	Unverified
8	CLIP	Top-1 accuracy %	60.83	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Accuracy	25.3	—	Unverified
2	VPT	Accuracy	24.8	—	Unverified