Prompt Engineering

Prompt engineering is the process of designing and refining the prompts used to generate text from language models, such as GPT-3 or similar models. The goal of prompt engineering is to improve the quality and relevance of the generated text by carefully crafting the prompts to elicit the desired responses from the model.

Prompt engineering involves several steps, including selecting the appropriate model architecture and parameters, designing the prompt format and structure, selecting the appropriate task and training data, and fine-tuning the model using the selected prompt and data.

Prompt engineering is a crucial step in the development of language models, as it can greatly influence the quality and effectiveness of the model's responses. By carefully designing and refining the prompts used to generate text, researchers and developers can improve the accuracy and relevance of the model's output, making it more useful for a wide range of applications, including chatbots, language translation, content creation, and more.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 551–600 of 1236 papers

Title	Date	Tasks	Status	Hype
Conversational Prompt Engineering	Aug 8, 2024	Prompt Engineering	—Unverified	0
Exploring the extent of similarities in software failures across industries using LLMs	Aug 7, 2024	ArticlesData Visualization	—Unverified	0
Generative Language Models with Retrieval Augmented Generation for Automated Short Answer Scoring	Aug 7, 2024	Prompt EngineeringRetrieval	—Unverified	0
Large Language Model as a Catalyst: A Paradigm Shift in Base Station Siting Optimization	Aug 7, 2024	Language ModelingLanguage Modelling	—Unverified	0
Accuracy and Consistency of LLMs in the Registered Dietitian Exam: The Impact of Prompt Engineering and Knowledge Retrieval	Aug 6, 2024	NutritionPrompt Engineering	CodeCode Available	0
Leveraging Large Language Models with Chain-of-Thought and Prompt Engineering for Traffic Crash Severity Analysis and Inference	Aug 4, 2024	Logical ReasoningPrompt Engineering	—Unverified	0
Evaluating the Impact of Advanced LLM Techniques on AI-Lecture Tutors for a Robotics Course	Aug 2, 2024	Prompt EngineeringRAG	—Unverified	0
Improving Retrieval-Augmented Generation in Medicine with Iterative Follow-up Questions	Aug 1, 2024	Medical Question AnsweringMedQA	CodeCode Available	4
Recording First-person Experiences to Build a New Type of Foundation Model	Jul 31, 2024	EEGPrompt Engineering	—Unverified	0
A New Type of Foundation Model Based on Recordings of People's Emotions and Physiology	Jul 31, 2024	Prompt EngineeringRAG	—Unverified	0
KemenkeuGPT: Leveraging a Large Language Model on Indonesia's Government Financial Data and Regulations to Enhance Decision Making	Jul 31, 2024	BenchmarkingDecision Making	—Unverified	0
Effects of a Prompt Engineering Intervention on Undergraduate Students' AI Self-Efficacy, AI Knowledge and Prompt Engineering Ability: A Mixed Methods Study	Jul 30, 2024	Prompt Engineering	—Unverified	0
Affective Computing in the Era of Large Language Models: A Survey from the NLP Perspective	Jul 30, 2024	Common Sense ReasoningIn-Context Learning	—Unverified	0
Enhancing Agricultural Machinery Management through Advanced LLM Integration	Jul 30, 2024	Decision MakingManagement	—Unverified	0
TopicTag: Automatic Annotation of NMF Topic Models Using Chain of Thought and Prompt Tuning with LLMs	Jul 29, 2024	Knowledge GraphsManagement	—Unverified	0
Concise Thoughts: Impact of Output Length on LLM Reasoning and Cost	Jul 29, 2024	GSM8KPrompt Engineering	—Unverified	0
Evaluating LLMs for Text-to-SQL Generation With Complex SQL Workload	Jul 28, 2024	Decision MakingPrompt Engineering	—Unverified	0
VersusDebias: Universal Zero-Shot Debiasing for Text-to-Image Models via SLM-Based Prompt Engineering and Generative Adversary	Jul 28, 2024	AttributeFairness	CodeCode Available	0
LocalValueBench: A Collaboratively Built and Extensible Benchmark for Evaluating Localized Value Alignment and Ethical Safety in Large Language Models	Jul 27, 2024	Prompt Engineering	—Unverified	0
Segmentation by registration-enabled SAM prompt engineering using five reference images	Jul 25, 2024	Image RegistrationImage Segmentation	CodeCode Available	0
ViPer: Visual Personalization of Generative Models via Individual Preference Learning	Jul 24, 2024	Image GenerationLanguage Modeling	—Unverified	0
LLMs can be Dangerous Reasoners: Analyzing-based Jailbreak Attack on Large Language Models	Jul 23, 2024	Multimodal ReasoningPrompt Engineering	CodeCode Available	1
Category-Extensible Out-of-Distribution Detection via Hierarchical Context Descriptions	Jul 23, 2024	Out-of-Distribution DetectionPrompt Engineering	CodeCode Available	0
LCA-on-the-Line: Benchmarking Out-of-Distribution Generalization with Class Taxonomies	Jul 22, 2024	BenchmarkingOut-of-Distribution Generalization	CodeCode Available	1
A Survey on Employing Large Language Models for Text-to-SQL Tasks	Jul 21, 2024	Natural Language QueriesPrompt Engineering	—Unverified	0
On the Design and Analysis of LLM-Based Algorithms	Jul 20, 2024	Prompt Engineering	CodeCode Available	0
A Survey of Prompt Engineering Methods in Large Language Models for Different NLP Tasks	Jul 17, 2024	Prompt Engineering	—Unverified	0
PersLLM: A Personified Training Approach for Large Language Models	Jul 17, 2024	Prompt EngineeringSpecificity	CodeCode Available	1
Educational Personalized Learning Path Planning with Large Language Models	Jul 16, 2024	Prompt Engineering	—Unverified	0
TokenSHAP: Interpreting Large Language Models with Monte Carlo Shapley Value Estimation	Jul 14, 2024	Computational EfficiencyPrompt Engineering	CodeCode Available	2
GRAD-SUM: Leveraging Gradient Summarization for Optimal Prompt Engineering	Jul 12, 2024	Prompt Engineering	—Unverified	0
LAPT: Label-driven Automated Prompt Tuning for OOD Detection with Vision-Language Models	Jul 12, 2024	Image GenerationOut of Distribution (OOD) Detection	CodeCode Available	1
Fault Diagnosis in Power Grids with Large Language Model	Jul 11, 2024	DiagnosticFault Diagnosis	—Unverified	0
Are Large Language Models Really Bias-Free? Jailbreak Prompts for Assessing Adversarial Robustness to Bias Elicitation	Jul 11, 2024	Adversarial RobustnessFairness	CodeCode Available	0
RB-SQL: A Retrieval-based LLM Framework for Text-to-SQL	Jul 11, 2024	In-Context LearningPrompt Engineering	—Unverified	0
Toward accessible comics for blind and low vision readers	Jul 11, 2024	Optical Character RecognitionPrompt Engineering	—Unverified	0
Leveraging LLMs to explain DRL decisions for transparent 6G network slicing	Jul 10, 2024	Decision MakingDeep Reinforcement Learning	—Unverified	0
Virtual Agents for Alcohol Use Counseling: Exploring LLM-Powered Motivational Interviewing	Jul 10, 2024	Large Language ModelPrompt Engineering	CodeCode Available	0
Using Pretrained Large Language Model with Prompt Engineering to Answer Biomedical Questions	Jul 9, 2024	ArticlesInformation Retrieval	—Unverified	0
PAS: Data-Efficient Plug-and-Play Prompt Augmentation System	Jul 8, 2024	Prompt Engineering	—Unverified	0
Using Grammar Masking to Ensure Syntactic Validity in LLM-based Modeling Tasks	Jul 8, 2024	Few-Shot LearningLanguage Modeling	—Unverified	0
VideoCoT: A Video Chain-of-Thought Dataset with Active Annotation Tool	Jul 7, 2024	Active LearningHallucination	—Unverified	0
Addressing single object tracking in satellite imagery through prompt-engineered solutions	Jul 7, 2024	ObjectObject Tracking	—Unverified	0
Enhancing Computer Programming Education with LLMs: A Study on Effective Prompt Engineering for Python Code Generation	Jul 7, 2024	Code GenerationPrompt Engineering	—Unverified	0
Achieving Tool Calling Functionality in LLMs Using Only Prompt Engineering Without Fine-Tuning	Jul 6, 2024	Prompt Engineering	—Unverified	0
Using LLMs to label medical papers according to the CIViC evidence model	Jul 5, 2024	Multi-Label ClassificationMUlTI-LABEL-ClASSIFICATION	CodeCode Available	0
Enabling On-Device LLMs Personalization with Smartphone Sensing	Jul 5, 2024	Prompt Engineering	—Unverified	0
MAPO: Boosting Large Language Model Performance with Model-Adaptive Prompt Optimization	Jul 4, 2024	Language ModelingLanguage Modelling	—Unverified	0
SemioLLM: Assessing Large Language Models for Semiological Analysis in Epilepsy Research	Jul 3, 2024	DiagnosticMedical Question Answering	—Unverified	0
LogEval: A Comprehensive Benchmark Suite for Large Language Models In Log Analysis	Jul 2, 2024	Anomaly DetectionFault Diagnosis	CodeCode Available	1

Show:10 25 50

← PrevPage 12 of 25Next →

All datasets ImageNet Caltech-101 DTD EuroSAT FGVC-Aircraft Oxford 102 Flower Oxford-IIIT Pet Dataset Stanford Cars SUN397 UCF101 Food-101 ImageNet-A

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	77.62	—	Unverified
2	Customized Ensemble	Harmonic mean	75.49	—	Unverified
3	MMRL	Harmonic mean	74.45	—	Unverified
4	MMRL++	Harmonic mean	74.44	—	Unverified
5	CoPrompt	Harmonic mean	74.33	—	Unverified
6	HPT++	Harmonic mean	74.24	—	Unverified
7	HPT	Harmonic mean	74.17	—	Unverified
8	ProMetaR	Harmonic mean	74.09	—	Unverified
9	MetaPrompt	Harmonic mean	74.02	—	Unverified
10	DePT	Harmonic mean	74.02	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	97.77	—	Unverified
2	HPT++	Harmonic mean	96.96	—	Unverified
3	MMRL++	Harmonic mean	96.75	—	Unverified
4	MMRL	Harmonic mean	96.68	—	Unverified
5	HPT	Harmonic mean	96.65	—	Unverified
6	CoPrompt	Harmonic mean	96.55	—	Unverified
7	MetaPrompt	Harmonic mean	96.32	—	Unverified
8	DePT	Harmonic mean	96.28	—	Unverified
9	ProMetaR	Harmonic mean	96.16	—	Unverified
10	RPO	Harmonic mean	96.03	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	77.94	—	Unverified
2	MMRL++	Harmonic mean	74.46	—	Unverified
3	HPT++	Harmonic mean	74.23	—	Unverified
4	MMRL	Harmonic mean	73.82	—	Unverified
5	CoPrompt	Harmonic mean	72.79	—	Unverified
6	ProMetaR	Harmonic mean	72.31	—	Unverified
7	HPT	Harmonic mean	72.16	—	Unverified
8	PromptSRC	Harmonic mean	71.75	—	Unverified
9	DePT	Harmonic mean	71.09	—	Unverified
10	RPO	Harmonic mean	68.61	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MMRL++	Harmonic mean	91.94	—	Unverified
2	PromptKD	Harmonic mean	89.14	—	Unverified
3	HPT++	Harmonic mean	87.36	—	Unverified
4	MMRL	Harmonic mean	87.21	—	Unverified
5	CoPrompt	Harmonic mean	85.84	—	Unverified
6	ProMetaR	Harmonic mean	85.3	—	Unverified
7	DePT	Harmonic mean	84.88	—	Unverified
8	HPT	Harmonic mean	84.82	—	Unverified
9	MetaPrompt	Harmonic mean	83.38	—	Unverified
10	MaPLe	Harmonic mean	82.35	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	45.17	—	Unverified
2	MMRL++	Harmonic mean	42.24	—	Unverified
3	HPT++	Harmonic mean	41.33	—	Unverified
4	MMRL	Harmonic mean	41.15	—	Unverified
5	DePT	Harmonic mean	40.73	—	Unverified
6	HPT	Harmonic mean	40.28	—	Unverified
7	ProMetaR	Harmonic mean	40.25	—	Unverified
8	PromptSRC	Harmonic mean	40.15	—	Unverified
9	CoPrompt	Harmonic mean	39.76	—	Unverified
10	MetaPrompt	Harmonic mean	38.24	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	90.24	—	Unverified
2	HPT	Harmonic mean	87.16	—	Unverified
3	MMRL++	Harmonic mean	87.01	—	Unverified
4	MMRL	Harmonic mean	86.78	—	Unverified
5	ProMetaR	Harmonic mean	86.7	—	Unverified
6	DePT	Harmonic mean	86.46	—	Unverified
7	PromptSRC	Harmonic mean	85.95	—	Unverified
8	HPT++	Harmonic mean	85.85	—	Unverified
9	CoPrompt	Harmonic mean	85.71	—	Unverified
10	MetaPrompt	Harmonic mean	84.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	97.15	—	Unverified
2	HPT++	Harmonic mean	96.91	—	Unverified
3	CoPrompt	Harmonic mean	96.87	—	Unverified
4	MMRL	Harmonic mean	96.74	—	Unverified
5	HPT	Harmonic mean	96.71	—	Unverified
6	MaPLe	Harmonic mean	96.58	—	Unverified
7	MMRL++	Harmonic mean	96.51	—	Unverified
8	ProMetaR	Harmonic mean	96.49	—	Unverified
9	CoCoOp	Harmonic mean	96.43	—	Unverified
10	DePT	Harmonic mean	96.37	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	83.13	—	Unverified
2	MMRL++	Harmonic mean	78.18	—	Unverified
3	MMRL	Harmonic mean	78.06	—	Unverified
4	DePT	Harmonic mean	77.79	—	Unverified
5	ProMetaR	Harmonic mean	76.72	—	Unverified
6	PromptSRC	Harmonic mean	76.58	—	Unverified
7	CoPrompt	Harmonic mean	75.66	—	Unverified
8	HPT++	Harmonic mean	75.59	—	Unverified
9	HPT	Harmonic mean	75.57	—	Unverified
10	MetaPrompt	Harmonic mean	75.48	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	82.6	—	Unverified
2	CoPrompt	Harmonic mean	81.31	—	Unverified
3	MMRL++	Harmonic mean	81.28	—	Unverified
4	MMRL	Harmonic mean	81.2	—	Unverified
5	HPT++	Harmonic mean	81.11	—	Unverified
6	DePT	Harmonic mean	81.06	—	Unverified
7	HPT	Harmonic mean	80.88	—	Unverified
8	ProMetaR	Harmonic mean	80.82	—	Unverified
9	MetaPrompt	Harmonic mean	80.62	—	Unverified
10	PromptSRC	Harmonic mean	80.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	86.1	—	Unverified
2	MMRL	Harmonic mean	83.89	—	Unverified
3	HPT++	Harmonic mean	83.81	—	Unverified
4	MMRL++	Harmonic mean	83.81	—	Unverified
5	ProMetaR	Harmonic mean	83.25	—	Unverified
6	HPT	Harmonic mean	83.16	—	Unverified
7	CoPrompt	Harmonic mean	83.07	—	Unverified
8	PromptSRC	Harmonic mean	82.74	—	Unverified
9	DePT	Harmonic mean	82.46	—	Unverified
10	MetaPrompt	Harmonic mean	81.35	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	93.05	—	Unverified
2	CoPrompt	Harmonic mean	91.4	—	Unverified
3	MaPLe	Harmonic mean	91.38	—	Unverified
4	ProMetaR	Harmonic mean	91.34	—	Unverified
5	MetaPrompt	Harmonic mean	91.29	—	Unverified
6	DePT	Harmonic mean	91.22	—	Unverified
7	PromptSRC	Harmonic mean	91.1	—	Unverified
8	MMRL++	Harmonic mean	91.1	—	Unverified
9	HPT++	Harmonic mean	91.09	—	Unverified
10	MMRL	Harmonic mean	91.03	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Top-1 accuracy %	51.6	—	Unverified
2	MMRL	Top-1 accuracy %	51.2	—	Unverified
3	HPT++	Top-1 accuracy %	51.18	—	Unverified
4	PromptSRC	Top-1 accuracy %	50.9	—	Unverified
5	MaPLe	Top-1 accuracy %	50.9	—	Unverified
6	HPT	Top-1 accuracy %	50.85	—	Unverified
7	CoCoOp	Top-1 accuracy %	50.63	—	Unverified
8	CoPrompt	Top-1 accuracy %	50.5	—	Unverified
9	CLIP	Top-1 accuracy %	47.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Top-1 accuracy %	77.9	—	Unverified
2	PromptSRC	Top-1 accuracy %	77.8	—	Unverified
3	MMRL	Top-1 accuracy %	77.53	—	Unverified
4	HPT++	Top-1 accuracy %	77.52	—	Unverified
5	CoPrompt	Top-1 accuracy %	77.51	—	Unverified
6	HPT	Top-1 accuracy %	77.38	—	Unverified
7	MaPLe	Top-1 accuracy %	76.98	—	Unverified
8	CoCoOP	Top-1 accuracy %	76.18	—	Unverified
9	CLIP	Top-1 accuracy %	73.96	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Top-1 accuracy %	49.8	—	Unverified
2	PromptSRC	Top-1 accuracy %	49.55	—	Unverified
3	CoPrompt	Top-1 accuracy %	49.43	—	Unverified
4	HPT	Top-1 accuracy %	49.36	—	Unverified
5	HPT++	Top-1 accuracy %	49.28	—	Unverified
6	MMRL	Top-1 accuracy %	49.17	—	Unverified
7	MaPLe	Top-1 accuracy %	49.15	—	Unverified
8	CoCoOp	Top-1 accuracy %	48.75	—	Unverified
9	CLIP	Top-1 accuracy %	46.15	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	HPT++	Top-1 accuracy %	65.31	—	Unverified
2	HPT	Top-1 accuracy %	65.25	—	Unverified
3	MMRL	Top-1 accuracy %	64.47	—	Unverified
4	PromptSRC	Top-1 accuracy %	64.35	—	Unverified
5	CoCoOp	Top-1 accuracy %	64.07	—	Unverified
6	MaPLe	Top-1 accuracy %	64.07	—	Unverified
7	POMP	Top-1 accuracy %	63.8	—	Unverified
8	CLIP	Top-1 accuracy %	60.83	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Accuracy	25.3	—	Unverified
2	VPT	Accuracy	24.8	—	Unverified