Prompt Engineering

Prompt engineering is the process of designing and refining the prompts used to generate text from language models, such as GPT-3 or similar models. The goal of prompt engineering is to improve the quality and relevance of the generated text by carefully crafting the prompts to elicit the desired responses from the model.

Prompt engineering involves several steps, including selecting the appropriate model architecture and parameters, designing the prompt format and structure, selecting the appropriate task and training data, and fine-tuning the model using the selected prompt and data.

Prompt engineering is a crucial step in the development of language models, as it can greatly influence the quality and effectiveness of the model's responses. By carefully designing and refining the prompts used to generate text, researchers and developers can improve the accuracy and relevance of the model's output, making it more useful for a wide range of applications, including chatbots, language translation, content creation, and more.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1101–1150 of 1236 papers

Title	Date	Tasks	Status	Hype
CONA: A novel CONtext-Aware instruction paradigm for communication using large language model	May 26, 2023	Language ModelingLanguage Modelling	—Unverified	0
Submodular Minimax Optimization: Finding Effective Sets	May 26, 2023	dialog state trackingPrompt Engineering	—Unverified	0
Prompt-Free Diffusion: Taking "Text" out of Text-to-Image Diffusion Models	May 25, 2023	Conditional Text-to-Image SynthesisImage Generation	CodeCode Available	2
Improving Probability-based Prompt Selection Through Unified Evaluation and Analysis	May 24, 2023	Prompt Engineering	CodeCode Available	1
Do prompt positions really matter?	May 23, 2023	Few-Shot LearningNatural Language Understanding	CodeCode Available	0
VisorGPT: Learning Visual Prior via Generative Pre-Training	May 23, 2023	Image GenerationLanguage Modeling	CodeCode Available	1
Jailbreaking ChatGPT via Prompt Engineering: An Empirical Study	May 23, 2023	Prompt Engineering	CodeCode Available	1
Small Language Models Improve Giants by Rewriting Their Outputs	May 22, 2023	Few-Shot LearningIn-Context Learning	CodeCode Available	1
Iterative Forward Tuning Boosts In-Context Learning in Language Models	May 22, 2023	Decision MakingIn-Context Learning	CodeCode Available	0
Interactive Data Synthesis for Systematic Vision Adaptation via LLMs-AIGCs Collaboration	May 22, 2023	Data AugmentationImage Generation	CodeCode Available	1
Making Language Models Better Tool Learners with Execution Feedback	May 22, 2023	Language ModelingLanguage Modelling	CodeCode Available	1
Constructing Dreams using Generative AI	May 19, 2023	Image GenerationPrompt Engineering	—Unverified	0
Federated Foundation Models: Privacy-Preserving and Collaborative Learning for Large Models	May 19, 2023	Federated LearningLifelong learning	—Unverified	0
Prompting the Hidden Talent of Web-Scale Speech Models for Zero-Shot Task Generalization	May 18, 2023	Audio-Visual Speech RecognitionPrompt Engineering	CodeCode Available	1
Prompt Engineering for Transformer-based Chemical Similarity Search Identifies Structurally Distinct Functional Analogues	May 17, 2023	Language ModelingLanguage Modelling	CodeCode Available	0
Knowledge Graph Completion Models are Few-shot Learners: An Empirical Study of Relation Labeling in E-commerce with LLMs	May 17, 2023	Knowledge Graph CompletionKnowledge Graphs	—Unverified	0
Sensitivity and Robustness of Large Language Models to Prompt Template in Japanese Text Classification Tasks	May 15, 2023	Prompt EngineeringSensitivity	—Unverified	0
A Survey on Segment Anything Model (SAM): Vision Foundation Model Meets Prompt Engineering	May 12, 2023	Edge Detectionmodel	—Unverified	0
Text2Cohort: Facilitating Intuitive Access to Biomedical Data with Natural Language Cohort Discovery	May 12, 2023	Language ModellingLarge Language Model	CodeCode Available	0
Spear Phishing With Large Language Models	May 11, 2023	Prompt Engineering	—Unverified	0
Refining the Responses of LLMs by Themselves	May 6, 2023	Language ModelingLanguage Modelling	CodeCode Available	0
Simulating H.P. Lovecraft horror literature with the ChatGPT large language model	May 5, 2023	Language ModelingLanguage Modelling	—Unverified	0
ChatGPT Evaluation on Sentence Level Relations: A Focus on Temporal, Causal, and Discourse Relations	Apr 28, 2023	Discourse ParsingIn-Context Learning	—Unverified	0
Prompt Engineering for Healthcare: Methodologies and Applications	Apr 28, 2023	Machine TranslationPrompt Engineering	—Unverified	0
Framing the News:From Human Perception to Large Language Model Inferences	Apr 27, 2023	ArticlesLanguage Modeling	—Unverified	0
Evaluation of GPT-3.5 and GPT-4 for supporting real-world information needs in healthcare delivery	Apr 26, 2023	Prompt Engineering	—Unverified	0
Is ChatGPT the Ultimate Programming Assistant -- How far is it?	Apr 24, 2023	Code GenerationCode Summarization	—Unverified	0
Inducing anxiety in large language models can induce bias	Apr 21, 2023	Decision MakingPrompt Engineering	—Unverified	0
Low-code LLM: Graphical User Interface over Large Language Models	Apr 17, 2023	Prompt Engineering	CodeCode Available	7
Enhancing Automated Program Repair through Fine-tuning and Prompt Engineering	Apr 16, 2023	Program RepairPrompt Engineering	—Unverified	0
Just Tell Me: Prompt Engineering in Business Process Management	Apr 14, 2023	Machine TranslationManagement	—Unverified	0
Prompt Engineering and Calibration for Zero-Shot Commonsense Reasoning	Apr 14, 2023	Multiple-choicePrompt Engineering	—Unverified	0
Automatic Semantic Augmentation of Language Model Prompts (for Code Summarization)	Apr 13, 2023	Code SummarizationInformation Retrieval	—Unverified	0
What does CLIP know about a red circle? Visual prompt engineering for VLMs	Apr 13, 2023	Image GenerationPrompt Engineering	—Unverified	0
Towards Interpretable Mental Health Analysis with Large Language Models	Apr 6, 2023	Causal Emotion EntailmentEmotion Recognition	CodeCode Available	2
TagGPT: Large Language Models are Zero-shot Multimodal Taggers	Apr 6, 2023	Optical Character Recognition (OCR)Prompt Engineering	CodeCode Available	1
Evaluation of ChatGPT Family of Models for Biomedical Reasoning and Classification	Apr 5, 2023	domain classificationPrompt Engineering	CodeCode Available	1
Geotechnical Parrot Tales (GPT): Harnessing Large Language Models in geotechnical engineering	Apr 4, 2023	Prompt Engineering	—Unverified	0
Safety Analysis in the Era of Large Language Models: A Case Study of STPA using ChatGPT	Apr 3, 2023	ManagementPrompt Engineering	CodeCode Available	0
Pair Programming with Large Language Models for Sampling and Estimation of Copulas	Mar 31, 2023	Language ModellingLarge Language Model	—Unverified	0
Humans in Humans Out: On GPT Converging Toward Common Sense in both Success and Failure	Mar 30, 2023	Common Sense ReasoningDecision Making	—Unverified	0
Ten Quick Tips for Harnessing the Power of ChatGPT/GPT-4 in Computational Biology	Mar 29, 2023	ChatbotPrompt Engineering	CodeCode Available	2
Improving Large Language Models for Clinical Named Entity Recognition via Prompt Engineering	Mar 29, 2023	Few-Shot LearningLanguage Modelling	CodeCode Available	1
On Codex Prompt Engineering for OCL Generation: An Empirical Study	Mar 28, 2023	Few-Shot LearningPrompt Engineering	—Unverified	0
ChatGPT4PCG Competition: Character-like Level Generation for Science Birds	Mar 28, 2023	Prompt Engineering	CodeCode Available	0
Unlocking the Potential of ChatGPT: A Comprehensive Exploration of its Applications, Advantages, Limitations, and Future Directions in Natural Language Processing	Mar 27, 2023	Medical DiagnosisPrompt Engineering	—Unverified	0
Patch-Prompt Aligned Bayesian Prompt Tuning for Vision-Language Models	Mar 16, 2023	Prompt EngineeringTransfer Learning	—Unverified	0
UPRISE: Universal Prompt Retrieval for Improving Zero-Shot Evaluation	Mar 15, 2023	HallucinationPrompt Engineering	—Unverified	0
Large Language Models in the Workplace: A Case Study on Prompt Engineering for Job Type Classification	Mar 13, 2023	Job classificationPrompt Engineering	—Unverified	0
Extracting Accurate Materials Data from Research Papers with Conversational Language Models and Prompt Engineering	Mar 7, 2023	Prompt Engineering	—Unverified	0

Show:10 25 50

← PrevPage 23 of 25Next →

All datasets ImageNet Caltech-101 DTD EuroSAT FGVC-Aircraft Oxford 102 Flower Oxford-IIIT Pet Dataset Stanford Cars SUN397 UCF101 Food-101 ImageNet-A

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	77.62	—	Unverified
2	Customized Ensemble	Harmonic mean	75.49	—	Unverified
3	MMRL	Harmonic mean	74.45	—	Unverified
4	MMRL++	Harmonic mean	74.44	—	Unverified
5	CoPrompt	Harmonic mean	74.33	—	Unverified
6	HPT++	Harmonic mean	74.24	—	Unverified
7	HPT	Harmonic mean	74.17	—	Unverified
8	ProMetaR	Harmonic mean	74.09	—	Unverified
9	MetaPrompt	Harmonic mean	74.02	—	Unverified
10	DePT	Harmonic mean	74.02	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	97.77	—	Unverified
2	HPT++	Harmonic mean	96.96	—	Unverified
3	MMRL++	Harmonic mean	96.75	—	Unverified
4	MMRL	Harmonic mean	96.68	—	Unverified
5	HPT	Harmonic mean	96.65	—	Unverified
6	CoPrompt	Harmonic mean	96.55	—	Unverified
7	MetaPrompt	Harmonic mean	96.32	—	Unverified
8	DePT	Harmonic mean	96.28	—	Unverified
9	ProMetaR	Harmonic mean	96.16	—	Unverified
10	RPO	Harmonic mean	96.03	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	77.94	—	Unverified
2	MMRL++	Harmonic mean	74.46	—	Unverified
3	HPT++	Harmonic mean	74.23	—	Unverified
4	MMRL	Harmonic mean	73.82	—	Unverified
5	CoPrompt	Harmonic mean	72.79	—	Unverified
6	ProMetaR	Harmonic mean	72.31	—	Unverified
7	HPT	Harmonic mean	72.16	—	Unverified
8	PromptSRC	Harmonic mean	71.75	—	Unverified
9	DePT	Harmonic mean	71.09	—	Unverified
10	RPO	Harmonic mean	68.61	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MMRL++	Harmonic mean	91.94	—	Unverified
2	PromptKD	Harmonic mean	89.14	—	Unverified
3	HPT++	Harmonic mean	87.36	—	Unverified
4	MMRL	Harmonic mean	87.21	—	Unverified
5	CoPrompt	Harmonic mean	85.84	—	Unverified
6	ProMetaR	Harmonic mean	85.3	—	Unverified
7	DePT	Harmonic mean	84.88	—	Unverified
8	HPT	Harmonic mean	84.82	—	Unverified
9	MetaPrompt	Harmonic mean	83.38	—	Unverified
10	MaPLe	Harmonic mean	82.35	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	45.17	—	Unverified
2	MMRL++	Harmonic mean	42.24	—	Unverified
3	HPT++	Harmonic mean	41.33	—	Unverified
4	MMRL	Harmonic mean	41.15	—	Unverified
5	DePT	Harmonic mean	40.73	—	Unverified
6	HPT	Harmonic mean	40.28	—	Unverified
7	ProMetaR	Harmonic mean	40.25	—	Unverified
8	PromptSRC	Harmonic mean	40.15	—	Unverified
9	CoPrompt	Harmonic mean	39.76	—	Unverified
10	MetaPrompt	Harmonic mean	38.24	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	90.24	—	Unverified
2	HPT	Harmonic mean	87.16	—	Unverified
3	MMRL++	Harmonic mean	87.01	—	Unverified
4	MMRL	Harmonic mean	86.78	—	Unverified
5	ProMetaR	Harmonic mean	86.7	—	Unverified
6	DePT	Harmonic mean	86.46	—	Unverified
7	PromptSRC	Harmonic mean	85.95	—	Unverified
8	HPT++	Harmonic mean	85.85	—	Unverified
9	CoPrompt	Harmonic mean	85.71	—	Unverified
10	MetaPrompt	Harmonic mean	84.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	97.15	—	Unverified
2	HPT++	Harmonic mean	96.91	—	Unverified
3	CoPrompt	Harmonic mean	96.87	—	Unverified
4	MMRL	Harmonic mean	96.74	—	Unverified
5	HPT	Harmonic mean	96.71	—	Unverified
6	MaPLe	Harmonic mean	96.58	—	Unverified
7	MMRL++	Harmonic mean	96.51	—	Unverified
8	ProMetaR	Harmonic mean	96.49	—	Unverified
9	CoCoOp	Harmonic mean	96.43	—	Unverified
10	DePT	Harmonic mean	96.37	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	83.13	—	Unverified
2	MMRL++	Harmonic mean	78.18	—	Unverified
3	MMRL	Harmonic mean	78.06	—	Unverified
4	DePT	Harmonic mean	77.79	—	Unverified
5	ProMetaR	Harmonic mean	76.72	—	Unverified
6	PromptSRC	Harmonic mean	76.58	—	Unverified
7	CoPrompt	Harmonic mean	75.66	—	Unverified
8	HPT++	Harmonic mean	75.59	—	Unverified
9	HPT	Harmonic mean	75.57	—	Unverified
10	MetaPrompt	Harmonic mean	75.48	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	82.6	—	Unverified
2	CoPrompt	Harmonic mean	81.31	—	Unverified
3	MMRL++	Harmonic mean	81.28	—	Unverified
4	MMRL	Harmonic mean	81.2	—	Unverified
5	HPT++	Harmonic mean	81.11	—	Unverified
6	DePT	Harmonic mean	81.06	—	Unverified
7	HPT	Harmonic mean	80.88	—	Unverified
8	ProMetaR	Harmonic mean	80.82	—	Unverified
9	MetaPrompt	Harmonic mean	80.62	—	Unverified
10	PromptSRC	Harmonic mean	80.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	86.1	—	Unverified
2	MMRL	Harmonic mean	83.89	—	Unverified
3	HPT++	Harmonic mean	83.81	—	Unverified
4	MMRL++	Harmonic mean	83.81	—	Unverified
5	ProMetaR	Harmonic mean	83.25	—	Unverified
6	HPT	Harmonic mean	83.16	—	Unverified
7	CoPrompt	Harmonic mean	83.07	—	Unverified
8	PromptSRC	Harmonic mean	82.74	—	Unverified
9	DePT	Harmonic mean	82.46	—	Unverified
10	MetaPrompt	Harmonic mean	81.35	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	93.05	—	Unverified
2	CoPrompt	Harmonic mean	91.4	—	Unverified
3	MaPLe	Harmonic mean	91.38	—	Unverified
4	ProMetaR	Harmonic mean	91.34	—	Unverified
5	MetaPrompt	Harmonic mean	91.29	—	Unverified
6	DePT	Harmonic mean	91.22	—	Unverified
7	PromptSRC	Harmonic mean	91.1	—	Unverified
8	MMRL++	Harmonic mean	91.1	—	Unverified
9	HPT++	Harmonic mean	91.09	—	Unverified
10	MMRL	Harmonic mean	91.03	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Top-1 accuracy %	51.6	—	Unverified
2	MMRL	Top-1 accuracy %	51.2	—	Unverified
3	HPT++	Top-1 accuracy %	51.18	—	Unverified
4	PromptSRC	Top-1 accuracy %	50.9	—	Unverified
5	MaPLe	Top-1 accuracy %	50.9	—	Unverified
6	HPT	Top-1 accuracy %	50.85	—	Unverified
7	CoCoOp	Top-1 accuracy %	50.63	—	Unverified
8	CoPrompt	Top-1 accuracy %	50.5	—	Unverified
9	CLIP	Top-1 accuracy %	47.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Top-1 accuracy %	77.9	—	Unverified
2	PromptSRC	Top-1 accuracy %	77.8	—	Unverified
3	MMRL	Top-1 accuracy %	77.53	—	Unverified
4	HPT++	Top-1 accuracy %	77.52	—	Unverified
5	CoPrompt	Top-1 accuracy %	77.51	—	Unverified
6	HPT	Top-1 accuracy %	77.38	—	Unverified
7	MaPLe	Top-1 accuracy %	76.98	—	Unverified
8	CoCoOP	Top-1 accuracy %	76.18	—	Unverified
9	CLIP	Top-1 accuracy %	73.96	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Top-1 accuracy %	49.8	—	Unverified
2	PromptSRC	Top-1 accuracy %	49.55	—	Unverified
3	CoPrompt	Top-1 accuracy %	49.43	—	Unverified
4	HPT	Top-1 accuracy %	49.36	—	Unverified
5	HPT++	Top-1 accuracy %	49.28	—	Unverified
6	MMRL	Top-1 accuracy %	49.17	—	Unverified
7	MaPLe	Top-1 accuracy %	49.15	—	Unverified
8	CoCoOp	Top-1 accuracy %	48.75	—	Unverified
9	CLIP	Top-1 accuracy %	46.15	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	HPT++	Top-1 accuracy %	65.31	—	Unverified
2	HPT	Top-1 accuracy %	65.25	—	Unverified
3	MMRL	Top-1 accuracy %	64.47	—	Unverified
4	PromptSRC	Top-1 accuracy %	64.35	—	Unverified
5	CoCoOp	Top-1 accuracy %	64.07	—	Unverified
6	MaPLe	Top-1 accuracy %	64.07	—	Unverified
7	POMP	Top-1 accuracy %	63.8	—	Unverified
8	CLIP	Top-1 accuracy %	60.83	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Accuracy	25.3	—	Unverified
2	VPT	Accuracy	24.8	—	Unverified