Prompt Engineering

Prompt engineering is the process of designing and refining the prompts used to generate text from language models, such as GPT-3 or similar models. The goal of prompt engineering is to improve the quality and relevance of the generated text by carefully crafting the prompts to elicit the desired responses from the model.

Prompt engineering involves several steps, including selecting the appropriate model architecture and parameters, designing the prompt format and structure, selecting the appropriate task and training data, and fine-tuning the model using the selected prompt and data.

Prompt engineering is a crucial step in the development of language models, as it can greatly influence the quality and effectiveness of the model's responses. By carefully designing and refining the prompts used to generate text, researchers and developers can improve the accuracy and relevance of the model's output, making it more useful for a wide range of applications, including chatbots, language translation, content creation, and more.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1101–1150 of 1236 papers

Title	Date	Tasks	Status
Bias Testing and Mitigation in LLM-based Code Generation	Sep 3, 2023	Code GenerationFairness	—Unverified
LoGoPrompt: Synthetic Text Images Can Be Good Visual Prompts for Vision-Language Models	Sep 3, 2023	Domain GeneralizationFew-Shot Learning	—Unverified
Linking microblogging sentiments to stock price movement: An application of GPT-4	Aug 31, 2023	Prompt EngineeringSentiment Analysis	—Unverified
Can Prompt Learning Benefit Radiology Report Generation?	Aug 30, 2023	Image CaptioningPrompt Engineering	—Unverified
Large Language Models as Data Preprocessors	Aug 30, 2023	feature selectionImputation	—Unverified
Multi-party Goal Tracking with LLMs: Comparing Pre-training, Fine-tuning, and Prompt Engineering	Aug 29, 2023	HallucinationPrompt Engineering	CodeCode Available
FurChat: An Embodied Conversational Agent using LLMs, Combining Open and Closed-Domain Dialogue with Facial Expressions	Aug 29, 2023	Language ModelingLanguage Modelling	—Unverified
Situated Natural Language Explanations	Aug 27, 2023	Prompt Engineering	—Unverified
Benchmarking Causal Study to Interpret Large Language Models for Source Code	Aug 23, 2023	BenchmarkingCausal Inference	—Unverified
Data-to-text Generation for Severely Under-Resourced Languages with GPT-3.5: A Bit of Help Needed from Google Translate	Aug 19, 2023	Data-to-Text GenerationPrompt Engineering	CodeCode Available
Synergistic Integration of Large Language Models and Cognitive Architectures for Robust AI: An Exploratory Analysis	Aug 18, 2023	Prompt Engineering	—Unverified
Accelerated materials language processing enabled by GPT	Aug 18, 2023	Document ClassificationExtractive Question-Answering	—Unverified
ChatGPT-HealthPrompt. Harnessing the Power of XAI in Prompt-Based Healthcare Decision Support using ChatGPT	Aug 17, 2023	Binary ClassificationDecision Making	CodeCode Available
Detection of ChatGPT Fake Science with the xFakeSci Learning Algorithm	Aug 15, 2023	ArticlesAttribute	—Unverified
Revisiting Prompt Engineering via Declarative Crowdsourcing	Aug 7, 2023	Entity ResolutionImputation	—Unverified
ParaFuzz: An Interpretability-Driven Technique for Detecting Poisoned Samples in NLP	Aug 4, 2023	Language ModellingLarge Language Model	—Unverified
Evaluating ChatGPT text-mining of clinical records for obesity monitoring	Aug 3, 2023	Language ModelingLanguage Modelling	—Unverified
InterAct: Exploring the Potentials of ChatGPT as a Cooperative Agent	Aug 3, 2023	Decision MakingLanguage Modeling	—Unverified
Optimizing Machine Translation through Prompt Engineering: An Investigation into ChatGPT's Customizability	Aug 2, 2023	Machine TranslationMarketing	—Unverified
Alpha-GPT: Human-AI Interactive Alpha Mining for Quantitative Investment	Jul 31, 2023	Prompt Engineering	—Unverified
Is GPT a Computational Model of Emotion? Detailed Analysis	Jul 25, 2023	Prompt Engineering	—Unverified
GPT-3 Models are Few-Shot Financial Reasoners	Jul 25, 2023	Financial AnalysisPrompt Engineering	—Unverified
Multi-Method Self-Training: Improving Code Generation With Text, And Vice Versa	Jul 20, 2023	Code GenerationPrompt Engineering	—Unverified
Chit-Chat or Deep Talk: Prompt Engineering for Process Mining	Jul 19, 2023	Prompt Engineering	—Unverified
Large Language Models can accomplish Business Process Management Tasks	Jul 19, 2023	ManagementPrompt Engineering	—Unverified
Integration of Large Language Models and Federated Learning	Jul 18, 2023	Federated LearningLanguage Modelling	—Unverified
Domain Knowledge Distillation from Large Language Model: An Empirical Study in the Autonomous Driving Domain	Jul 17, 2023	Autonomous DrivingKnowledge Distillation	—Unverified
FRANC: A Lightweight Framework for High-Quality Code Generation	Jul 17, 2023	Code GenerationPrompt Engineering	—Unverified
The Potential and Pitfalls of using a Large Language Model such as ChatGPT or GPT-4 as a Clinical Assistant	Jul 16, 2023	DiagnosticLanguage Modeling	—Unverified
AutoHint: Automatic Prompt Optimization with Hint Generation	Jul 13, 2023	Hint GenerationIn-Context Learning	CodeCode Available
Piecing Together Clues: A Benchmark for Evaluating the Detective Skills of Large Language Models	Jul 11, 2023	Common Sense ReasoningDecision Making	—Unverified
Right to be Forgotten in the Era of Large Language Models: Implications, Challenges, and Solutions	Jul 8, 2023	Machine UnlearningModel Editing	—Unverified
Copilot for Xcode: Exploring AI-Assisted Programming by Prompting Cloud-based Large Language Models	Jul 8, 2023	Code GenerationPrompt Engineering	—Unverified
Comparative Analysis of GPT-4 and Human Graders in Evaluating Praise Given to Students in Synthetic Dialogues	Jul 5, 2023	ChatbotPrompt Engineering	—Unverified
Review of Large Vision Models and Visual Prompt Engineering	Jul 3, 2023	Prompt Engineering	—Unverified
Fine-Tuning Large Language Models for Answering Programming Questions with Code Snippets	Jun 26, 2023	Code GenerationLanguage Modelling	—Unverified
Data-Driven Approach for Formality-Sensitive Machine Translation: Language-Specific Handling and Synthetic Data Generation	Jun 26, 2023	Machine TranslationPrompt Engineering	—Unverified
Identifying and Extracting Rare Disease Phenotypes with Large Language Models	Jun 22, 2023	Language ModellingLarge Language Model	CodeCode Available
Solving and Generating NPR Sunday Puzzles with Large Language Models	Jun 21, 2023	Multiple-choicePrompt Engineering	CodeCode Available
Exploring the Effectiveness of Dataset Synthesis: An application of Apple Detection in Orchards	Jun 20, 2023	Objectobject-detection	—Unverified
The Cultivated Practices of Text-to-Image Generation	Jun 20, 2023	Image GenerationPrompt Engineering	—Unverified
Cases of EFL Secondary Students' Prompt Engineering Pathways to Complete a Writing Task with ChatGPT	Jun 19, 2023	ChatbotPrompt Engineering	—Unverified
Exploring the MIT Mathematics and EECS Curriculum Using Large Language Models	Jun 15, 2023	Electrical EngineeringFew-Shot Learning	—Unverified
Improving Knowledge Extraction from LLMs for Task Learning through Agent Analysis	Jun 11, 2023	One-Shot LearningPrompt Engineering	—Unverified
The economic trade-offs of large language models: A case study	Jun 8, 2023	Knowledge DistillationPrompt Engineering	—Unverified
Prompt Space Optimizing Few-shot Reasoning Success with Large Language Models	Jun 6, 2023	Arithmetic ReasoningIn-Context Learning	CodeCode Available
Cheap-fake Detection with LLM using Prompt Engineering	Jun 5, 2023	Image CaptioningImage Generation	—Unverified
ChatGPT as a mapping assistant: A novel method to enrich maps with generative AI and content derived from street-level photographs	Jun 5, 2023	Prompt Engineering	—Unverified
User-friendly Image Editing with Minimal Text Input: Leveraging Captioning and Injection Techniques	Jun 5, 2023	Prompt EngineeringSentence	—Unverified
Responsible Task Automation: Empowering Large Language Models as Responsible Task Automators	Jun 2, 2023	Prompt Engineering	—Unverified

Show:10 25 50

← PrevPage 23 of 25Next →

All datasets ImageNet Caltech-101 DTD EuroSAT FGVC-Aircraft Oxford 102 Flower Oxford-IIIT Pet Dataset Stanford Cars SUN397 UCF101 Food-101 ImageNet-A

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	77.62	—	Unverified
2	Customized Ensemble	Harmonic mean	75.49	—	Unverified
3	MMRL	Harmonic mean	74.45	—	Unverified
4	MMRL++	Harmonic mean	74.44	—	Unverified
5	CoPrompt	Harmonic mean	74.33	—	Unverified
6	HPT++	Harmonic mean	74.24	—	Unverified
7	HPT	Harmonic mean	74.17	—	Unverified
8	ProMetaR	Harmonic mean	74.09	—	Unverified
9	MetaPrompt	Harmonic mean	74.02	—	Unverified
10	DePT	Harmonic mean	74.02	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	97.77	—	Unverified
2	HPT++	Harmonic mean	96.96	—	Unverified
3	MMRL++	Harmonic mean	96.75	—	Unverified
4	MMRL	Harmonic mean	96.68	—	Unverified
5	HPT	Harmonic mean	96.65	—	Unverified
6	CoPrompt	Harmonic mean	96.55	—	Unverified
7	MetaPrompt	Harmonic mean	96.32	—	Unverified
8	DePT	Harmonic mean	96.28	—	Unverified
9	ProMetaR	Harmonic mean	96.16	—	Unverified
10	RPO	Harmonic mean	96.03	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	77.94	—	Unverified
2	MMRL++	Harmonic mean	74.46	—	Unverified
3	HPT++	Harmonic mean	74.23	—	Unverified
4	MMRL	Harmonic mean	73.82	—	Unverified
5	CoPrompt	Harmonic mean	72.79	—	Unverified
6	ProMetaR	Harmonic mean	72.31	—	Unverified
7	HPT	Harmonic mean	72.16	—	Unverified
8	PromptSRC	Harmonic mean	71.75	—	Unverified
9	DePT	Harmonic mean	71.09	—	Unverified
10	RPO	Harmonic mean	68.61	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MMRL++	Harmonic mean	91.94	—	Unverified
2	PromptKD	Harmonic mean	89.14	—	Unverified
3	HPT++	Harmonic mean	87.36	—	Unverified
4	MMRL	Harmonic mean	87.21	—	Unverified
5	CoPrompt	Harmonic mean	85.84	—	Unverified
6	ProMetaR	Harmonic mean	85.3	—	Unverified
7	DePT	Harmonic mean	84.88	—	Unverified
8	HPT	Harmonic mean	84.82	—	Unverified
9	MetaPrompt	Harmonic mean	83.38	—	Unverified
10	MaPLe	Harmonic mean	82.35	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	45.17	—	Unverified
2	MMRL++	Harmonic mean	42.24	—	Unverified
3	HPT++	Harmonic mean	41.33	—	Unverified
4	MMRL	Harmonic mean	41.15	—	Unverified
5	DePT	Harmonic mean	40.73	—	Unverified
6	HPT	Harmonic mean	40.28	—	Unverified
7	ProMetaR	Harmonic mean	40.25	—	Unverified
8	PromptSRC	Harmonic mean	40.15	—	Unverified
9	CoPrompt	Harmonic mean	39.76	—	Unverified
10	MetaPrompt	Harmonic mean	38.24	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	90.24	—	Unverified
2	HPT	Harmonic mean	87.16	—	Unverified
3	MMRL++	Harmonic mean	87.01	—	Unverified
4	MMRL	Harmonic mean	86.78	—	Unverified
5	ProMetaR	Harmonic mean	86.7	—	Unverified
6	DePT	Harmonic mean	86.46	—	Unverified
7	PromptSRC	Harmonic mean	85.95	—	Unverified
8	HPT++	Harmonic mean	85.85	—	Unverified
9	CoPrompt	Harmonic mean	85.71	—	Unverified
10	MetaPrompt	Harmonic mean	84.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	97.15	—	Unverified
2	HPT++	Harmonic mean	96.91	—	Unverified
3	CoPrompt	Harmonic mean	96.87	—	Unverified
4	MMRL	Harmonic mean	96.74	—	Unverified
5	HPT	Harmonic mean	96.71	—	Unverified
6	MaPLe	Harmonic mean	96.58	—	Unverified
7	MMRL++	Harmonic mean	96.51	—	Unverified
8	ProMetaR	Harmonic mean	96.49	—	Unverified
9	CoCoOp	Harmonic mean	96.43	—	Unverified
10	DePT	Harmonic mean	96.37	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	83.13	—	Unverified
2	MMRL++	Harmonic mean	78.18	—	Unverified
3	MMRL	Harmonic mean	78.06	—	Unverified
4	DePT	Harmonic mean	77.79	—	Unverified
5	ProMetaR	Harmonic mean	76.72	—	Unverified
6	PromptSRC	Harmonic mean	76.58	—	Unverified
7	CoPrompt	Harmonic mean	75.66	—	Unverified
8	HPT++	Harmonic mean	75.59	—	Unverified
9	HPT	Harmonic mean	75.57	—	Unverified
10	MetaPrompt	Harmonic mean	75.48	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	82.6	—	Unverified
2	CoPrompt	Harmonic mean	81.31	—	Unverified
3	MMRL++	Harmonic mean	81.28	—	Unverified
4	MMRL	Harmonic mean	81.2	—	Unverified
5	HPT++	Harmonic mean	81.11	—	Unverified
6	DePT	Harmonic mean	81.06	—	Unverified
7	HPT	Harmonic mean	80.88	—	Unverified
8	ProMetaR	Harmonic mean	80.82	—	Unverified
9	MetaPrompt	Harmonic mean	80.62	—	Unverified
10	PromptSRC	Harmonic mean	80.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	86.1	—	Unverified
2	MMRL	Harmonic mean	83.89	—	Unverified
3	HPT++	Harmonic mean	83.81	—	Unverified
4	MMRL++	Harmonic mean	83.81	—	Unverified
5	ProMetaR	Harmonic mean	83.25	—	Unverified
6	HPT	Harmonic mean	83.16	—	Unverified
7	CoPrompt	Harmonic mean	83.07	—	Unverified
8	PromptSRC	Harmonic mean	82.74	—	Unverified
9	DePT	Harmonic mean	82.46	—	Unverified
10	MetaPrompt	Harmonic mean	81.35	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	93.05	—	Unverified
2	CoPrompt	Harmonic mean	91.4	—	Unverified
3	MaPLe	Harmonic mean	91.38	—	Unverified
4	ProMetaR	Harmonic mean	91.34	—	Unverified
5	MetaPrompt	Harmonic mean	91.29	—	Unverified
6	DePT	Harmonic mean	91.22	—	Unverified
7	MMRL++	Harmonic mean	91.1	—	Unverified
8	PromptSRC	Harmonic mean	91.1	—	Unverified
9	HPT++	Harmonic mean	91.09	—	Unverified
10	MMRL	Harmonic mean	91.03	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Top-1 accuracy %	51.6	—	Unverified
2	MMRL	Top-1 accuracy %	51.2	—	Unverified
3	HPT++	Top-1 accuracy %	51.18	—	Unverified
4	MaPLe	Top-1 accuracy %	50.9	—	Unverified
5	PromptSRC	Top-1 accuracy %	50.9	—	Unverified
6	HPT	Top-1 accuracy %	50.85	—	Unverified
7	CoCoOp	Top-1 accuracy %	50.63	—	Unverified
8	CoPrompt	Top-1 accuracy %	50.5	—	Unverified
9	CLIP	Top-1 accuracy %	47.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Top-1 accuracy %	77.9	—	Unverified
2	PromptSRC	Top-1 accuracy %	77.8	—	Unverified
3	MMRL	Top-1 accuracy %	77.53	—	Unverified
4	HPT++	Top-1 accuracy %	77.52	—	Unverified
5	CoPrompt	Top-1 accuracy %	77.51	—	Unverified
6	HPT	Top-1 accuracy %	77.38	—	Unverified
7	MaPLe	Top-1 accuracy %	76.98	—	Unverified
8	CoCoOP	Top-1 accuracy %	76.18	—	Unverified
9	CLIP	Top-1 accuracy %	73.96	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Top-1 accuracy %	49.8	—	Unverified
2	PromptSRC	Top-1 accuracy %	49.55	—	Unverified
3	CoPrompt	Top-1 accuracy %	49.43	—	Unverified
4	HPT	Top-1 accuracy %	49.36	—	Unverified
5	HPT++	Top-1 accuracy %	49.28	—	Unverified
6	MMRL	Top-1 accuracy %	49.17	—	Unverified
7	MaPLe	Top-1 accuracy %	49.15	—	Unverified
8	CoCoOp	Top-1 accuracy %	48.75	—	Unverified
9	CLIP	Top-1 accuracy %	46.15	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	HPT++	Top-1 accuracy %	65.31	—	Unverified
2	HPT	Top-1 accuracy %	65.25	—	Unverified
3	MMRL	Top-1 accuracy %	64.47	—	Unverified
4	PromptSRC	Top-1 accuracy %	64.35	—	Unverified
5	CoCoOp	Top-1 accuracy %	64.07	—	Unverified
6	MaPLe	Top-1 accuracy %	64.07	—	Unverified
7	POMP	Top-1 accuracy %	63.8	—	Unverified
8	CLIP	Top-1 accuracy %	60.83	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Accuracy	25.3	—	Unverified
2	VPT	Accuracy	24.8	—	Unverified