Prompt Engineering

Prompt engineering is the process of designing and refining the prompts used to generate text from language models, such as GPT-3 or similar models. The goal of prompt engineering is to improve the quality and relevance of the generated text by carefully crafting the prompts to elicit the desired responses from the model.

Prompt engineering involves several steps, including selecting the appropriate model architecture and parameters, designing the prompt format and structure, selecting the appropriate task and training data, and fine-tuning the model using the selected prompt and data.

Prompt engineering is a crucial step in the development of language models, as it can greatly influence the quality and effectiveness of the model's responses. By carefully designing and refining the prompts used to generate text, researchers and developers can improve the accuracy and relevance of the model's output, making it more useful for a wide range of applications, including chatbots, language translation, content creation, and more.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1051–1100 of 1236 papers

Title	Date	Tasks	Status
Prompt Engineering a Prompt Engineer	Nov 9, 2023	counterfactualCounterfactual Reasoning	—Unverified
Indicative Summarization of Long Discussions	Nov 3, 2023	Prompt Engineering	CodeCode Available
Automating Governing Knowledge Commons and Contextual Integrity (GKC-CI) Privacy Policy Annotations with Large Language Models	Nov 3, 2023	Prompt Engineering	CodeCode Available
Efficient Black-Box Adversarial Attacks on Neural Text Detectors	Nov 3, 2023	Language ModelingLanguage Modelling	CodeCode Available
Can Large Language Models Capture Public Opinion about Global Warming? An Empirical Assessment of Algorithmic Fidelity and Bias	Nov 1, 2023	Model SelectionPrompt Engineering	—Unverified
Noisy Exemplars Make Large Language Models More Robust: A Domain-Agnostic Behavioral Analysis	Nov 1, 2023	Logical ReasoningPrompt Engineering	CodeCode Available
A Multi-Modal Foundation Model to Assist People with Blindness and Low Vision in Environmental Interaction	Oct 31, 2023	Language ModelingLanguage Modelling	—Unverified
From Chatbots to PhishBots? -- Preventing Phishing scams created using ChatGPT, Google Bard and Claude	Oct 29, 2023	Prompt Engineering	—Unverified
Prompt-Engineering and Transformer-based Question Generation and Evaluation	Oct 29, 2023	Prompt EngineeringQuestion Answering	—Unverified
Can LLMs Grade Short-Answer Reading Comprehension Questions : An Empirical Study with a Novel Dataset	Oct 26, 2023	Decision MakingPrompt Engineering	—Unverified
Better integrating vision and semantics for improving few-shot classification	Oct 26, 2023	Data AugmentationPrompt Engineering	CodeCode Available
Apollo: Zero-shot MultiModal Reasoning with Multiple Experts	Oct 25, 2023	Image CaptioningMultimodal Reasoning	CodeCode Available
A Communication Theory Perspective on Prompting Engineering Methods for Large Language Models	Oct 24, 2023	Multi-Task LearningPrompt Engineering	—Unverified
ConstitutionMaker: Interactively Critiquing Large Language Models by Converting Feedback into Principles	Oct 24, 2023	ChatbotLanguage Modelling	—Unverified
Unleashing the potential of prompt engineering for large language models	Oct 23, 2023	HallucinationPrompt Engineering	—Unverified
Open-Ended Instructable Embodied Agents with Memory-Augmented Large Language Models	Oct 23, 2023	Prompt EngineeringRetrieval	—Unverified
TaskDiff: A Similarity Metric for Task-Oriented Conversations	Oct 23, 2023	Prompt EngineeringResponse Generation	—Unverified
Prompt Engineering Through the Lens of Optimal Control	Oct 22, 2023	Prompt Engineering	—Unverified
Enhancing Zero-Shot Crypto Sentiment with Fine-tuned Language Model and Prompt Engineering	Oct 20, 2023	Language ModelingLanguage Modelling	—Unverified
Interactive Task Planning with Language Models	Oct 16, 2023	Language ModelingLanguage Modelling	—Unverified
Configuration Validation with Large Language Models	Oct 15, 2023	Code GenerationFew-Shot Learning	—Unverified
Human-in-the-loop Machine Translation with Large Language Model	Oct 13, 2023	In-Context LearningLanguage Modeling	CodeCode Available
Multimodal Large Language Model for Visual Navigation	Oct 12, 2023	Language ModelingLanguage Modelling	—Unverified
Promptor: A Conversational and Autonomous Prompt Generation Agent for Intelligent Text Entry Techniques	Oct 12, 2023	In-Context LearningLanguage Modelling	—Unverified
LLMs Killed the Script Kiddie: How Agents Supported by Large Language Models Change the Landscape of Network Threat Testing	Oct 10, 2023	Prompt Engineering	—Unverified
Large Language Models for Propaganda Detection	Oct 10, 2023	ArticlesMulti-Label Classification	CodeCode Available
Cost-Efficient Prompt Engineering for Unsupervised Entity Resolution	Oct 9, 2023	Entity ResolutionFeature Engineering	—Unverified
LLM4VV: Developing LLM-Driven Testsuite for Compiler Validation	Oct 8, 2023	Code GenerationPrompt Engineering	CodeCode Available
Understanding prompt engineering may not require rethinking generalization	Oct 6, 2023	Generalization BoundsLanguage Modelling	—Unverified
Investigating the Limitation of CLIP Models: The Worst-Performing Categories	Oct 5, 2023	Prompt EngineeringZero-Shot Learning	—Unverified
Co-audit: tools to help humans double-check AI-generated content	Oct 2, 2023	Prompt Engineering	—Unverified
SPELL: Semantic Prompt Evolution based on a LLM	Oct 2, 2023	Prompt Engineering	—Unverified
A Brief History of Prompt: Leveraging Language Models. (Through Advanced Prompting)	Sep 30, 2023	FairnessInformation Retrieval	—Unverified
Batch Calibration: Rethinking Calibration for In-Context Learning and Prompt Engineering	Sep 29, 2023	image-classificationImage Classification	—Unverified
A Sign Language Recognition System with Pepper, Lightweight-Transformer, and LLM	Sep 28, 2023	Prompt EngineeringSign Language Recognition	—Unverified
Exploring Small Language Models with Prompt-Learning Paradigm for Efficient Domain-Specific Text Classification	Sep 26, 2023	Prompt EngineeringPrompt Learning	—Unverified
An AI Chatbot for Explaining Deep Reinforcement Learning Decisions of Service-oriented Systems	Sep 25, 2023	ChatbotDecision Making	CodeCode Available
FaceGemma: Enhancing Image Captioning with Facial Attributes for Portrait Images	Sep 24, 2023	AttributeCaption Generation	—Unverified
A Chat About Boring Problems: Studying GPT-based text normalization	Sep 23, 2023	Prompt EngineeringText Normalization	—Unverified
A Practical Survey on Zero-shot Prompt Design for In-context Learning	Sep 22, 2023	In-Context LearningPrompt Engineering	—Unverified
AI-Copilot for Business Optimisation: A Framework and A Case Study in Production Scheduling	Sep 22, 2023	Prompt EngineeringScheduling	—Unverified
Is GPT4 a Good Trader?	Sep 20, 2023	Prompt Engineering	—Unverified
AI Foundation Models for Weather and Climate: Applications, Design, and Implementation	Sep 19, 2023	Language ModelingLanguage Modelling	—Unverified
PRE: Vision-Language Prompt Learning with Reparameterization Encoder	Sep 14, 2023	Few-Shot Image ClassificationPrompt Engineering	CodeCode Available
An Empirical Evaluation of Prompting Strategies for Large Language Models in Zero-Shot Clinical Natural Language Processing	Sep 14, 2023	AttributeAttribute Extraction	—Unverified
Unveiling the potential of large language models in generating semantic and cross-language clones	Sep 12, 2023	BenchmarkingCode Generation	—Unverified
Detecting Natural Language Biases with Prompt-based Learning	Sep 11, 2023	Language ModelingLanguage Modelling	—Unverified
An Empirical Study of NetOps Capability of Pre-Trained Large Language Models	Sep 11, 2023	Code GenerationPrompt Engineering	—Unverified
Toward Reproducing Network Research Results Using Large Language Models	Sep 9, 2023	Prompt Engineering	—Unverified
Leveraging Large Language Models for Exploiting ASR Uncertainty	Sep 9, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified

Show:10 25 50

← PrevPage 22 of 25Next →

All datasets ImageNet Caltech-101 DTD EuroSAT FGVC-Aircraft Oxford 102 Flower Oxford-IIIT Pet Dataset Stanford Cars SUN397 UCF101 Food-101 ImageNet-A

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	77.62	—	Unverified
2	Customized Ensemble	Harmonic mean	75.49	—	Unverified
3	MMRL	Harmonic mean	74.45	—	Unverified
4	MMRL++	Harmonic mean	74.44	—	Unverified
5	CoPrompt	Harmonic mean	74.33	—	Unverified
6	HPT++	Harmonic mean	74.24	—	Unverified
7	HPT	Harmonic mean	74.17	—	Unverified
8	ProMetaR	Harmonic mean	74.09	—	Unverified
9	MetaPrompt	Harmonic mean	74.02	—	Unverified
10	DePT	Harmonic mean	74.02	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	97.77	—	Unverified
2	HPT++	Harmonic mean	96.96	—	Unverified
3	MMRL++	Harmonic mean	96.75	—	Unverified
4	MMRL	Harmonic mean	96.68	—	Unverified
5	HPT	Harmonic mean	96.65	—	Unverified
6	CoPrompt	Harmonic mean	96.55	—	Unverified
7	MetaPrompt	Harmonic mean	96.32	—	Unverified
8	DePT	Harmonic mean	96.28	—	Unverified
9	ProMetaR	Harmonic mean	96.16	—	Unverified
10	RPO	Harmonic mean	96.03	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	77.94	—	Unverified
2	MMRL++	Harmonic mean	74.46	—	Unverified
3	HPT++	Harmonic mean	74.23	—	Unverified
4	MMRL	Harmonic mean	73.82	—	Unverified
5	CoPrompt	Harmonic mean	72.79	—	Unverified
6	ProMetaR	Harmonic mean	72.31	—	Unverified
7	HPT	Harmonic mean	72.16	—	Unverified
8	PromptSRC	Harmonic mean	71.75	—	Unverified
9	DePT	Harmonic mean	71.09	—	Unverified
10	RPO	Harmonic mean	68.61	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MMRL++	Harmonic mean	91.94	—	Unverified
2	PromptKD	Harmonic mean	89.14	—	Unverified
3	HPT++	Harmonic mean	87.36	—	Unverified
4	MMRL	Harmonic mean	87.21	—	Unverified
5	CoPrompt	Harmonic mean	85.84	—	Unverified
6	ProMetaR	Harmonic mean	85.3	—	Unverified
7	DePT	Harmonic mean	84.88	—	Unverified
8	HPT	Harmonic mean	84.82	—	Unverified
9	MetaPrompt	Harmonic mean	83.38	—	Unverified
10	MaPLe	Harmonic mean	82.35	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	45.17	—	Unverified
2	MMRL++	Harmonic mean	42.24	—	Unverified
3	HPT++	Harmonic mean	41.33	—	Unverified
4	MMRL	Harmonic mean	41.15	—	Unverified
5	DePT	Harmonic mean	40.73	—	Unverified
6	HPT	Harmonic mean	40.28	—	Unverified
7	ProMetaR	Harmonic mean	40.25	—	Unverified
8	PromptSRC	Harmonic mean	40.15	—	Unverified
9	CoPrompt	Harmonic mean	39.76	—	Unverified
10	MetaPrompt	Harmonic mean	38.24	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	90.24	—	Unverified
2	HPT	Harmonic mean	87.16	—	Unverified
3	MMRL++	Harmonic mean	87.01	—	Unverified
4	MMRL	Harmonic mean	86.78	—	Unverified
5	ProMetaR	Harmonic mean	86.7	—	Unverified
6	DePT	Harmonic mean	86.46	—	Unverified
7	PromptSRC	Harmonic mean	85.95	—	Unverified
8	HPT++	Harmonic mean	85.85	—	Unverified
9	CoPrompt	Harmonic mean	85.71	—	Unverified
10	MetaPrompt	Harmonic mean	84.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	97.15	—	Unverified
2	HPT++	Harmonic mean	96.91	—	Unverified
3	CoPrompt	Harmonic mean	96.87	—	Unverified
4	MMRL	Harmonic mean	96.74	—	Unverified
5	HPT	Harmonic mean	96.71	—	Unverified
6	MaPLe	Harmonic mean	96.58	—	Unverified
7	MMRL++	Harmonic mean	96.51	—	Unverified
8	ProMetaR	Harmonic mean	96.49	—	Unverified
9	CoCoOp	Harmonic mean	96.43	—	Unverified
10	DePT	Harmonic mean	96.37	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	83.13	—	Unverified
2	MMRL++	Harmonic mean	78.18	—	Unverified
3	MMRL	Harmonic mean	78.06	—	Unverified
4	DePT	Harmonic mean	77.79	—	Unverified
5	ProMetaR	Harmonic mean	76.72	—	Unverified
6	PromptSRC	Harmonic mean	76.58	—	Unverified
7	CoPrompt	Harmonic mean	75.66	—	Unverified
8	HPT++	Harmonic mean	75.59	—	Unverified
9	HPT	Harmonic mean	75.57	—	Unverified
10	MetaPrompt	Harmonic mean	75.48	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	82.6	—	Unverified
2	CoPrompt	Harmonic mean	81.31	—	Unverified
3	MMRL++	Harmonic mean	81.28	—	Unverified
4	MMRL	Harmonic mean	81.2	—	Unverified
5	HPT++	Harmonic mean	81.11	—	Unverified
6	DePT	Harmonic mean	81.06	—	Unverified
7	HPT	Harmonic mean	80.88	—	Unverified
8	ProMetaR	Harmonic mean	80.82	—	Unverified
9	MetaPrompt	Harmonic mean	80.62	—	Unverified
10	PromptSRC	Harmonic mean	80.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	86.1	—	Unverified
2	MMRL	Harmonic mean	83.89	—	Unverified
3	HPT++	Harmonic mean	83.81	—	Unverified
4	MMRL++	Harmonic mean	83.81	—	Unverified
5	ProMetaR	Harmonic mean	83.25	—	Unverified
6	HPT	Harmonic mean	83.16	—	Unverified
7	CoPrompt	Harmonic mean	83.07	—	Unverified
8	PromptSRC	Harmonic mean	82.74	—	Unverified
9	DePT	Harmonic mean	82.46	—	Unverified
10	MetaPrompt	Harmonic mean	81.35	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	93.05	—	Unverified
2	CoPrompt	Harmonic mean	91.4	—	Unverified
3	MaPLe	Harmonic mean	91.38	—	Unverified
4	ProMetaR	Harmonic mean	91.34	—	Unverified
5	MetaPrompt	Harmonic mean	91.29	—	Unverified
6	DePT	Harmonic mean	91.22	—	Unverified
7	MMRL++	Harmonic mean	91.1	—	Unverified
8	PromptSRC	Harmonic mean	91.1	—	Unverified
9	HPT++	Harmonic mean	91.09	—	Unverified
10	MMRL	Harmonic mean	91.03	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Top-1 accuracy %	51.6	—	Unverified
2	MMRL	Top-1 accuracy %	51.2	—	Unverified
3	HPT++	Top-1 accuracy %	51.18	—	Unverified
4	MaPLe	Top-1 accuracy %	50.9	—	Unverified
5	PromptSRC	Top-1 accuracy %	50.9	—	Unverified
6	HPT	Top-1 accuracy %	50.85	—	Unverified
7	CoCoOp	Top-1 accuracy %	50.63	—	Unverified
8	CoPrompt	Top-1 accuracy %	50.5	—	Unverified
9	CLIP	Top-1 accuracy %	47.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Top-1 accuracy %	77.9	—	Unverified
2	PromptSRC	Top-1 accuracy %	77.8	—	Unverified
3	MMRL	Top-1 accuracy %	77.53	—	Unverified
4	HPT++	Top-1 accuracy %	77.52	—	Unverified
5	CoPrompt	Top-1 accuracy %	77.51	—	Unverified
6	HPT	Top-1 accuracy %	77.38	—	Unverified
7	MaPLe	Top-1 accuracy %	76.98	—	Unverified
8	CoCoOP	Top-1 accuracy %	76.18	—	Unverified
9	CLIP	Top-1 accuracy %	73.96	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Top-1 accuracy %	49.8	—	Unverified
2	PromptSRC	Top-1 accuracy %	49.55	—	Unverified
3	CoPrompt	Top-1 accuracy %	49.43	—	Unverified
4	HPT	Top-1 accuracy %	49.36	—	Unverified
5	HPT++	Top-1 accuracy %	49.28	—	Unverified
6	MMRL	Top-1 accuracy %	49.17	—	Unverified
7	MaPLe	Top-1 accuracy %	49.15	—	Unverified
8	CoCoOp	Top-1 accuracy %	48.75	—	Unverified
9	CLIP	Top-1 accuracy %	46.15	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	HPT++	Top-1 accuracy %	65.31	—	Unverified
2	HPT	Top-1 accuracy %	65.25	—	Unverified
3	MMRL	Top-1 accuracy %	64.47	—	Unverified
4	PromptSRC	Top-1 accuracy %	64.35	—	Unverified
5	CoCoOp	Top-1 accuracy %	64.07	—	Unverified
6	MaPLe	Top-1 accuracy %	64.07	—	Unverified
7	POMP	Top-1 accuracy %	63.8	—	Unverified
8	CLIP	Top-1 accuracy %	60.83	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Accuracy	25.3	—	Unverified
2	VPT	Accuracy	24.8	—	Unverified