Prompt Engineering

Prompt engineering is the process of designing and refining the prompts used to generate text from language models, such as GPT-3 or similar models. The goal of prompt engineering is to improve the quality and relevance of the generated text by carefully crafting the prompts to elicit the desired responses from the model.

Prompt engineering involves several steps, including selecting the appropriate model architecture and parameters, designing the prompt format and structure, selecting the appropriate task and training data, and fine-tuning the model using the selected prompt and data.

Prompt engineering is a crucial step in the development of language models, as it can greatly influence the quality and effectiveness of the model's responses. By carefully designing and refining the prompts used to generate text, researchers and developers can improve the accuracy and relevance of the model's output, making it more useful for a wide range of applications, including chatbots, language translation, content creation, and more.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 751–800 of 1236 papers

Title	Date	Tasks	Status	Hype
Can ChatGPT Detect DeepFakes? A Study of Using Multimodal Large Language Models for Media Forensics	Mar 21, 2024	DeepFake DetectionExperimental Design	CodeCode Available	1
Editing Knowledge Representation of Language Model via Rephrased Prefix Prompts	Mar 21, 2024	Attributeknowledge editing	—Unverified	0
LLM-based Extraction of Contradictions from Patents	Mar 21, 2024	Language ModellingLarge Language Model	—Unverified	0
Defending Against Indirect Prompt Injection Attacks With Spotlighting	Mar 20, 2024	Prompt Engineering	CodeCode Available	1
On Prompt Sensitivity of ChatGPT in Affective Computing	Mar 20, 2024	Prompt EngineeringSarcasm Detection	—Unverified	0
Reading Users' Minds from What They Say: An Investigation into LLM-based Empathic Mental Inference	Mar 20, 2024	Prompt Engineering	—Unverified	0
Flickr30K-CFQ: A Compact and Fragmented Query Dataset for Text-image Retrieval	Mar 20, 2024	Image RetrievalPrompt Engineering	—Unverified	0
Natural Language as Policies: Reasoning for Coordinate-Level Embodied Control with LLMs	Mar 20, 2024	Logical ReasoningPrompt Engineering	—Unverified	0
Enhancing Security of AI-Based Code Synthesis with GitHub Copilot via Cheap and Efficient Prompt-Engineering	Mar 19, 2024	Prompt Engineering	—Unverified	0
Just Shift It: Test-Time Prototype Shifting for Zero-Shot Generalization with Vision-Language Models	Mar 19, 2024	image-classificationImage Classification	CodeCode Available	1
Large Language Models Powered Context-aware Motion Prediction in Autonomous Driving	Mar 17, 2024	Autonomous DrivingMotion Forecasting	CodeCode Available	1
Can a GPT4-Powered AI Agent Be a Good Enough Performance Attribution Analyst?	Mar 15, 2024	AI AgentManagement	—Unverified	0
AI on AI: Exploring the Utility of GPT as an Expert Annotator of AI Publications	Mar 14, 2024	ChatbotLanguage Modelling	—Unverified	0
DialogGen: Multi-modal Interactive Dialogue System for Multi-turn Text-to-Image Generation	Mar 13, 2024	Image GenerationPrompt Engineering	CodeCode Available	7
Exploring Prompt Engineering Practices in the Enterprise	Mar 13, 2024	Prompt Engineering	—Unverified	0
Can LLMs Separate Instructions From Data? And What Do We Even Mean By That?	Mar 11, 2024	Prompt Engineering	CodeCode Available	2
Zero-Shot ECG Classification with Multimodal Learning and Test-time Clinical Knowledge Enhancement	Mar 11, 2024	Clinical KnowledgeDescriptive	CodeCode Available	2
RLingua: Improving Reinforcement Learning Sample Efficiency in Robotic Manipulations With Large Language Models	Mar 11, 2024	Prompt EngineeringReinforcement Learning (RL)	—Unverified	0
ContextGPT: Infusing LLMs Knowledge into Neuro-Symbolic Activity Recognition Models	Mar 11, 2024	Activity RecognitionCommon Sense Reasoning	—Unverified	0
QUASAR: QUality and Aesthetics Scoring with Advanced Representations	Mar 11, 2024	Prompt Engineering	—Unverified	0
VidProM: A Million-scale Real Prompt-Gallery Dataset for Text-to-Video Diffusion Models	Mar 10, 2024	Copy DetectionImage Generation	CodeCode Available	2
Can Large Language Models Automatically Score Proficiency of Written Essays?	Mar 10, 2024	Automated Essay ScoringPrompt Engineering	CodeCode Available	0
DiffChat: Learning to Chat with Text-to-Image Synthesis Models for Interactive Image Creation	Mar 8, 2024	Image GenerationInstruction Following	—Unverified	0
ERBench: An Entity-Relationship based Automatically Verifiable Hallucination Benchmark for Large Language Models	Mar 8, 2024	AttributeHallucination	CodeCode Available	0
ProMoAI: Process Modeling with Generative AI	Mar 7, 2024	Code GenerationModel Optimization	—Unverified	0
PromptCharm: Text-to-Image Generation through Multi-modal Prompting and Refinement	Mar 6, 2024	Image GenerationImage Inpainting	CodeCode Available	1
Explaining Genetic Programming Trees using Large Language Models	Mar 6, 2024	ChatbotDimensionality Reduction	—Unverified	0
Emotional Manipulation Through Prompt Engineering Amplifies Disinformation Generation in AI Large Language Models	Mar 6, 2024	Prompt EngineeringText Generation	—Unverified	0
ChatGPT4PCG 2 Competition: Prompt Engineering for Science Birds Level Generation	Mar 5, 2024	Prompt Engineering	—Unverified	0
Knowledge Graphs as Context Sources for LLM-Based Explanations of Learning Recommendations	Mar 5, 2024	Knowledge GraphsPrompt Engineering	—Unverified	0
PromptKD: Unsupervised Prompt Distillation for Vision-Language Models	Mar 5, 2024	Knowledge DistillationPrompt Engineering	CodeCode Available	3
PHAnToM: Persona-based Prompting Has An Effect on Theory-of-Mind Reasoning in Large Language Models	Mar 4, 2024	Prompt Engineering	—Unverified	0
OffensiveLang: A Community Based Implicit Offensive Language Dataset	Mar 4, 2024	Language ModellingLarge Language Model	CodeCode Available	0
Towards Full Authorship with AI: Supporting Revision with AI-Generated Views	Mar 2, 2024	Prompt EngineeringText Generation	—Unverified	0
Evaluating Large Language Models as Virtual Annotators for Time-series Physical Sensing Data	Mar 2, 2024	Prompt EngineeringTime Series	—Unverified	0
Prompting ChatGPT for Translation: A Comparative Analysis of Translation Brief and Persona Prompts	Feb 29, 2024	Prompt EngineeringTranslation	—Unverified	0
OpenMedLM: Prompt engineering can out-perform fine-tuning in medical question-answering with open-source large language models	Feb 29, 2024	Medical Question AnsweringMedQA	—Unverified	0
Chaining text-to-image and large language model: A novel approach for generating personalized e-commerce banners	Feb 28, 2024	Language ModelingLanguage Modelling	—Unverified	0
CogBench: a large language model walks into a psychology lab	Feb 28, 2024	Language ModelingLanguage Modelling	CodeCode Available	1
Agent-Pro: Learning to Evolve via Policy-Level Reflection and Optimization	Feb 27, 2024	Prompt Engineering	CodeCode Available	2
Determinants of LLM-assisted Decision-Making	Feb 27, 2024	Decision MakingPrompt Engineering	—Unverified	0
LangGPT: Rethinking Structured Reusable Prompt Design Framework for LLMs from the Programming Language	Feb 26, 2024	Prompt Engineering	CodeCode Available	11
Language Agents as Optimizable Graphs	Feb 26, 2024	Prompt Engineering	CodeCode Available	5
Parameter-efficient Prompt Learning for 3D Point Cloud Understanding	Feb 24, 2024	Few-Shot LearningPrompt Engineering	CodeCode Available	1
Can Large Language Models Detect Misinformation in Scientific News Reporting?	Feb 22, 2024	ArticlesClaim Verification	—Unverified	0
LLM Based Multi-Agent Generation of Semi-structured Documents from Semantic Templates in the Public Administration Domain	Feb 21, 2024	ManagementPrompt Engineering	CodeCode Available	1
OPDAI at SemEval-2024 Task 6: Small LLMs can Accelerate Hallucination Detection with Weakly Supervised Data	Feb 20, 2024	Few-Shot LearningHallucination	—Unverified	0
Prompt Stealing Attacks Against Large Language Models	Feb 20, 2024	Prompt Engineering	—Unverified	0
A User-Friendly Framework for Generating Model-Preferred Prompts in Text-to-Image Synthesis	Feb 20, 2024	Image GenerationPrompt Engineering	CodeCode Available	0
Few-shot clinical entity recognition in English, French and Spanish: masked language models outperform generative model prompting	Feb 20, 2024	Few-Shot Learningnamed-entity-recognition	—Unverified	0

Show:10 25 50

← PrevPage 16 of 25Next →

All datasets ImageNet Caltech-101 DTD EuroSAT FGVC-Aircraft Oxford 102 Flower Oxford-IIIT Pet Dataset Stanford Cars SUN397 UCF101 Food-101 ImageNet-A

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	77.62	—	Unverified
2	Customized Ensemble	Harmonic mean	75.49	—	Unverified
3	MMRL	Harmonic mean	74.45	—	Unverified
4	MMRL++	Harmonic mean	74.44	—	Unverified
5	CoPrompt	Harmonic mean	74.33	—	Unverified
6	HPT++	Harmonic mean	74.24	—	Unverified
7	HPT	Harmonic mean	74.17	—	Unverified
8	ProMetaR	Harmonic mean	74.09	—	Unverified
9	MetaPrompt	Harmonic mean	74.02	—	Unverified
10	DePT	Harmonic mean	74.02	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	97.77	—	Unverified
2	HPT++	Harmonic mean	96.96	—	Unverified
3	MMRL++	Harmonic mean	96.75	—	Unverified
4	MMRL	Harmonic mean	96.68	—	Unverified
5	HPT	Harmonic mean	96.65	—	Unverified
6	CoPrompt	Harmonic mean	96.55	—	Unverified
7	MetaPrompt	Harmonic mean	96.32	—	Unverified
8	DePT	Harmonic mean	96.28	—	Unverified
9	ProMetaR	Harmonic mean	96.16	—	Unverified
10	RPO	Harmonic mean	96.03	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	77.94	—	Unverified
2	MMRL++	Harmonic mean	74.46	—	Unverified
3	HPT++	Harmonic mean	74.23	—	Unverified
4	MMRL	Harmonic mean	73.82	—	Unverified
5	CoPrompt	Harmonic mean	72.79	—	Unverified
6	ProMetaR	Harmonic mean	72.31	—	Unverified
7	HPT	Harmonic mean	72.16	—	Unverified
8	PromptSRC	Harmonic mean	71.75	—	Unverified
9	DePT	Harmonic mean	71.09	—	Unverified
10	RPO	Harmonic mean	68.61	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MMRL++	Harmonic mean	91.94	—	Unverified
2	PromptKD	Harmonic mean	89.14	—	Unverified
3	HPT++	Harmonic mean	87.36	—	Unverified
4	MMRL	Harmonic mean	87.21	—	Unverified
5	CoPrompt	Harmonic mean	85.84	—	Unverified
6	ProMetaR	Harmonic mean	85.3	—	Unverified
7	DePT	Harmonic mean	84.88	—	Unverified
8	HPT	Harmonic mean	84.82	—	Unverified
9	MetaPrompt	Harmonic mean	83.38	—	Unverified
10	MaPLe	Harmonic mean	82.35	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	45.17	—	Unverified
2	MMRL++	Harmonic mean	42.24	—	Unverified
3	HPT++	Harmonic mean	41.33	—	Unverified
4	MMRL	Harmonic mean	41.15	—	Unverified
5	DePT	Harmonic mean	40.73	—	Unverified
6	HPT	Harmonic mean	40.28	—	Unverified
7	ProMetaR	Harmonic mean	40.25	—	Unverified
8	PromptSRC	Harmonic mean	40.15	—	Unverified
9	CoPrompt	Harmonic mean	39.76	—	Unverified
10	MetaPrompt	Harmonic mean	38.24	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	90.24	—	Unverified
2	HPT	Harmonic mean	87.16	—	Unverified
3	MMRL++	Harmonic mean	87.01	—	Unverified
4	MMRL	Harmonic mean	86.78	—	Unverified
5	ProMetaR	Harmonic mean	86.7	—	Unverified
6	DePT	Harmonic mean	86.46	—	Unverified
7	PromptSRC	Harmonic mean	85.95	—	Unverified
8	HPT++	Harmonic mean	85.85	—	Unverified
9	CoPrompt	Harmonic mean	85.71	—	Unverified
10	MetaPrompt	Harmonic mean	84.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	97.15	—	Unverified
2	HPT++	Harmonic mean	96.91	—	Unverified
3	CoPrompt	Harmonic mean	96.87	—	Unverified
4	MMRL	Harmonic mean	96.74	—	Unverified
5	HPT	Harmonic mean	96.71	—	Unverified
6	MaPLe	Harmonic mean	96.58	—	Unverified
7	MMRL++	Harmonic mean	96.51	—	Unverified
8	ProMetaR	Harmonic mean	96.49	—	Unverified
9	CoCoOp	Harmonic mean	96.43	—	Unverified
10	DePT	Harmonic mean	96.37	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	83.13	—	Unverified
2	MMRL++	Harmonic mean	78.18	—	Unverified
3	MMRL	Harmonic mean	78.06	—	Unverified
4	DePT	Harmonic mean	77.79	—	Unverified
5	ProMetaR	Harmonic mean	76.72	—	Unverified
6	PromptSRC	Harmonic mean	76.58	—	Unverified
7	CoPrompt	Harmonic mean	75.66	—	Unverified
8	HPT++	Harmonic mean	75.59	—	Unverified
9	HPT	Harmonic mean	75.57	—	Unverified
10	MetaPrompt	Harmonic mean	75.48	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	82.6	—	Unverified
2	CoPrompt	Harmonic mean	81.31	—	Unverified
3	MMRL++	Harmonic mean	81.28	—	Unverified
4	MMRL	Harmonic mean	81.2	—	Unverified
5	HPT++	Harmonic mean	81.11	—	Unverified
6	DePT	Harmonic mean	81.06	—	Unverified
7	HPT	Harmonic mean	80.88	—	Unverified
8	ProMetaR	Harmonic mean	80.82	—	Unverified
9	MetaPrompt	Harmonic mean	80.62	—	Unverified
10	PromptSRC	Harmonic mean	80.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	86.1	—	Unverified
2	MMRL	Harmonic mean	83.89	—	Unverified
3	HPT++	Harmonic mean	83.81	—	Unverified
4	MMRL++	Harmonic mean	83.81	—	Unverified
5	ProMetaR	Harmonic mean	83.25	—	Unverified
6	HPT	Harmonic mean	83.16	—	Unverified
7	CoPrompt	Harmonic mean	83.07	—	Unverified
8	PromptSRC	Harmonic mean	82.74	—	Unverified
9	DePT	Harmonic mean	82.46	—	Unverified
10	MetaPrompt	Harmonic mean	81.35	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	93.05	—	Unverified
2	CoPrompt	Harmonic mean	91.4	—	Unverified
3	MaPLe	Harmonic mean	91.38	—	Unverified
4	ProMetaR	Harmonic mean	91.34	—	Unverified
5	MetaPrompt	Harmonic mean	91.29	—	Unverified
6	DePT	Harmonic mean	91.22	—	Unverified
7	MMRL++	Harmonic mean	91.1	—	Unverified
8	PromptSRC	Harmonic mean	91.1	—	Unverified
9	HPT++	Harmonic mean	91.09	—	Unverified
10	MMRL	Harmonic mean	91.03	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Top-1 accuracy %	51.6	—	Unverified
2	MMRL	Top-1 accuracy %	51.2	—	Unverified
3	HPT++	Top-1 accuracy %	51.18	—	Unverified
4	MaPLe	Top-1 accuracy %	50.9	—	Unverified
5	PromptSRC	Top-1 accuracy %	50.9	—	Unverified
6	HPT	Top-1 accuracy %	50.85	—	Unverified
7	CoCoOp	Top-1 accuracy %	50.63	—	Unverified
8	CoPrompt	Top-1 accuracy %	50.5	—	Unverified
9	CLIP	Top-1 accuracy %	47.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Top-1 accuracy %	77.9	—	Unverified
2	PromptSRC	Top-1 accuracy %	77.8	—	Unverified
3	MMRL	Top-1 accuracy %	77.53	—	Unverified
4	HPT++	Top-1 accuracy %	77.52	—	Unverified
5	CoPrompt	Top-1 accuracy %	77.51	—	Unverified
6	HPT	Top-1 accuracy %	77.38	—	Unverified
7	MaPLe	Top-1 accuracy %	76.98	—	Unverified
8	CoCoOP	Top-1 accuracy %	76.18	—	Unverified
9	CLIP	Top-1 accuracy %	73.96	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Top-1 accuracy %	49.8	—	Unverified
2	PromptSRC	Top-1 accuracy %	49.55	—	Unverified
3	CoPrompt	Top-1 accuracy %	49.43	—	Unverified
4	HPT	Top-1 accuracy %	49.36	—	Unverified
5	HPT++	Top-1 accuracy %	49.28	—	Unverified
6	MMRL	Top-1 accuracy %	49.17	—	Unverified
7	MaPLe	Top-1 accuracy %	49.15	—	Unverified
8	CoCoOp	Top-1 accuracy %	48.75	—	Unverified
9	CLIP	Top-1 accuracy %	46.15	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	HPT++	Top-1 accuracy %	65.31	—	Unverified
2	HPT	Top-1 accuracy %	65.25	—	Unverified
3	MMRL	Top-1 accuracy %	64.47	—	Unverified
4	PromptSRC	Top-1 accuracy %	64.35	—	Unverified
5	CoCoOp	Top-1 accuracy %	64.07	—	Unverified
6	MaPLe	Top-1 accuracy %	64.07	—	Unverified
7	POMP	Top-1 accuracy %	63.8	—	Unverified
8	CLIP	Top-1 accuracy %	60.83	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Accuracy	25.3	—	Unverified
2	VPT	Accuracy	24.8	—	Unverified