Prompt Engineering

Prompt engineering is the process of designing and refining the prompts used to generate text from language models, such as GPT-3 or similar models. The goal of prompt engineering is to improve the quality and relevance of the generated text by carefully crafting the prompts to elicit the desired responses from the model.

Prompt engineering involves several steps, including selecting the appropriate model architecture and parameters, designing the prompt format and structure, selecting the appropriate task and training data, and fine-tuning the model using the selected prompt and data.

Prompt engineering is a crucial step in the development of language models, as it can greatly influence the quality and effectiveness of the model's responses. By carefully designing and refining the prompts used to generate text, researchers and developers can improve the accuracy and relevance of the model's output, making it more useful for a wide range of applications, including chatbots, language translation, content creation, and more.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 201–250 of 1236 papers

Title	Date	Tasks	Status	Hype	Score
HALO: Hierarchical Autonomous Logic-Oriented Orchestration for Multi-Agent LLM Systems	May 17, 2025	Arithmetic ReasoningCode Generation	CodeCode Available	1	5
Hierarchical Prompting Taxonomy: A Universal Evaluation Framework for Large Language Models Aligned with Human Cognitive Principles	Jun 18, 2024	Arithmetic ReasoningCode Generation	CodeCode Available	1	5
CultureLLM: Incorporating Cultural Differences into Large Language Models	Feb 9, 2024	Data AugmentationPrompt Engineering	CodeCode Available	1	5
Cutting Down on Prompts and Parameters: Simple Few-Shot Learning with Language Models	Jun 24, 2021	Few-Shot LearningPrompt Engineering	CodeCode Available	1	5
CXR-LLAVA: a multimodal large language model for interpreting chest X-ray images	Oct 22, 2023	DiagnosticLanguage Modeling	CodeCode Available	1	5
Counterfactual Token Generation in Large Language Models	Sep 25, 2024	Bias Detectioncounterfactual	CodeCode Available	1	5
CriSPO: Multi-Aspect Critique-Suggestion-guided Automatic Prompt Optimization for Text Generation	Oct 3, 2024	Abstractive Text SummarizationHallucination	CodeCode Available	1	5
Demystifying Large Language Models for Medicine: A Primer	Oct 24, 2024	FairnessPrompt Engineering	CodeCode Available	1	5
MotherNet: Fast Training and Inference via Hyper-Network Transformers	Dec 14, 2023	ClassificationIn-Context Learning	CodeCode Available	1	5
MedFILIP: Medical Fine-grained Language-Image Pre-training	Jan 18, 2025	Contrastive LearningDiagnostic	CodeCode Available	1	5
MatSAM: Efficient Extraction of Microstructures of Materials via Visual Large Model	Jan 11, 2024	Image SegmentationPrompt Engineering	CodeCode Available	1	5
Consistency-guided Prompt Learning for Vision-Language Models	Jun 1, 2023	Domain GeneralizationFew-Shot Learning	CodeCode Available	1	5
DePT: Decoupled Prompt Tuning	Sep 14, 2023	Prompt EngineeringZero-shot Generalization	CodeCode Available	1	5
Manipulating Embeddings of Stable Diffusion Prompts	Aug 23, 2023	Image GenerationNavigate	CodeCode Available	1	5
InterpreTabNet: Distilling Predictive Signals from Tabular Data by Salient Feature Interpretation	Jun 1, 2024	feature selectionLanguage Modeling	CodeCode Available	1	5
Just Shift It: Test-Time Prototype Shifting for Zero-Shot Generalization with Vision-Language Models	Mar 19, 2024	image-classificationImage Classification	CodeCode Available	1	5
Confidence-aware Pseudo-label Learning for Weakly Supervised Visual Grounding	Jan 1, 2023	DescriptiveObject	CodeCode Available	1	5
A Multitask, Multilingual, Multimodal Evaluation of ChatGPT on Reasoning, Hallucination, and Interactivity	Feb 8, 2023	Code GenerationHallucination	CodeCode Available	1	5
Can large language models reason about medical questions?	Jul 17, 2022	MedQAMultiple-choice	CodeCode Available	1	5
CoT-BERT: Enhancing Unsupervised Sentence Representation through Chain-of-Thought	Sep 20, 2023	Contrastive LearningDenoising	CodeCode Available	1	5
Jailbreaking ChatGPT via Prompt Engineering: An Empirical Study	May 23, 2023	Prompt Engineering	CodeCode Available	1	5
Show or Tell? A Benchmark To Evaluate Visual and Textual Prompts in Semantic Segmentation	May 6, 2025	Open Vocabulary Semantic SegmentationPrompt Engineering	CodeCode Available	1	5
MaPLe: Multi-modal Prompt Learning	Oct 6, 2022	Prompt EngineeringPrompt Learning	CodeCode Available	1	5
AutoLibra: Agent Metric Induction from Open-Ended Feedback	May 5, 2025	Prompt Engineering	CodeCode Available	1	5
Interpretable Online Log Analysis Using Large Language Models with Prompt Strategies	Aug 15, 2023	Anomaly DetectionLog Parsing	CodeCode Available	1	5
CogBench: a large language model walks into a psychology lab	Feb 28, 2024	Language ModelingLanguage Modelling	CodeCode Available	1	5
LASP: Text-to-Text Optimization for Language-Aware Soft Prompting of Vision & Language Models	Oct 3, 2022	Few-Shot LearningLanguage Modelling	CodeCode Available	1	5
Logits are All We Need to Adapt Closed Models	Feb 3, 2025	AllPrompt Engineering	CodeCode Available	1	5
Make Prompts Adaptable: Bayesian Modeling for Vision-Language Prompt Learning with Data-Dependent Prior	Jan 9, 2024	Few-Shot LearningPrompt Engineering	CodeCode Available	1	5
Language Model Fine-Tuning on Scaled Survey Data for Predicting Distributions of Public Opinions	Feb 24, 2025	Language ModelingLanguage Modelling	CodeCode Available	1	5
LLMs as Method Actors: A Model for Prompt Engineering and Architecture	Nov 8, 2024	Prompt Engineering	CodeCode Available	1	5
EconAgent: Large Language Model-Empowered Agents for Simulating Macroeconomic Activities	Oct 16, 2023	Decision MakingLanguage Modeling	CodeCode Available	1	5
Large Language Model for Multi-objective Evolutionary Optimization	Oct 19, 2023	Evolutionary AlgorithmsLanguage Modeling	CodeCode Available	1	5
Code Summarization Beyond Function Level	Feb 23, 2025	Code SummarizationFew-Shot Learning	CodeCode Available	1	5
LLM Self Defense: By Self Examination, LLMs Know They Are Being Tricked	Aug 14, 2023	Language ModellingLarge Language Model	CodeCode Available	1	5
3D Part Segmentation via Geometric Aggregation of 2D Visual Features	Dec 5, 2024	3D geometry3D Part Segmentation	CodeCode Available	1	5
AssertionBench: A Benchmark to Evaluate Large-Language Models for Assertion Generation	Jun 26, 2024	Prompt Engineering	CodeCode Available	1	5
Large Language Models for Failure Mode Classification: An Investigation	Sep 15, 2023	ClassificationPrompt Engineering	CodeCode Available	1	5
LogEval: A Comprehensive Benchmark Suite for Large Language Models In Log Analysis	Jul 2, 2024	Anomaly DetectionFault Diagnosis	CodeCode Available	1	5
Making Language Models Better Tool Learners with Execution Feedback	May 22, 2023	Language ModelingLanguage Modelling	CodeCode Available	1	5
Chain of Natural Language Inference for Reducing Large Language Model Ungrounded Hallucinations	Oct 6, 2023	HallucinationLanguage Modeling	CodeCode Available	1	5
On the Detectability of ChatGPT Content: Benchmarking, Methodology, and Evaluation through the Lens of Academic Writing	Jun 7, 2023	BenchmarkingPrompt Engineering	CodeCode Available	1	5
CHiLS: Zero-Shot Image Classification with Hierarchical Label Sets	Feb 6, 2023	Classificationimage-classification	CodeCode Available	1	5
Steering Language Models With Activation Engineering	Aug 20, 2023	Language ModelingLanguage Modelling	CodeCode Available	1	5
Feature-prompting GBMSeg: One-Shot Reference Guided Training-Free Prompt Engineering for Glomerular Basement Membrane Segmentation	Jun 24, 2024	Prompt EngineeringSegmentation	CodeCode Available	1	5
Learning Domain Invariant Prompt for Vision-Language Models	Dec 8, 2022	Domain GeneralizationLanguage Modelling	CodeCode Available	1	5
LLM Based Multi-Agent Generation of Semi-structured Documents from Semantic Templates in the Public Administration Domain	Feb 21, 2024	ManagementPrompt Engineering	CodeCode Available	1	5
Aloe: A Family of Fine-tuned Open Healthcare LLMs	May 3, 2024	Prompt EngineeringRed Teaming	CodeCode Available	1	5
ChatGPT Chemistry Assistant for Text Mining and Prediction of MOF Synthesis	Jun 20, 2023	ArticlesChatbot	CodeCode Available	1	5
ActionCLIP: A New Paradigm for Video Action Recognition	Sep 17, 2021	Action ClassificationAction Recognition	CodeCode Available	1	5

Show:10 25 50

← PrevPage 5 of 25Next →

All datasets ImageNet Caltech-101 DTD EuroSAT FGVC-Aircraft Oxford 102 Flower Oxford-IIIT Pet Dataset Stanford Cars SUN397 UCF101 Food-101 ImageNet-A

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	77.62	—	Unverified
2	Customized Ensemble	Harmonic mean	75.49	—	Unverified
3	MMRL	Harmonic mean	74.45	—	Unverified
4	MMRL++	Harmonic mean	74.44	—	Unverified
5	CoPrompt	Harmonic mean	74.33	—	Unverified
6	HPT++	Harmonic mean	74.24	—	Unverified
7	HPT	Harmonic mean	74.17	—	Unverified
8	ProMetaR	Harmonic mean	74.09	—	Unverified
9	MetaPrompt	Harmonic mean	74.02	—	Unverified
10	DePT	Harmonic mean	74.02	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	97.77	—	Unverified
2	HPT++	Harmonic mean	96.96	—	Unverified
3	MMRL++	Harmonic mean	96.75	—	Unverified
4	MMRL	Harmonic mean	96.68	—	Unverified
5	HPT	Harmonic mean	96.65	—	Unverified
6	CoPrompt	Harmonic mean	96.55	—	Unverified
7	MetaPrompt	Harmonic mean	96.32	—	Unverified
8	DePT	Harmonic mean	96.28	—	Unverified
9	ProMetaR	Harmonic mean	96.16	—	Unverified
10	RPO	Harmonic mean	96.03	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	77.94	—	Unverified
2	MMRL++	Harmonic mean	74.46	—	Unverified
3	HPT++	Harmonic mean	74.23	—	Unverified
4	MMRL	Harmonic mean	73.82	—	Unverified
5	CoPrompt	Harmonic mean	72.79	—	Unverified
6	ProMetaR	Harmonic mean	72.31	—	Unverified
7	HPT	Harmonic mean	72.16	—	Unverified
8	PromptSRC	Harmonic mean	71.75	—	Unverified
9	DePT	Harmonic mean	71.09	—	Unverified
10	RPO	Harmonic mean	68.61	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MMRL++	Harmonic mean	91.94	—	Unverified
2	PromptKD	Harmonic mean	89.14	—	Unverified
3	HPT++	Harmonic mean	87.36	—	Unverified
4	MMRL	Harmonic mean	87.21	—	Unverified
5	CoPrompt	Harmonic mean	85.84	—	Unverified
6	ProMetaR	Harmonic mean	85.3	—	Unverified
7	DePT	Harmonic mean	84.88	—	Unverified
8	HPT	Harmonic mean	84.82	—	Unverified
9	MetaPrompt	Harmonic mean	83.38	—	Unverified
10	MaPLe	Harmonic mean	82.35	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	45.17	—	Unverified
2	MMRL++	Harmonic mean	42.24	—	Unverified
3	HPT++	Harmonic mean	41.33	—	Unverified
4	MMRL	Harmonic mean	41.15	—	Unverified
5	DePT	Harmonic mean	40.73	—	Unverified
6	HPT	Harmonic mean	40.28	—	Unverified
7	ProMetaR	Harmonic mean	40.25	—	Unverified
8	PromptSRC	Harmonic mean	40.15	—	Unverified
9	CoPrompt	Harmonic mean	39.76	—	Unverified
10	MetaPrompt	Harmonic mean	38.24	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	90.24	—	Unverified
2	HPT	Harmonic mean	87.16	—	Unverified
3	MMRL++	Harmonic mean	87.01	—	Unverified
4	MMRL	Harmonic mean	86.78	—	Unverified
5	ProMetaR	Harmonic mean	86.7	—	Unverified
6	DePT	Harmonic mean	86.46	—	Unverified
7	PromptSRC	Harmonic mean	85.95	—	Unverified
8	HPT++	Harmonic mean	85.85	—	Unverified
9	CoPrompt	Harmonic mean	85.71	—	Unverified
10	MetaPrompt	Harmonic mean	84.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	97.15	—	Unverified
2	HPT++	Harmonic mean	96.91	—	Unverified
3	CoPrompt	Harmonic mean	96.87	—	Unverified
4	MMRL	Harmonic mean	96.74	—	Unverified
5	HPT	Harmonic mean	96.71	—	Unverified
6	MaPLe	Harmonic mean	96.58	—	Unverified
7	MMRL++	Harmonic mean	96.51	—	Unverified
8	ProMetaR	Harmonic mean	96.49	—	Unverified
9	CoCoOp	Harmonic mean	96.43	—	Unverified
10	DePT	Harmonic mean	96.37	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	83.13	—	Unverified
2	MMRL++	Harmonic mean	78.18	—	Unverified
3	MMRL	Harmonic mean	78.06	—	Unverified
4	DePT	Harmonic mean	77.79	—	Unverified
5	ProMetaR	Harmonic mean	76.72	—	Unverified
6	PromptSRC	Harmonic mean	76.58	—	Unverified
7	CoPrompt	Harmonic mean	75.66	—	Unverified
8	HPT++	Harmonic mean	75.59	—	Unverified
9	HPT	Harmonic mean	75.57	—	Unverified
10	MetaPrompt	Harmonic mean	75.48	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	82.6	—	Unverified
2	CoPrompt	Harmonic mean	81.31	—	Unverified
3	MMRL++	Harmonic mean	81.28	—	Unverified
4	MMRL	Harmonic mean	81.2	—	Unverified
5	HPT++	Harmonic mean	81.11	—	Unverified
6	DePT	Harmonic mean	81.06	—	Unverified
7	HPT	Harmonic mean	80.88	—	Unverified
8	ProMetaR	Harmonic mean	80.82	—	Unverified
9	MetaPrompt	Harmonic mean	80.62	—	Unverified
10	PromptSRC	Harmonic mean	80.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	86.1	—	Unverified
2	MMRL	Harmonic mean	83.89	—	Unverified
3	HPT++	Harmonic mean	83.81	—	Unverified
4	MMRL++	Harmonic mean	83.81	—	Unverified
5	ProMetaR	Harmonic mean	83.25	—	Unverified
6	HPT	Harmonic mean	83.16	—	Unverified
7	CoPrompt	Harmonic mean	83.07	—	Unverified
8	PromptSRC	Harmonic mean	82.74	—	Unverified
9	DePT	Harmonic mean	82.46	—	Unverified
10	MetaPrompt	Harmonic mean	81.35	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	93.05	—	Unverified
2	CoPrompt	Harmonic mean	91.4	—	Unverified
3	MaPLe	Harmonic mean	91.38	—	Unverified
4	ProMetaR	Harmonic mean	91.34	—	Unverified
5	MetaPrompt	Harmonic mean	91.29	—	Unverified
6	DePT	Harmonic mean	91.22	—	Unverified
7	MMRL++	Harmonic mean	91.1	—	Unverified
8	PromptSRC	Harmonic mean	91.1	—	Unverified
9	HPT++	Harmonic mean	91.09	—	Unverified
10	MMRL	Harmonic mean	91.03	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Top-1 accuracy %	51.6	—	Unverified
2	MMRL	Top-1 accuracy %	51.2	—	Unverified
3	HPT++	Top-1 accuracy %	51.18	—	Unverified
4	MaPLe	Top-1 accuracy %	50.9	—	Unverified
5	PromptSRC	Top-1 accuracy %	50.9	—	Unverified
6	HPT	Top-1 accuracy %	50.85	—	Unverified
7	CoCoOp	Top-1 accuracy %	50.63	—	Unverified
8	CoPrompt	Top-1 accuracy %	50.5	—	Unverified
9	CLIP	Top-1 accuracy %	47.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Top-1 accuracy %	77.9	—	Unverified
2	PromptSRC	Top-1 accuracy %	77.8	—	Unverified
3	MMRL	Top-1 accuracy %	77.53	—	Unverified
4	HPT++	Top-1 accuracy %	77.52	—	Unverified
5	CoPrompt	Top-1 accuracy %	77.51	—	Unverified
6	HPT	Top-1 accuracy %	77.38	—	Unverified
7	MaPLe	Top-1 accuracy %	76.98	—	Unverified
8	CoCoOP	Top-1 accuracy %	76.18	—	Unverified
9	CLIP	Top-1 accuracy %	73.96	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Top-1 accuracy %	49.8	—	Unverified
2	PromptSRC	Top-1 accuracy %	49.55	—	Unverified
3	CoPrompt	Top-1 accuracy %	49.43	—	Unverified
4	HPT	Top-1 accuracy %	49.36	—	Unverified
5	HPT++	Top-1 accuracy %	49.28	—	Unverified
6	MMRL	Top-1 accuracy %	49.17	—	Unverified
7	MaPLe	Top-1 accuracy %	49.15	—	Unverified
8	CoCoOp	Top-1 accuracy %	48.75	—	Unverified
9	CLIP	Top-1 accuracy %	46.15	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	HPT++	Top-1 accuracy %	65.31	—	Unverified
2	HPT	Top-1 accuracy %	65.25	—	Unverified
3	MMRL	Top-1 accuracy %	64.47	—	Unverified
4	PromptSRC	Top-1 accuracy %	64.35	—	Unverified
5	CoCoOp	Top-1 accuracy %	64.07	—	Unverified
6	MaPLe	Top-1 accuracy %	64.07	—	Unverified
7	POMP	Top-1 accuracy %	63.8	—	Unverified
8	CLIP	Top-1 accuracy %	60.83	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Accuracy	25.3	—	Unverified
2	VPT	Accuracy	24.8	—	Unverified