Prompt Engineering

Prompt engineering is the process of designing and refining the prompts used to generate text from language models, such as GPT-3 or similar models. The goal of prompt engineering is to improve the quality and relevance of the generated text by carefully crafting the prompts to elicit the desired responses from the model.

Prompt engineering involves several steps, including selecting the appropriate model architecture and parameters, designing the prompt format and structure, selecting the appropriate task and training data, and fine-tuning the model using the selected prompt and data.

Prompt engineering is a crucial step in the development of language models, as it can greatly influence the quality and effectiveness of the model's responses. By carefully designing and refining the prompts used to generate text, researchers and developers can improve the accuracy and relevance of the model's output, making it more useful for a wide range of applications, including chatbots, language translation, content creation, and more.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 351–400 of 1236 papers

Title	Date	Tasks	Status	Score
Depth Prompting for Sensor-Agnostic Depth Estimation	May 20, 2024	Depth EstimationMonocular Depth Estimation	CodeCode Available	5
LLMs learn governing principles of dynamical systems, revealing an in-context neural scaling law	Feb 1, 2024	Language ModelingLanguage Modelling	CodeCode Available	5
Likelihood as a Performance Gauge for Retrieval-Augmented Generation	Nov 12, 2024	Language ModelingLanguage Modelling	CodeCode Available	5
Leveraging Large Language Models for Code Translation and Software Development in Scientific Computing	Oct 31, 2024	Code TranslationPrompt Engineering	CodeCode Available	5
Lend a Hand: Semi Training-Free Cued Speech Recognition via MLLM-Driven Hand Modeling for Barrier-free Communication	Mar 11, 2025	Lip ReadingPrompt Engineering	CodeCode Available	5
Leveraging Large Language Model to Generate a Novel Metaheuristic Algorithm with CRISPE Framework	Mar 25, 2024	Language ModelingLanguage Modelling	CodeCode Available	5
LimTopic: LLM-based Topic Modeling and Text Summarization for Analyzing Scientific Articles limitations	Mar 8, 2025	ArticlesPrompt Engineering	CodeCode Available	5
Behavioral Augmentation of UML Class Diagrams: An Empirical Study of Large Language Models for Method Generation	Jun 1, 2025	Model SelectionPrompt Engineering	CodeCode Available	5
Linear Cross-document Event Coreference Resolution with X-AMR	Mar 25, 2024	coreference-resolutionCoreference Resolution	CodeCode Available	5
LLM-TA: An LLM-Enhanced Thematic Analysis Pipeline for Transcripts from Parents of Children with Congenital Heart Disease	Feb 3, 2025	ChunkingPrompt Engineering	CodeCode Available	5
Layered Unlearning for Adversarial Relearning	May 14, 2025	Language ModelingLanguage Modelling	CodeCode Available	5
Data-to-text Generation for Severely Under-Resourced Languages with GPT-3.5: A Bit of Help Needed from Google Translate	Aug 19, 2023	Data-to-Text GenerationPrompt Engineering	CodeCode Available	5
LayerCraft: Enhancing Text-to-Image Generation with CoT Reasoning and Layered Object Integration	Mar 25, 2025	Image GenerationObject	CodeCode Available	5
Large Language Models for Scholarly Ontology Generation: An Extensive Analysis in the Engineering Field	Dec 11, 2024	NavigatePrompt Engineering	CodeCode Available	5
Entity Extraction from High-Level Corruption Schemes via Large Language Models	Sep 5, 2024	ArticlesPrompt Engineering	CodeCode Available	5
Large Language Models for Propaganda Detection	Oct 10, 2023	ArticlesMulti-Label Classification	CodeCode Available	5
A Zero-Shot LLM Framework for Automatic Assignment Grading in Higher Education	Jan 24, 2025	Few-Shot LearningLanguage Modeling	CodeCode Available	5
CTBench: A Comprehensive Benchmark for Evaluating Language Model Capabilities in Clinical Trial Design	Jun 25, 2024	Language ModelingLanguage Modelling	CodeCode Available	5
LAMPER: LanguAge Model and Prompt EngineeRing for zero-shot time series classification	Mar 23, 2024	Language ModelingLanguage Modelling	CodeCode Available	5
Labels Generated by Large Language Model Helps Measuring People's Empathy in Vitro	Jan 1, 2025	Data AugmentationLanguage Modeling	CodeCode Available	5
An Empirical Study on Few-shot Knowledge Probing for Pretrained Language Models	Sep 6, 2021	Knowledge ProbingPrompt Engineering	CodeCode Available	5
JoAPR: Cleaning the Lens of Prompt Learning for Vision-Language Models	Jan 1, 2024	Prompt EngineeringPrompt Learning	CodeCode Available	5
Automating Governing Knowledge Commons and Contextual Integrity (GKC-CI) Privacy Policy Annotations with Large Language Models	Nov 3, 2023	Prompt Engineering	CodeCode Available	5
MoLEx: Mixture of Layer Experts for Finetuning with Sparse Upcycling	Mar 14, 2025	Mixture-of-Expertsparameter-efficient fine-tuning	CodeCode Available	5
I Was Blind but Now I See: Implementing Vision-Enabled Dialogue in Social Robots	Nov 15, 2023	Computational EfficiencyPrompt Engineering	CodeCode Available	5
Iterative Forward Tuning Boosts In-Context Learning in Language Models	May 22, 2023	Decision MakingIn-Context Learning	CodeCode Available	5
Network-informed Prompt Engineering against Organized Astroturf Campaigns under Extreme Class Imbalance	Jan 21, 2025	Data AugmentationLanguage Modeling	CodeCode Available	5
Kajal: Extracting Grammar of a Source Code Using Large Language Models	Dec 12, 2024	Few-Shot LearningPrompt Engineering	CodeCode Available	5
Control Illusion: The Failure of Instruction Hierarchies in Large Language Models	Feb 21, 2025	Prompt Engineering	CodeCode Available	5
Instruct or Interact? Exploring and Eliciting LLMs' Capability in Code Snippet Adaptation Through Prompt Engineering	Nov 23, 2024	Code GenerationPrompt Engineering	CodeCode Available	5
Integrating Chemistry Knowledge in Large Language Models via Prompt Engineering	Apr 22, 2024	HallucinationPrompt Engineering	CodeCode Available	5
In Search of the Long-Tail: Systematic Generation of Long-Tail Inferential Knowledge via Logical Rule Guided Search	Nov 13, 2023	Language ModellingNatural Language Inference	CodeCode Available	5
InstaSynth: Opportunities and Challenges in Generating Synthetic Instagram Data with ChatGPT for Sponsored Content Detection	Mar 22, 2024	DiversityPrompt Engineering	CodeCode Available	5
Contrastive Prompting Enhances Sentence Embeddings in LLMs through Inference-Time Steering	May 19, 2025	Prompt EngineeringSemantic Textual Similarity	CodeCode Available	5
Indicative Summarization of Long Discussions	Nov 3, 2023	Prompt Engineering	CodeCode Available	5
Automatic deductive coding in discourse analysis: an application of large language models in learning analytics	Oct 2, 2024	Feature EngineeringLanguage Modeling	CodeCode Available	5
ConstraintChecker: A Plugin for Large Language Models to Reason on Commonsense Knowledge Bases	Jan 25, 2024	Prompt EngineeringZero-Shot Learning	CodeCode Available	5
Identifying and Extracting Rare Disease Phenotypes with Large Language Models	Jun 22, 2023	Language ModellingLarge Language Model	CodeCode Available	5
How Interpretable are Reasoning Explanations from Prompting Large Language Models?	Feb 19, 2024	Prompt Engineering	CodeCode Available	5
Accuracy and Consistency of LLMs in the Registered Dietitian Exam: The Impact of Prompt Engineering and Knowledge Retrieval	Aug 6, 2024	NutritionPrompt Engineering	CodeCode Available	5
How are Prompts Different in Terms of Sensitivity?	Nov 13, 2023	In-Context LearningPrompt Engineering	CodeCode Available	5
Human-in-the-loop Machine Translation with Large Language Model	Oct 13, 2023	In-Context LearningLanguage Modeling	CodeCode Available	5
Grade Score: Quantifying LLM Performance in Option Selection	Jun 17, 2024	Decision MakingFairness	CodeCode Available	5
Conceptual Design Generation Using Large Language Models	May 30, 2023	Few-Shot LearningPrompt Engineering	CodeCode Available	5
Concept-Level Explainability for Auditing & Steering LLM Responses	May 12, 2025	Prompt EngineeringSemantic Similarity	CodeCode Available	5
An AI Chatbot for Explaining Deep Reinforcement Learning Decisions of Service-oriented Systems	Sep 25, 2023	ChatbotDecision Making	CodeCode Available	5
Adapting PromptORE for Modern History: Information Extraction from Hispanic Monarchy Documents of the XVIth Century	May 24, 2024	Prompt EngineeringRelation	CodeCode Available	5
Comprehensive Evaluation and Insights into the Use of Large Language Models in the Automation of Behavior-Driven Development Acceptance Test Formulation	Mar 22, 2024	Few-Shot LearningIn-Context Learning	CodeCode Available	5
Generalizing Segmentation Foundation Model Under Sim-to-real Domain-shift for Guidewire Segmentation in X-ray Fluoroscopy	Oct 9, 2024	Domain AdaptationImage Segmentation	CodeCode Available	5
Incubating Text Classifiers Following User Instruction with Nothing but LLM	Apr 16, 2024	DiversityPrompt Engineering	CodeCode Available	5

Show:10 25 50

← PrevPage 8 of 25Next →

All datasets ImageNet Caltech-101 DTD EuroSAT FGVC-Aircraft Oxford 102 Flower Oxford-IIIT Pet Dataset Stanford Cars SUN397 UCF101 Food-101 ImageNet-A

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	77.62	—	Unverified
2	Customized Ensemble	Harmonic mean	75.49	—	Unverified
3	MMRL	Harmonic mean	74.45	—	Unverified
4	MMRL++	Harmonic mean	74.44	—	Unverified
5	CoPrompt	Harmonic mean	74.33	—	Unverified
6	HPT++	Harmonic mean	74.24	—	Unverified
7	HPT	Harmonic mean	74.17	—	Unverified
8	ProMetaR	Harmonic mean	74.09	—	Unverified
9	MetaPrompt	Harmonic mean	74.02	—	Unverified
10	DePT	Harmonic mean	74.02	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	97.77	—	Unverified
2	HPT++	Harmonic mean	96.96	—	Unverified
3	MMRL++	Harmonic mean	96.75	—	Unverified
4	MMRL	Harmonic mean	96.68	—	Unverified
5	HPT	Harmonic mean	96.65	—	Unverified
6	CoPrompt	Harmonic mean	96.55	—	Unverified
7	MetaPrompt	Harmonic mean	96.32	—	Unverified
8	DePT	Harmonic mean	96.28	—	Unverified
9	ProMetaR	Harmonic mean	96.16	—	Unverified
10	RPO	Harmonic mean	96.03	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	77.94	—	Unverified
2	MMRL++	Harmonic mean	74.46	—	Unverified
3	HPT++	Harmonic mean	74.23	—	Unverified
4	MMRL	Harmonic mean	73.82	—	Unverified
5	CoPrompt	Harmonic mean	72.79	—	Unverified
6	ProMetaR	Harmonic mean	72.31	—	Unverified
7	HPT	Harmonic mean	72.16	—	Unverified
8	PromptSRC	Harmonic mean	71.75	—	Unverified
9	DePT	Harmonic mean	71.09	—	Unverified
10	RPO	Harmonic mean	68.61	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MMRL++	Harmonic mean	91.94	—	Unverified
2	PromptKD	Harmonic mean	89.14	—	Unverified
3	HPT++	Harmonic mean	87.36	—	Unverified
4	MMRL	Harmonic mean	87.21	—	Unverified
5	CoPrompt	Harmonic mean	85.84	—	Unverified
6	ProMetaR	Harmonic mean	85.3	—	Unverified
7	DePT	Harmonic mean	84.88	—	Unverified
8	HPT	Harmonic mean	84.82	—	Unverified
9	MetaPrompt	Harmonic mean	83.38	—	Unverified
10	MaPLe	Harmonic mean	82.35	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	45.17	—	Unverified
2	MMRL++	Harmonic mean	42.24	—	Unverified
3	HPT++	Harmonic mean	41.33	—	Unverified
4	MMRL	Harmonic mean	41.15	—	Unverified
5	DePT	Harmonic mean	40.73	—	Unverified
6	HPT	Harmonic mean	40.28	—	Unverified
7	ProMetaR	Harmonic mean	40.25	—	Unverified
8	PromptSRC	Harmonic mean	40.15	—	Unverified
9	CoPrompt	Harmonic mean	39.76	—	Unverified
10	MetaPrompt	Harmonic mean	38.24	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	90.24	—	Unverified
2	HPT	Harmonic mean	87.16	—	Unverified
3	MMRL++	Harmonic mean	87.01	—	Unverified
4	MMRL	Harmonic mean	86.78	—	Unverified
5	ProMetaR	Harmonic mean	86.7	—	Unverified
6	DePT	Harmonic mean	86.46	—	Unverified
7	PromptSRC	Harmonic mean	85.95	—	Unverified
8	HPT++	Harmonic mean	85.85	—	Unverified
9	CoPrompt	Harmonic mean	85.71	—	Unverified
10	MetaPrompt	Harmonic mean	84.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	97.15	—	Unverified
2	HPT++	Harmonic mean	96.91	—	Unverified
3	CoPrompt	Harmonic mean	96.87	—	Unverified
4	MMRL	Harmonic mean	96.74	—	Unverified
5	HPT	Harmonic mean	96.71	—	Unverified
6	MaPLe	Harmonic mean	96.58	—	Unverified
7	MMRL++	Harmonic mean	96.51	—	Unverified
8	ProMetaR	Harmonic mean	96.49	—	Unverified
9	CoCoOp	Harmonic mean	96.43	—	Unverified
10	DePT	Harmonic mean	96.37	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	83.13	—	Unverified
2	MMRL++	Harmonic mean	78.18	—	Unverified
3	MMRL	Harmonic mean	78.06	—	Unverified
4	DePT	Harmonic mean	77.79	—	Unverified
5	ProMetaR	Harmonic mean	76.72	—	Unverified
6	PromptSRC	Harmonic mean	76.58	—	Unverified
7	CoPrompt	Harmonic mean	75.66	—	Unverified
8	HPT++	Harmonic mean	75.59	—	Unverified
9	HPT	Harmonic mean	75.57	—	Unverified
10	MetaPrompt	Harmonic mean	75.48	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	82.6	—	Unverified
2	CoPrompt	Harmonic mean	81.31	—	Unverified
3	MMRL++	Harmonic mean	81.28	—	Unverified
4	MMRL	Harmonic mean	81.2	—	Unverified
5	HPT++	Harmonic mean	81.11	—	Unverified
6	DePT	Harmonic mean	81.06	—	Unverified
7	HPT	Harmonic mean	80.88	—	Unverified
8	ProMetaR	Harmonic mean	80.82	—	Unverified
9	MetaPrompt	Harmonic mean	80.62	—	Unverified
10	PromptSRC	Harmonic mean	80.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	86.1	—	Unverified
2	MMRL	Harmonic mean	83.89	—	Unverified
3	HPT++	Harmonic mean	83.81	—	Unverified
4	MMRL++	Harmonic mean	83.81	—	Unverified
5	ProMetaR	Harmonic mean	83.25	—	Unverified
6	HPT	Harmonic mean	83.16	—	Unverified
7	CoPrompt	Harmonic mean	83.07	—	Unverified
8	PromptSRC	Harmonic mean	82.74	—	Unverified
9	DePT	Harmonic mean	82.46	—	Unverified
10	MetaPrompt	Harmonic mean	81.35	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	93.05	—	Unverified
2	CoPrompt	Harmonic mean	91.4	—	Unverified
3	MaPLe	Harmonic mean	91.38	—	Unverified
4	ProMetaR	Harmonic mean	91.34	—	Unverified
5	MetaPrompt	Harmonic mean	91.29	—	Unverified
6	DePT	Harmonic mean	91.22	—	Unverified
7	MMRL++	Harmonic mean	91.1	—	Unverified
8	PromptSRC	Harmonic mean	91.1	—	Unverified
9	HPT++	Harmonic mean	91.09	—	Unverified
10	MMRL	Harmonic mean	91.03	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Top-1 accuracy %	51.6	—	Unverified
2	MMRL	Top-1 accuracy %	51.2	—	Unverified
3	HPT++	Top-1 accuracy %	51.18	—	Unverified
4	MaPLe	Top-1 accuracy %	50.9	—	Unverified
5	PromptSRC	Top-1 accuracy %	50.9	—	Unverified
6	HPT	Top-1 accuracy %	50.85	—	Unverified
7	CoCoOp	Top-1 accuracy %	50.63	—	Unverified
8	CoPrompt	Top-1 accuracy %	50.5	—	Unverified
9	CLIP	Top-1 accuracy %	47.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Top-1 accuracy %	77.9	—	Unverified
2	PromptSRC	Top-1 accuracy %	77.8	—	Unverified
3	MMRL	Top-1 accuracy %	77.53	—	Unverified
4	HPT++	Top-1 accuracy %	77.52	—	Unverified
5	CoPrompt	Top-1 accuracy %	77.51	—	Unverified
6	HPT	Top-1 accuracy %	77.38	—	Unverified
7	MaPLe	Top-1 accuracy %	76.98	—	Unverified
8	CoCoOP	Top-1 accuracy %	76.18	—	Unverified
9	CLIP	Top-1 accuracy %	73.96	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Top-1 accuracy %	49.8	—	Unverified
2	PromptSRC	Top-1 accuracy %	49.55	—	Unverified
3	CoPrompt	Top-1 accuracy %	49.43	—	Unverified
4	HPT	Top-1 accuracy %	49.36	—	Unverified
5	HPT++	Top-1 accuracy %	49.28	—	Unverified
6	MMRL	Top-1 accuracy %	49.17	—	Unverified
7	MaPLe	Top-1 accuracy %	49.15	—	Unverified
8	CoCoOp	Top-1 accuracy %	48.75	—	Unverified
9	CLIP	Top-1 accuracy %	46.15	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	HPT++	Top-1 accuracy %	65.31	—	Unverified
2	HPT	Top-1 accuracy %	65.25	—	Unverified
3	MMRL	Top-1 accuracy %	64.47	—	Unverified
4	PromptSRC	Top-1 accuracy %	64.35	—	Unverified
5	CoCoOp	Top-1 accuracy %	64.07	—	Unverified
6	MaPLe	Top-1 accuracy %	64.07	—	Unverified
7	POMP	Top-1 accuracy %	63.8	—	Unverified
8	CLIP	Top-1 accuracy %	60.83	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Accuracy	25.3	—	Unverified
2	VPT	Accuracy	24.8	—	Unverified