Prompt Engineering

Prompt engineering is the process of designing and refining the prompts used to generate text from language models, such as GPT-3 or similar models. The goal of prompt engineering is to improve the quality and relevance of the generated text by carefully crafting the prompts to elicit the desired responses from the model.

Prompt engineering involves several steps, including selecting the appropriate model architecture and parameters, designing the prompt format and structure, selecting the appropriate task and training data, and fine-tuning the model using the selected prompt and data.

Prompt engineering is a crucial step in the development of language models, as it can greatly influence the quality and effectiveness of the model's responses. By carefully designing and refining the prompts used to generate text, researchers and developers can improve the accuracy and relevance of the model's output, making it more useful for a wide range of applications, including chatbots, language translation, content creation, and more.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 401–450 of 1236 papers

Title	Date	Tasks	Status
Dual-Modal Prototype Joint Learning for Compositional Zero-Shot Learning	Jan 23, 2025	Compositional Zero-Shot LearningPrompt Engineering	—Unverified
Enhancing Agricultural Machinery Management through Advanced LLM Integration	Jul 30, 2024	Decision MakingManagement	—Unverified
Enhancing AI-Driven Psychological Consultation: Layered Prompts with Large Language Models	Aug 29, 2024	Emotional IntelligencePrompt Engineering	—Unverified
Applying Large Language Models and Chain-of-Thought for Automatic Scoring	Nov 30, 2023	Few-Shot LearningPrompt Engineering	—Unverified
Enhancing Computer Programming Education with LLMs: A Study on Effective Prompt Engineering for Python Code Generation	Jul 7, 2024	Code GenerationPrompt Engineering	—Unverified
Enhancing Generalization in Chain of Thought Reasoning for Smaller Models	Jan 16, 2025	Knowledge DistillationMemorization	—Unverified
A Foundation Model for Cell Segmentation	Nov 18, 2023	Cell Segmentationmodel	—Unverified
Enhancing Medical Task Performance in GPT-4V: A Comprehensive Study on Prompt Engineering Strategies	Dec 7, 2023	DiagnosticLanguage Modeling	—Unverified
Few-Shot Learning for Chronic Disease Management: Leveraging Large Language Models and Multi-Prompt Engineering with Medical Knowledge Injection	Jan 16, 2024	Depression DetectionFeature Engineering	—Unverified
Dual-Domain CLIP-Assisted Residual Optimization Perception Model for Metal Artifact Reduction	Aug 14, 2024	Computed Tomography (CT)Contrastive Learning	—Unverified
Enhancing Summarization Performance through Transformer-Based Prompt Engineering in Automated Medical Reporting	Nov 22, 2023	Prompt Engineering	—Unverified
Enhancing Surgical Robots with Embodied Intelligence for Autonomous Ultrasound Scanning	May 1, 2024	Language ModelingLanguage Modelling	—Unverified
Convergences and Divergences between Automatic Assessment and Human Evaluation: Insights from Comparing ChatGPT-Generated Translation and Neural Machine Translation	Jan 10, 2024	Machine TranslationNMT	—Unverified
Enhancing tutoring systems by leveraging tailored promptings and domain knowledge with Large Language Models	May 2, 2025	Prompt EngineeringRAG	—Unverified
Enhancing Zero-Shot Crypto Sentiment with Fine-tuned Language Model and Prompt Engineering	Oct 20, 2023	Language ModelingLanguage Modelling	—Unverified
Enhancing Zero-Shot Image Recognition in Vision-Language Models through Human-like Concept Guidance	Mar 20, 2025	Prompt EngineeringZero-shot Generalization	—Unverified
DSPy Assertions: Computational Constraints for Self-Refining Language Model Pipelines	Dec 20, 2023	Language ModelingLanguage Modelling	—Unverified
Piecing Together Clues: A Benchmark for Evaluating the Detective Skills of Large Language Models	Jul 11, 2023	Common Sense ReasoningDecision Making	—Unverified
Can Generated Images Serve as a Viable Modality for Text-Centric Multimodal Learning?	Jun 21, 2025	Language ModelingLanguage Modelling	—Unverified
DreamWalk: Style Space Exploration using Diffusion Guidance	Apr 4, 2024	Prompt Engineering	—Unverified
Can GPT-4 Models Detect Misleading Visualizations?	Aug 8, 2024	MisinformationPrompt Engineering	—Unverified
ERUPD -- English to Roman Urdu Parallel Dataset	Dec 23, 2024	Machine TranslationPrompt Engineering	—Unverified
Applying Fine-Tuned LLMs for Reducing Data Needs in Load Profile Analysis	Jun 2, 2024	Few-Shot LearningPrompt Engineering	—Unverified
Bias Evaluation and Mitigation in Retrieval-Augmented Medical Question-Answering Systems	Mar 19, 2025	counterfactualDecision Making	—Unverified
Federated Foundation Models: Privacy-Preserving and Collaborative Learning for Large Models	May 19, 2023	Federated LearningLifelong learning	—Unverified
Evaluating ChatGPT as a Question Answering System: A Comprehensive Analysis and Comparison with Existing Models	Dec 11, 2023	HallucinationLanguage Modelling	—Unverified
Evaluating ChatGPT text-mining of clinical records for obesity monitoring	Aug 3, 2023	Language ModelingLanguage Modelling	—Unverified
A Review of Multi-Modal Large Language and Vision Models	Mar 28, 2024	Image CaptioningPrompt Engineering	—Unverified
Can Large Language Models Capture Public Opinion about Global Warming? An Empirical Assessment of Algorithmic Fidelity and Bias	Nov 1, 2023	Model SelectionPrompt Engineering	—Unverified
Evaluating Large Language Models as Virtual Annotators for Time-series Physical Sensing Data	Mar 2, 2024	Prompt EngineeringTime Series	—Unverified
Evaluating LLMs Capabilities Towards Understanding Social Dynamics	Nov 20, 2024	Prompt EngineeringQuestion Answering	—Unverified
Evaluating LLMs for Text-to-SQL Generation With Complex SQL Workload	Jul 28, 2024	Decision MakingPrompt Engineering	—Unverified
Do Prompt Patterns Affect Code Quality? A First Empirical Assessment of ChatGPT-Generated Code	Apr 18, 2025	Code GenerationPrompt Engineering	—Unverified
Evaluating Prompt Engineering Techniques for Accuracy and Confidence Elicitation in Medical LLMs	May 29, 2025	Prompt Engineering	—Unverified
Doppelganger Method: Breaking Role Consistency in LLM Agent via Prompt-based Transferable Adversarial Attack	Jun 17, 2025	Adversarial AttackPrompt Engineering	—Unverified
Evaluating the Bias in LLMs for Surveying Opinion and Decision Making in Healthcare	Apr 11, 2025	Decision MakingPrompt Engineering	—Unverified
Evaluating the Efficacy of Prompt-Engineered Large Multimodal Models Versus Fine-Tuned Vision Transformers in Image-Based Security Applications	Mar 26, 2024	Malware ClassificationPrompt Engineering	—Unverified
Affective Computing in the Era of Large Language Models: A Survey from the NLP Perspective	Jul 30, 2024	Common Sense ReasoningIn-Context Learning	—Unverified
A Chat About Boring Problems: Studying GPT-based text normalization	Sep 23, 2023	Prompt EngineeringText Normalization	—Unverified
Evaluating the Impact of Advanced LLM Techniques on AI-Lecture Tutors for a Robotics Course	Aug 2, 2024	Prompt EngineeringRAG	—Unverified
Evaluation is all you need. Prompting Generative Large Language Models for Annotation Tasks in the Social Sciences. A Primer using Open Models	Dec 30, 2023	AllPrompt Engineering	—Unverified
LocalValueBench: A Collaboratively Built and Extensible Benchmark for Evaluating Localized Value Alignment and Ethical Safety in Large Language Models	Jul 27, 2024	Prompt Engineering	—Unverified
Evaluation of GPT-3.5 and GPT-4 for supporting real-world information needs in healthcare delivery	Apr 26, 2023	Prompt Engineering	—Unverified
Evaluation of the Automated Labeling Method for Taxonomic Nomenclature Through Prompt-Optimized Large Language Model	Mar 8, 2025	Few-Shot LearningLanguage Modeling	—Unverified
Event Temporal Relation Extraction based on Retrieval-Augmented on LLMs	Mar 22, 2024	Event Relation ExtractionPrompt Engineering	—Unverified
EvoFlow: Evolving Diverse Agentic Workflows On The Fly	Feb 11, 2025	Large Language ModelPrompt Engineering	—Unverified
Integration of Large Language Models and Federated Learning	Jul 18, 2023	Federated LearningLanguage Modelling	—Unverified
Evolutionary Multi-Objective Optimization of Large Language Model Prompts for Balancing Sentiments	Jan 18, 2024	Evolutionary AlgorithmsLanguage Modeling	—Unverified
EvoPrompting: Language Models for Code-Level Neural Architecture Search	Feb 28, 2023	Code GenerationEfficient Neural Network	—Unverified
Few-shot Multimodal Multitask Multilingual Learning	Feb 19, 2023	Few-Shot LearningIn-Context Learning	—Unverified

Show:10 25 50

← PrevPage 9 of 25Next →

All datasets ImageNet Caltech-101 DTD EuroSAT FGVC-Aircraft Oxford 102 Flower Oxford-IIIT Pet Dataset Stanford Cars SUN397 UCF101 Food-101 ImageNet-A

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	77.62	—	Unverified
2	Customized Ensemble	Harmonic mean	75.49	—	Unverified
3	MMRL	Harmonic mean	74.45	—	Unverified
4	MMRL++	Harmonic mean	74.44	—	Unverified
5	CoPrompt	Harmonic mean	74.33	—	Unverified
6	HPT++	Harmonic mean	74.24	—	Unverified
7	HPT	Harmonic mean	74.17	—	Unverified
8	ProMetaR	Harmonic mean	74.09	—	Unverified
9	MetaPrompt	Harmonic mean	74.02	—	Unverified
10	DePT	Harmonic mean	74.02	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	97.77	—	Unverified
2	HPT++	Harmonic mean	96.96	—	Unverified
3	MMRL++	Harmonic mean	96.75	—	Unverified
4	MMRL	Harmonic mean	96.68	—	Unverified
5	HPT	Harmonic mean	96.65	—	Unverified
6	CoPrompt	Harmonic mean	96.55	—	Unverified
7	MetaPrompt	Harmonic mean	96.32	—	Unverified
8	DePT	Harmonic mean	96.28	—	Unverified
9	ProMetaR	Harmonic mean	96.16	—	Unverified
10	RPO	Harmonic mean	96.03	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	77.94	—	Unverified
2	MMRL++	Harmonic mean	74.46	—	Unverified
3	HPT++	Harmonic mean	74.23	—	Unverified
4	MMRL	Harmonic mean	73.82	—	Unverified
5	CoPrompt	Harmonic mean	72.79	—	Unverified
6	ProMetaR	Harmonic mean	72.31	—	Unverified
7	HPT	Harmonic mean	72.16	—	Unverified
8	PromptSRC	Harmonic mean	71.75	—	Unverified
9	DePT	Harmonic mean	71.09	—	Unverified
10	RPO	Harmonic mean	68.61	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MMRL++	Harmonic mean	91.94	—	Unverified
2	PromptKD	Harmonic mean	89.14	—	Unverified
3	HPT++	Harmonic mean	87.36	—	Unverified
4	MMRL	Harmonic mean	87.21	—	Unverified
5	CoPrompt	Harmonic mean	85.84	—	Unverified
6	ProMetaR	Harmonic mean	85.3	—	Unverified
7	DePT	Harmonic mean	84.88	—	Unverified
8	HPT	Harmonic mean	84.82	—	Unverified
9	MetaPrompt	Harmonic mean	83.38	—	Unverified
10	MaPLe	Harmonic mean	82.35	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	45.17	—	Unverified
2	MMRL++	Harmonic mean	42.24	—	Unverified
3	HPT++	Harmonic mean	41.33	—	Unverified
4	MMRL	Harmonic mean	41.15	—	Unverified
5	DePT	Harmonic mean	40.73	—	Unverified
6	HPT	Harmonic mean	40.28	—	Unverified
7	ProMetaR	Harmonic mean	40.25	—	Unverified
8	PromptSRC	Harmonic mean	40.15	—	Unverified
9	CoPrompt	Harmonic mean	39.76	—	Unverified
10	MetaPrompt	Harmonic mean	38.24	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	90.24	—	Unverified
2	HPT	Harmonic mean	87.16	—	Unverified
3	MMRL++	Harmonic mean	87.01	—	Unverified
4	MMRL	Harmonic mean	86.78	—	Unverified
5	ProMetaR	Harmonic mean	86.7	—	Unverified
6	DePT	Harmonic mean	86.46	—	Unverified
7	PromptSRC	Harmonic mean	85.95	—	Unverified
8	HPT++	Harmonic mean	85.85	—	Unverified
9	CoPrompt	Harmonic mean	85.71	—	Unverified
10	MetaPrompt	Harmonic mean	84.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	97.15	—	Unverified
2	HPT++	Harmonic mean	96.91	—	Unverified
3	CoPrompt	Harmonic mean	96.87	—	Unverified
4	MMRL	Harmonic mean	96.74	—	Unverified
5	HPT	Harmonic mean	96.71	—	Unverified
6	MaPLe	Harmonic mean	96.58	—	Unverified
7	MMRL++	Harmonic mean	96.51	—	Unverified
8	ProMetaR	Harmonic mean	96.49	—	Unverified
9	CoCoOp	Harmonic mean	96.43	—	Unverified
10	DePT	Harmonic mean	96.37	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	83.13	—	Unverified
2	MMRL++	Harmonic mean	78.18	—	Unverified
3	MMRL	Harmonic mean	78.06	—	Unverified
4	DePT	Harmonic mean	77.79	—	Unverified
5	ProMetaR	Harmonic mean	76.72	—	Unverified
6	PromptSRC	Harmonic mean	76.58	—	Unverified
7	CoPrompt	Harmonic mean	75.66	—	Unverified
8	HPT++	Harmonic mean	75.59	—	Unverified
9	HPT	Harmonic mean	75.57	—	Unverified
10	MetaPrompt	Harmonic mean	75.48	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	82.6	—	Unverified
2	CoPrompt	Harmonic mean	81.31	—	Unverified
3	MMRL++	Harmonic mean	81.28	—	Unverified
4	MMRL	Harmonic mean	81.2	—	Unverified
5	HPT++	Harmonic mean	81.11	—	Unverified
6	DePT	Harmonic mean	81.06	—	Unverified
7	HPT	Harmonic mean	80.88	—	Unverified
8	ProMetaR	Harmonic mean	80.82	—	Unverified
9	MetaPrompt	Harmonic mean	80.62	—	Unverified
10	PromptSRC	Harmonic mean	80.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	86.1	—	Unverified
2	MMRL	Harmonic mean	83.89	—	Unverified
3	HPT++	Harmonic mean	83.81	—	Unverified
4	MMRL++	Harmonic mean	83.81	—	Unverified
5	ProMetaR	Harmonic mean	83.25	—	Unverified
6	HPT	Harmonic mean	83.16	—	Unverified
7	CoPrompt	Harmonic mean	83.07	—	Unverified
8	PromptSRC	Harmonic mean	82.74	—	Unverified
9	DePT	Harmonic mean	82.46	—	Unverified
10	MetaPrompt	Harmonic mean	81.35	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	93.05	—	Unverified
2	CoPrompt	Harmonic mean	91.4	—	Unverified
3	MaPLe	Harmonic mean	91.38	—	Unverified
4	ProMetaR	Harmonic mean	91.34	—	Unverified
5	MetaPrompt	Harmonic mean	91.29	—	Unverified
6	DePT	Harmonic mean	91.22	—	Unverified
7	PromptSRC	Harmonic mean	91.1	—	Unverified
8	MMRL++	Harmonic mean	91.1	—	Unverified
9	HPT++	Harmonic mean	91.09	—	Unverified
10	MMRL	Harmonic mean	91.03	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Top-1 accuracy %	51.6	—	Unverified
2	MMRL	Top-1 accuracy %	51.2	—	Unverified
3	HPT++	Top-1 accuracy %	51.18	—	Unverified
4	PromptSRC	Top-1 accuracy %	50.9	—	Unverified
5	MaPLe	Top-1 accuracy %	50.9	—	Unverified
6	HPT	Top-1 accuracy %	50.85	—	Unverified
7	CoCoOp	Top-1 accuracy %	50.63	—	Unverified
8	CoPrompt	Top-1 accuracy %	50.5	—	Unverified
9	CLIP	Top-1 accuracy %	47.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Top-1 accuracy %	77.9	—	Unverified
2	PromptSRC	Top-1 accuracy %	77.8	—	Unverified
3	MMRL	Top-1 accuracy %	77.53	—	Unverified
4	HPT++	Top-1 accuracy %	77.52	—	Unverified
5	CoPrompt	Top-1 accuracy %	77.51	—	Unverified
6	HPT	Top-1 accuracy %	77.38	—	Unverified
7	MaPLe	Top-1 accuracy %	76.98	—	Unverified
8	CoCoOP	Top-1 accuracy %	76.18	—	Unverified
9	CLIP	Top-1 accuracy %	73.96	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Top-1 accuracy %	49.8	—	Unverified
2	PromptSRC	Top-1 accuracy %	49.55	—	Unverified
3	CoPrompt	Top-1 accuracy %	49.43	—	Unverified
4	HPT	Top-1 accuracy %	49.36	—	Unverified
5	HPT++	Top-1 accuracy %	49.28	—	Unverified
6	MMRL	Top-1 accuracy %	49.17	—	Unverified
7	MaPLe	Top-1 accuracy %	49.15	—	Unverified
8	CoCoOp	Top-1 accuracy %	48.75	—	Unverified
9	CLIP	Top-1 accuracy %	46.15	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	HPT++	Top-1 accuracy %	65.31	—	Unverified
2	HPT	Top-1 accuracy %	65.25	—	Unverified
3	MMRL	Top-1 accuracy %	64.47	—	Unverified
4	PromptSRC	Top-1 accuracy %	64.35	—	Unverified
5	CoCoOp	Top-1 accuracy %	64.07	—	Unverified
6	MaPLe	Top-1 accuracy %	64.07	—	Unverified
7	POMP	Top-1 accuracy %	63.8	—	Unverified
8	CLIP	Top-1 accuracy %	60.83	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Accuracy	25.3	—	Unverified
2	VPT	Accuracy	24.8	—	Unverified