Prompt Engineering

Prompt engineering is the process of designing and refining the prompts used to generate text from language models, such as GPT-3 or similar models. The goal of prompt engineering is to improve the quality and relevance of the generated text by carefully crafting the prompts to elicit the desired responses from the model.

Prompt engineering involves several steps, including selecting the appropriate model architecture and parameters, designing the prompt format and structure, selecting the appropriate task and training data, and fine-tuning the model using the selected prompt and data.

Prompt engineering is a crucial step in the development of language models, as it can greatly influence the quality and effectiveness of the model's responses. By carefully designing and refining the prompts used to generate text, researchers and developers can improve the accuracy and relevance of the model's output, making it more useful for a wide range of applications, including chatbots, language translation, content creation, and more.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 501–550 of 1236 papers

Title	Date	Tasks	Status	Hype
AI-Driven Virtual Teacher for Enhanced Educational Efficiency: Leveraging Large Pretrain Models for Autonomous Error Analysis and Correction	Sep 14, 2024	Elementary MathematicsPrompt Engineering	—Unverified	0
Propaganda is all you need	Sep 13, 2024	Alignement visualisationAll	CodeCode Available	0
LLM-based Weak Supervision Framework for Query Intent Classification in Video Search	Sep 13, 2024	In-Context Learningintent-classification	—Unverified	0
Contri(e)ve: Context + Retrieve for Scholarly Question Answering	Sep 13, 2024	Information RetrievalKnowledge Graphs	—Unverified	0
What Should We Engineer in Prompts? Training Humans in Requirement-Driven LLM Use	Sep 13, 2024	ChatbotPrompt Engineering	CodeCode Available	1
Fine-tuning Large Language Models for Entity Matching	Sep 12, 2024	Data IntegrationEntity Resolution	CodeCode Available	1
LLM Honeypot: Leveraging Large Language Models as Advanced Interactive Honeypot Systems	Sep 12, 2024	Language ModelingLanguage Modelling	CodeCode Available	0
DrLLM: Prompt-Enhanced Distributed Denial-of-Service Resistance Method with Large Language Models	Sep 11, 2024	Prompt Engineering	CodeCode Available	0
Fine-tuning and Prompt Engineering with Cognitive Knowledge Graphs for Scholarly Knowledge Organization	Sep 10, 2024	ArticlesKnowledge Graphs	—Unverified	0
Beyond designer's knowledge: Generating materials design hypotheses via large language models	Sep 10, 2024	Data IntegrationPrompt Engineering	—Unverified	0
Multimodal Large Language Model Driven Scenario Testing for Autonomous Vehicles	Sep 10, 2024	Autonomous VehiclesLanguage Modeling	—Unverified	0
ChatGPT's Potential in Cryptography Misuse Detection: A Comparative Analysis with Static Analysis Tools	Sep 10, 2024	Prompt Engineering	—Unverified	0
Insights from Benchmarking Frontier Language Models on Web App Code Generation	Sep 8, 2024	BenchmarkingCode Generation	CodeCode Available	1
Combining LLMs and Knowledge Graphs to Reduce Hallucinations in Question Answering	Sep 6, 2024	HallucinationKnowledge Graphs	—Unverified	0
Entity Extraction from High-Level Corruption Schemes via Large Language Models	Sep 5, 2024	ArticlesPrompt Engineering	CodeCode Available	0
RETAIN: Interactive Tool for Regression Testing Guided LLM Migration	Sep 5, 2024	Prompt Engineeringregression	—Unverified	0
Leveraging Large Language Models through Natural Language Processing to provide interpretable Machine Learning predictions of mental deterioration in real time	Sep 5, 2024	ChatbotDiagnostic	—Unverified	0
BEAVER: An Enterprise Benchmark for Text-to-SQL	Sep 3, 2024	Natural Language QueriesPrompt Engineering	—Unverified	0
Language Models Benefit from Preparation with Elicited Knowledge	Sep 2, 2024	Instruction FollowingPrompt Engineering	—Unverified	0
Enhancing AI-Driven Psychological Consultation: Layered Prompts with Large Language Models	Aug 29, 2024	Emotional IntelligencePrompt Engineering	—Unverified	0
Bootstrap Segmentation Foundation Model under Distribution Shift via Object-Centric Learning	Aug 29, 2024	Prompt Engineering	CodeCode Available	0
LLM-assisted Labeling Function Generation for Semantic Type Detection	Aug 28, 2024	Prompt Engineering	—Unverified	0
Evaluating Named Entity Recognition Using Few-Shot Prompting with Large Language Models	Aug 28, 2024	In-Context Learningnamed-entity-recognition	CodeCode Available	1
Toward Automated Simulation Research Workflow through LLM Prompt Engineering Design	Aug 28, 2024	Experimental DesignPrompt Engineering	CodeCode Available	1
Visual Prompt Engineering for Medical Vision Language Models in Radiology	Aug 28, 2024	Classificationimage-classification	—Unverified	0
Toward Large Language Models as a Therapeutic Tool: Comparing Prompting Techniques to Improve GPT-Delivered Problem-Solving Therapy	Aug 27, 2024	Prompt Engineering	—Unverified	0
HPT++: Hierarchically Prompting Vision-Language Models with Multi-Granularity Knowledge Generation and Improved Structure Modeling	Aug 27, 2024	Domain GeneralizationPrompt Engineering	CodeCode Available	2
Atoxia: Red-teaming Large Language Models with Target Toxic Answers	Aug 27, 2024	Prompt EngineeringRed Teaming	—Unverified	0
Vision-Language and Large Language Model Performance in Gastroenterology: GPT, Claude, Llama, Phi, Mistral, Gemma, and Quantized Models	Aug 25, 2024	Language ModelingLanguage Modelling	CodeCode Available	0
Towards Reliable Medical Question Answering: Techniques and Challenges in Mitigating Hallucinations in Language Models	Aug 25, 2024	Decision MakingHallucination	—Unverified	0
Can LLM be a Good Path Planner based on Prompt Engineering? Mitigating the Hallucination for Path Planning	Aug 23, 2024	HallucinationPrompt Engineering	—Unverified	0
Understanding Defects in Generated Codes by Language Models	Aug 23, 2024	Code GenerationPrompt Engineering	—Unverified	0
What Do You Want? User-centric Prompt Generation for Text-to-image Synthesis via Multi-turn Guidance	Aug 23, 2024	Image GenerationPrompt Engineering	CodeCode Available	0
Controllable Text Generation for Large Language Models: A Survey	Aug 22, 2024	AttributePrompt Engineering	CodeCode Available	3
Towards Analyzing and Mitigating Sycophancy in Large Vision-Language Models	Aug 21, 2024	HallucinationPrompt Engineering	—Unverified	0
Probabilistic Medical Predictions of Large Language Models	Aug 21, 2024	Decision MakingPrompt Engineering	—Unverified	0
EEG-Defender: Defending against Jailbreak through Early Exit Generation of Large Language Models	Aug 21, 2024	EEGPrompt Engineering	—Unverified	0
EPiC: Cost-effective Search-based Prompt Engineering of LLMs for Code Generation	Aug 20, 2024	Code GenerationPrompt Engineering	CodeCode Available	1
GS-KGC: A Generative Subgraph-based Framework for Knowledge Graph Completion with Large Language Models	Aug 20, 2024	Knowledge Graph CompletionKnowledge Graphs	—Unverified	0
V-RoAst: Visual Road Assessment. Can VLM be a Road Safety Assessor Using the iRAP Standard?	Aug 20, 2024	Few-Shot LearningIn-Context Learning	CodeCode Available	1
Revisiting VerilogEval: A Year of Improvements in Large-Language Models for Hardware Code Generation	Aug 20, 2024	Code CompletionCode Generation	CodeCode Available	3
QPO: Query-dependent Prompt Optimization via Multi-Loop Offline Reinforcement Learning	Aug 20, 2024	BenchmarkingLanguage Modelling	—Unverified	0
GoNoGo: An Efficient LLM-based Multi-Agent System for Streamlining Automotive Software Release Decision-Making	Aug 19, 2024	Decision MakingPrompt Engineering	—Unverified	0
When Raw Data Prevails: Are Large Language Model Embeddings Effective in Numerical Data Representation for Medical Machine Learning Applications?	Aug 15, 2024	Language ModelingLanguage Modelling	—Unverified	0
Dual-Domain CLIP-Assisted Residual Optimization Perception Model for Metal Artifact Reduction	Aug 14, 2024	Computed Tomography (CT)Contrastive Learning	—Unverified	0
Fast Training Dataset Attribution via In-Context Learning	Aug 14, 2024	In-Context LearningPrompt Engineering	—Unverified	0
Leveraging Language Models for Emotion and Behavior Analysis in Education	Aug 13, 2024	Prompt Engineering	—Unverified	0
Document-Level Event Extraction with Definition-Driven ICL	Aug 10, 2024	Document-level Event ExtractionEvent Extraction	—Unverified	0
FiSTECH: Financial Style Transfer to Enhance Creativity without Hallucinations in LLMs	Aug 9, 2024	ChatbotHallucination	—Unverified	0
Can GPT-4 Models Detect Misleading Visualizations?	Aug 8, 2024	MisinformationPrompt Engineering	—Unverified	0

Show:10 25 50

← PrevPage 11 of 25Next →

All datasets ImageNet Caltech-101 DTD EuroSAT FGVC-Aircraft Oxford 102 Flower Oxford-IIIT Pet Dataset Stanford Cars SUN397 UCF101 Food-101 ImageNet-A

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	77.62	—	Unverified
2	Customized Ensemble	Harmonic mean	75.49	—	Unverified
3	MMRL	Harmonic mean	74.45	—	Unverified
4	MMRL++	Harmonic mean	74.44	—	Unverified
5	CoPrompt	Harmonic mean	74.33	—	Unverified
6	HPT++	Harmonic mean	74.24	—	Unverified
7	HPT	Harmonic mean	74.17	—	Unverified
8	ProMetaR	Harmonic mean	74.09	—	Unverified
9	MetaPrompt	Harmonic mean	74.02	—	Unverified
10	DePT	Harmonic mean	74.02	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	97.77	—	Unverified
2	HPT++	Harmonic mean	96.96	—	Unverified
3	MMRL++	Harmonic mean	96.75	—	Unverified
4	MMRL	Harmonic mean	96.68	—	Unverified
5	HPT	Harmonic mean	96.65	—	Unverified
6	CoPrompt	Harmonic mean	96.55	—	Unverified
7	MetaPrompt	Harmonic mean	96.32	—	Unverified
8	DePT	Harmonic mean	96.28	—	Unverified
9	ProMetaR	Harmonic mean	96.16	—	Unverified
10	RPO	Harmonic mean	96.03	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	77.94	—	Unverified
2	MMRL++	Harmonic mean	74.46	—	Unverified
3	HPT++	Harmonic mean	74.23	—	Unverified
4	MMRL	Harmonic mean	73.82	—	Unverified
5	CoPrompt	Harmonic mean	72.79	—	Unverified
6	ProMetaR	Harmonic mean	72.31	—	Unverified
7	HPT	Harmonic mean	72.16	—	Unverified
8	PromptSRC	Harmonic mean	71.75	—	Unverified
9	DePT	Harmonic mean	71.09	—	Unverified
10	RPO	Harmonic mean	68.61	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MMRL++	Harmonic mean	91.94	—	Unverified
2	PromptKD	Harmonic mean	89.14	—	Unverified
3	HPT++	Harmonic mean	87.36	—	Unverified
4	MMRL	Harmonic mean	87.21	—	Unverified
5	CoPrompt	Harmonic mean	85.84	—	Unverified
6	ProMetaR	Harmonic mean	85.3	—	Unverified
7	DePT	Harmonic mean	84.88	—	Unverified
8	HPT	Harmonic mean	84.82	—	Unverified
9	MetaPrompt	Harmonic mean	83.38	—	Unverified
10	MaPLe	Harmonic mean	82.35	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	45.17	—	Unverified
2	MMRL++	Harmonic mean	42.24	—	Unverified
3	HPT++	Harmonic mean	41.33	—	Unverified
4	MMRL	Harmonic mean	41.15	—	Unverified
5	DePT	Harmonic mean	40.73	—	Unverified
6	HPT	Harmonic mean	40.28	—	Unverified
7	ProMetaR	Harmonic mean	40.25	—	Unverified
8	PromptSRC	Harmonic mean	40.15	—	Unverified
9	CoPrompt	Harmonic mean	39.76	—	Unverified
10	MetaPrompt	Harmonic mean	38.24	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	90.24	—	Unverified
2	HPT	Harmonic mean	87.16	—	Unverified
3	MMRL++	Harmonic mean	87.01	—	Unverified
4	MMRL	Harmonic mean	86.78	—	Unverified
5	ProMetaR	Harmonic mean	86.7	—	Unverified
6	DePT	Harmonic mean	86.46	—	Unverified
7	PromptSRC	Harmonic mean	85.95	—	Unverified
8	HPT++	Harmonic mean	85.85	—	Unverified
9	CoPrompt	Harmonic mean	85.71	—	Unverified
10	MetaPrompt	Harmonic mean	84.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	97.15	—	Unverified
2	HPT++	Harmonic mean	96.91	—	Unverified
3	CoPrompt	Harmonic mean	96.87	—	Unverified
4	MMRL	Harmonic mean	96.74	—	Unverified
5	HPT	Harmonic mean	96.71	—	Unverified
6	MaPLe	Harmonic mean	96.58	—	Unverified
7	MMRL++	Harmonic mean	96.51	—	Unverified
8	ProMetaR	Harmonic mean	96.49	—	Unverified
9	CoCoOp	Harmonic mean	96.43	—	Unverified
10	DePT	Harmonic mean	96.37	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	83.13	—	Unverified
2	MMRL++	Harmonic mean	78.18	—	Unverified
3	MMRL	Harmonic mean	78.06	—	Unverified
4	DePT	Harmonic mean	77.79	—	Unverified
5	ProMetaR	Harmonic mean	76.72	—	Unverified
6	PromptSRC	Harmonic mean	76.58	—	Unverified
7	CoPrompt	Harmonic mean	75.66	—	Unverified
8	HPT++	Harmonic mean	75.59	—	Unverified
9	HPT	Harmonic mean	75.57	—	Unverified
10	MetaPrompt	Harmonic mean	75.48	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	82.6	—	Unverified
2	CoPrompt	Harmonic mean	81.31	—	Unverified
3	MMRL++	Harmonic mean	81.28	—	Unverified
4	MMRL	Harmonic mean	81.2	—	Unverified
5	HPT++	Harmonic mean	81.11	—	Unverified
6	DePT	Harmonic mean	81.06	—	Unverified
7	HPT	Harmonic mean	80.88	—	Unverified
8	ProMetaR	Harmonic mean	80.82	—	Unverified
9	MetaPrompt	Harmonic mean	80.62	—	Unverified
10	PromptSRC	Harmonic mean	80.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	86.1	—	Unverified
2	MMRL	Harmonic mean	83.89	—	Unverified
3	HPT++	Harmonic mean	83.81	—	Unverified
4	MMRL++	Harmonic mean	83.81	—	Unverified
5	ProMetaR	Harmonic mean	83.25	—	Unverified
6	HPT	Harmonic mean	83.16	—	Unverified
7	CoPrompt	Harmonic mean	83.07	—	Unverified
8	PromptSRC	Harmonic mean	82.74	—	Unverified
9	DePT	Harmonic mean	82.46	—	Unverified
10	MetaPrompt	Harmonic mean	81.35	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	93.05	—	Unverified
2	CoPrompt	Harmonic mean	91.4	—	Unverified
3	MaPLe	Harmonic mean	91.38	—	Unverified
4	ProMetaR	Harmonic mean	91.34	—	Unverified
5	MetaPrompt	Harmonic mean	91.29	—	Unverified
6	DePT	Harmonic mean	91.22	—	Unverified
7	MMRL++	Harmonic mean	91.1	—	Unverified
8	PromptSRC	Harmonic mean	91.1	—	Unverified
9	HPT++	Harmonic mean	91.09	—	Unverified
10	MMRL	Harmonic mean	91.03	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Top-1 accuracy %	51.6	—	Unverified
2	MMRL	Top-1 accuracy %	51.2	—	Unverified
3	HPT++	Top-1 accuracy %	51.18	—	Unverified
4	MaPLe	Top-1 accuracy %	50.9	—	Unverified
5	PromptSRC	Top-1 accuracy %	50.9	—	Unverified
6	HPT	Top-1 accuracy %	50.85	—	Unverified
7	CoCoOp	Top-1 accuracy %	50.63	—	Unverified
8	CoPrompt	Top-1 accuracy %	50.5	—	Unverified
9	CLIP	Top-1 accuracy %	47.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Top-1 accuracy %	77.9	—	Unverified
2	PromptSRC	Top-1 accuracy %	77.8	—	Unverified
3	MMRL	Top-1 accuracy %	77.53	—	Unverified
4	HPT++	Top-1 accuracy %	77.52	—	Unverified
5	CoPrompt	Top-1 accuracy %	77.51	—	Unverified
6	HPT	Top-1 accuracy %	77.38	—	Unverified
7	MaPLe	Top-1 accuracy %	76.98	—	Unverified
8	CoCoOP	Top-1 accuracy %	76.18	—	Unverified
9	CLIP	Top-1 accuracy %	73.96	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Top-1 accuracy %	49.8	—	Unverified
2	PromptSRC	Top-1 accuracy %	49.55	—	Unverified
3	CoPrompt	Top-1 accuracy %	49.43	—	Unverified
4	HPT	Top-1 accuracy %	49.36	—	Unverified
5	HPT++	Top-1 accuracy %	49.28	—	Unverified
6	MMRL	Top-1 accuracy %	49.17	—	Unverified
7	MaPLe	Top-1 accuracy %	49.15	—	Unverified
8	CoCoOp	Top-1 accuracy %	48.75	—	Unverified
9	CLIP	Top-1 accuracy %	46.15	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	HPT++	Top-1 accuracy %	65.31	—	Unverified
2	HPT	Top-1 accuracy %	65.25	—	Unverified
3	MMRL	Top-1 accuracy %	64.47	—	Unverified
4	PromptSRC	Top-1 accuracy %	64.35	—	Unverified
5	CoCoOp	Top-1 accuracy %	64.07	—	Unverified
6	MaPLe	Top-1 accuracy %	64.07	—	Unverified
7	POMP	Top-1 accuracy %	63.8	—	Unverified
8	CLIP	Top-1 accuracy %	60.83	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Accuracy	25.3	—	Unverified
2	VPT	Accuracy	24.8	—	Unverified