Prompt Engineering

Prompt engineering is the process of designing and refining the prompts used to generate text from language models, such as GPT-3 or similar models. The goal of prompt engineering is to improve the quality and relevance of the generated text by carefully crafting the prompts to elicit the desired responses from the model.

Prompt engineering involves several steps, including selecting the appropriate model architecture and parameters, designing the prompt format and structure, selecting the appropriate task and training data, and fine-tuning the model using the selected prompt and data.

Prompt engineering is a crucial step in the development of language models, as it can greatly influence the quality and effectiveness of the model's responses. By carefully designing and refining the prompts used to generate text, researchers and developers can improve the accuracy and relevance of the model's output, making it more useful for a wide range of applications, including chatbots, language translation, content creation, and more.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 651–700 of 1236 papers

Title	Date	Tasks	Status	Hype
InterpreTabNet: Distilling Predictive Signals from Tabular Data by Salient Feature Interpretation	Jun 1, 2024	feature selectionLanguage Modeling	CodeCode Available	1
Easy Problems That LLMs Get Wrong	May 30, 2024	Common Sense ReasoningLogical Reasoning	CodeCode Available	2
Adaptive In-conversation Team Building for Language Model Agents	May 29, 2024	DiversityLanguage Modeling	CodeCode Available	7
Can Graph Learning Improve Planning in LLM-based Agents?	May 29, 2024	Decision MakingGraph Learning	CodeCode Available	2
PromptWizard: Task-Aware Prompt Optimization Framework	May 28, 2024	Computational EfficiencyDiversity	CodeCode Available	7
Automated Real-World Sustainability Data Generation from Images of Buildings	May 28, 2024	Language ModelingLanguage Modelling	—Unverified	0
ORLM: A Customizable Framework in Training Large Models for Automated Optimization Modeling	May 28, 2024	Prompt Engineering	CodeCode Available	3
WirelessLLM: Empowering Large Language Models Towards Wireless Intelligence	May 27, 2024	Prompt EngineeringRetrieval-augmented Generation	—Unverified	0
A Preliminary Empirical Study on Prompt-based Unsupervised Keyphrase Extraction	May 26, 2024	Keyphrase ExtractionPrompt Engineering	—Unverified	0
Adapting PromptORE for Modern History: Information Extraction from Hispanic Monarchy Documents of the XVIth Century	May 24, 2024	Prompt EngineeringRelation	CodeCode Available	0
Optimizing Large Language Models for OpenAPI Code Completion	May 24, 2024	Code CompletionCode Generation	CodeCode Available	2
Detection and Positive Reconstruction of Cognitive Distortion sentences: Mandarin Dataset and Evaluation	May 24, 2024	Prompt EngineeringTransfer Learning	—Unverified	0
What Do You See? Enhancing Zero-Shot Image Classification with Multimodal Large Language Models	May 24, 2024	Classificationimage-classification	CodeCode Available	0
A Lost Opportunity for Vision-Language Models: A Comparative Study of Online Test-Time Adaptation for Vision-Language Models	May 23, 2024	Image ClassificationPrompt Engineering	—Unverified	0
Towards Educator-Driven Tutor Authoring: Generative AI Approaches for Creating Intelligent Tutor Interfaces	May 23, 2024	Prompt Engineering	—Unverified	0
Investigating Persuasion Techniques in Arabic: An Empirical Study Leveraging Large Language Models	May 21, 2024	Binary ClassificationFew-Shot Learning	—Unverified	0
Depth Prompting for Sensor-Agnostic Depth Estimation	May 20, 2024	Depth EstimationMonocular Depth Estimation	CodeCode Available	0
Improving face generation quality and prompt following with synthetic captions	May 17, 2024	Face GenerationImage Generation	—Unverified	0
Revolutionizing Process Mining: A Novel Architecture for ChatGPT Integration and Enhanced User Experience through Optimized Prompt Engineering	May 17, 2024	Prompt Engineering	—Unverified	0
Realistic Evaluation of Toxicity in Large Language Models	May 17, 2024	Prompt Engineering	—Unverified	0
Revisiting OPRO: The Limitations of Small-Scale LLMs as Optimizers	May 16, 2024	Prompt Engineering	—Unverified	0
When Large Language Models Meet Optical Networks: Paving the Way for Automation	May 14, 2024	AI AgentPrompt Engineering	—Unverified	0
Automated Repair of AI Code with Large Language Models and Formal Verification	May 14, 2024	Language ModelingLanguage Modelling	—Unverified	0
Meaning-Typed Programming: Language Abstraction and Runtime for Model-Integrated Applications	May 14, 2024	GSM8KMath	—Unverified	0
Exploring the Potential of Conversational AI Support for Agent-Based Social Simulation Model Design	May 12, 2024	ChatbotPrompt Engineering	—Unverified	0
E2TP: Element to Tuple Prompting Improves Aspect Sentiment Tuple Prediction	May 10, 2024	Aspect-Based Sentiment AnalysisAspect-Based Sentiment Analysis (ABSA)	CodeCode Available	0
Large Language Model in Financial Regulatory Interpretation	May 10, 2024	EthicsLanguage Modeling	—Unverified	0
Exploring the Capabilities of Large Multimodal Models on Dense Text	May 9, 2024	Prompt EngineeringVisual Question Answering (VQA)	CodeCode Available	4
Can We Use Large Language Models to Fill Relevance Judgment Holes?	May 9, 2024	Conversational SearchPrompt Engineering	CodeCode Available	1
Large Language Model-Aided Evolutionary Search for Constrained Multiobjective Optimization	May 9, 2024	Evolutionary AlgorithmsLanguage Modeling	—Unverified	0
Traj-LLM: A New Exploration for Empowering Trajectory Prediction with Pre-trained Large Language Models	May 8, 2024	Autonomous DrivingDecoder	—Unverified	0
FOKE: A Personalized and Explainable Education Framework Integrating Foundation Models, Knowledge Graphs, and Prompt Engineering	May 6, 2024	Knowledge GraphsPrompt Engineering	—Unverified	0
Prompting Task Trees using Gemini: Methodologies and Insights	May 6, 2024	Prompt Engineering	—Unverified	0
CityLLaVA: Efficient Fine-Tuning for VLMs in City Scenario	May 6, 2024	PositionPrediction	CodeCode Available	2
Towards A Human-in-the-Loop LLM Approach to Collaborative Discourse Analysis	May 6, 2024	Prompt Engineering	CodeCode Available	0
Exploring prompts to elicit memorization in masked language model-based named entity recognition	May 5, 2024	Language ModelingLanguage Modelling	—Unverified	0
Can Large Language Models Make the Grade? An Empirical Study Evaluating LLMs Ability to Mark Short Answer Questions in K-12 Education	May 5, 2024	Prompt EngineeringReading Comprehension	—Unverified	0
MedPromptExtract (Medical Data Extraction Tool): Anonymization and Hi-fidelity Automated data extraction using NLP and prompt engineering	May 4, 2024	Information RetrievalLarge Language Model	—Unverified	0
Mothman at SemEval-2024 Task 9: An Iterative System for Chain-of-Thought Prompt Optimization	May 3, 2024	MemorizationPrompt Engineering	—Unverified	0
Aloe: A Family of Fine-tuned Open Healthcare LLMs	May 3, 2024	Prompt EngineeringRed Teaming	CodeCode Available	1
Exploring the Capabilities of Large Language Models for Generating Diverse Design Solutions	May 2, 2024	DiversityPrompt Engineering	CodeCode Available	0
Prompt engineering paradigms for medical applications: scoping review and recommendations for better practices	May 2, 2024	ArticlesPrompt Engineering	—Unverified	0
CACTUS: Chemistry Agent Connecting Tool-Usage to Science	May 2, 2024	Molecular Property PredictionPrompt Engineering	CodeCode Available	1
WIBA: What Is Being Argued? A Comprehensive Approach to Argument Mining	May 1, 2024	Argument MiningLanguage Modelling	CodeCode Available	0
Enhancing Surgical Robots with Embodied Intelligence for Autonomous Ultrasound Scanning	May 1, 2024	Language ModelingLanguage Modelling	—Unverified	0
UMass-BioNLP at MEDIQA-M3G 2024: DermPrompt -- A Systematic Exploration of Prompt Engineering with GPT-4V for Dermatological Diagnosis	Apr 27, 2024	DiagnosticPrompt Engineering	CodeCode Available	0
Probabilistic Inference in Language Models via Twisted Sequential Monte Carlo	Apr 26, 2024	Language ModellingPrompt Engineering	CodeCode Available	1
Semantic Routing for Enhanced Performance of LLM-Assisted Intent-Based 5G Core Network Management and Orchestration	Apr 24, 2024	ManagementPrompt Engineering	CodeCode Available	7
A Mechanism-Based Approach to Mitigating Harms from Persuasive Generative AI	Apr 23, 2024	Prompt EngineeringRed Teaming	—Unverified	0
PRISM: A Promptable and Robust Interactive Segmentation Model with Visual Prompts	Apr 23, 2024	Interactive SegmentationPrompt Engineering	CodeCode Available	1

Show:10 25 50

← PrevPage 14 of 25Next →

All datasets ImageNet Caltech-101 DTD EuroSAT FGVC-Aircraft Oxford 102 Flower Oxford-IIIT Pet Dataset Stanford Cars SUN397 UCF101 Food-101 ImageNet-A

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	77.62	—	Unverified
2	Customized Ensemble	Harmonic mean	75.49	—	Unverified
3	MMRL	Harmonic mean	74.45	—	Unverified
4	MMRL++	Harmonic mean	74.44	—	Unverified
5	CoPrompt	Harmonic mean	74.33	—	Unverified
6	HPT++	Harmonic mean	74.24	—	Unverified
7	HPT	Harmonic mean	74.17	—	Unverified
8	ProMetaR	Harmonic mean	74.09	—	Unverified
9	MetaPrompt	Harmonic mean	74.02	—	Unverified
10	DePT	Harmonic mean	74.02	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	97.77	—	Unverified
2	HPT++	Harmonic mean	96.96	—	Unverified
3	MMRL++	Harmonic mean	96.75	—	Unverified
4	MMRL	Harmonic mean	96.68	—	Unverified
5	HPT	Harmonic mean	96.65	—	Unverified
6	CoPrompt	Harmonic mean	96.55	—	Unverified
7	MetaPrompt	Harmonic mean	96.32	—	Unverified
8	DePT	Harmonic mean	96.28	—	Unverified
9	ProMetaR	Harmonic mean	96.16	—	Unverified
10	RPO	Harmonic mean	96.03	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	77.94	—	Unverified
2	MMRL++	Harmonic mean	74.46	—	Unverified
3	HPT++	Harmonic mean	74.23	—	Unverified
4	MMRL	Harmonic mean	73.82	—	Unverified
5	CoPrompt	Harmonic mean	72.79	—	Unverified
6	ProMetaR	Harmonic mean	72.31	—	Unverified
7	HPT	Harmonic mean	72.16	—	Unverified
8	PromptSRC	Harmonic mean	71.75	—	Unverified
9	DePT	Harmonic mean	71.09	—	Unverified
10	RPO	Harmonic mean	68.61	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MMRL++	Harmonic mean	91.94	—	Unverified
2	PromptKD	Harmonic mean	89.14	—	Unverified
3	HPT++	Harmonic mean	87.36	—	Unverified
4	MMRL	Harmonic mean	87.21	—	Unverified
5	CoPrompt	Harmonic mean	85.84	—	Unverified
6	ProMetaR	Harmonic mean	85.3	—	Unverified
7	DePT	Harmonic mean	84.88	—	Unverified
8	HPT	Harmonic mean	84.82	—	Unverified
9	MetaPrompt	Harmonic mean	83.38	—	Unverified
10	MaPLe	Harmonic mean	82.35	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	45.17	—	Unverified
2	MMRL++	Harmonic mean	42.24	—	Unverified
3	HPT++	Harmonic mean	41.33	—	Unverified
4	MMRL	Harmonic mean	41.15	—	Unverified
5	DePT	Harmonic mean	40.73	—	Unverified
6	HPT	Harmonic mean	40.28	—	Unverified
7	ProMetaR	Harmonic mean	40.25	—	Unverified
8	PromptSRC	Harmonic mean	40.15	—	Unverified
9	CoPrompt	Harmonic mean	39.76	—	Unverified
10	MetaPrompt	Harmonic mean	38.24	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	90.24	—	Unverified
2	HPT	Harmonic mean	87.16	—	Unverified
3	MMRL++	Harmonic mean	87.01	—	Unverified
4	MMRL	Harmonic mean	86.78	—	Unverified
5	ProMetaR	Harmonic mean	86.7	—	Unverified
6	DePT	Harmonic mean	86.46	—	Unverified
7	PromptSRC	Harmonic mean	85.95	—	Unverified
8	HPT++	Harmonic mean	85.85	—	Unverified
9	CoPrompt	Harmonic mean	85.71	—	Unverified
10	MetaPrompt	Harmonic mean	84.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	97.15	—	Unverified
2	HPT++	Harmonic mean	96.91	—	Unverified
3	CoPrompt	Harmonic mean	96.87	—	Unverified
4	MMRL	Harmonic mean	96.74	—	Unverified
5	HPT	Harmonic mean	96.71	—	Unverified
6	MaPLe	Harmonic mean	96.58	—	Unverified
7	MMRL++	Harmonic mean	96.51	—	Unverified
8	ProMetaR	Harmonic mean	96.49	—	Unverified
9	CoCoOp	Harmonic mean	96.43	—	Unverified
10	DePT	Harmonic mean	96.37	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	83.13	—	Unverified
2	MMRL++	Harmonic mean	78.18	—	Unverified
3	MMRL	Harmonic mean	78.06	—	Unverified
4	DePT	Harmonic mean	77.79	—	Unverified
5	ProMetaR	Harmonic mean	76.72	—	Unverified
6	PromptSRC	Harmonic mean	76.58	—	Unverified
7	CoPrompt	Harmonic mean	75.66	—	Unverified
8	HPT++	Harmonic mean	75.59	—	Unverified
9	HPT	Harmonic mean	75.57	—	Unverified
10	MetaPrompt	Harmonic mean	75.48	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	82.6	—	Unverified
2	CoPrompt	Harmonic mean	81.31	—	Unverified
3	MMRL++	Harmonic mean	81.28	—	Unverified
4	MMRL	Harmonic mean	81.2	—	Unverified
5	HPT++	Harmonic mean	81.11	—	Unverified
6	DePT	Harmonic mean	81.06	—	Unverified
7	HPT	Harmonic mean	80.88	—	Unverified
8	ProMetaR	Harmonic mean	80.82	—	Unverified
9	MetaPrompt	Harmonic mean	80.62	—	Unverified
10	PromptSRC	Harmonic mean	80.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	86.1	—	Unverified
2	MMRL	Harmonic mean	83.89	—	Unverified
3	HPT++	Harmonic mean	83.81	—	Unverified
4	MMRL++	Harmonic mean	83.81	—	Unverified
5	ProMetaR	Harmonic mean	83.25	—	Unverified
6	HPT	Harmonic mean	83.16	—	Unverified
7	CoPrompt	Harmonic mean	83.07	—	Unverified
8	PromptSRC	Harmonic mean	82.74	—	Unverified
9	DePT	Harmonic mean	82.46	—	Unverified
10	MetaPrompt	Harmonic mean	81.35	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	93.05	—	Unverified
2	CoPrompt	Harmonic mean	91.4	—	Unverified
3	MaPLe	Harmonic mean	91.38	—	Unverified
4	ProMetaR	Harmonic mean	91.34	—	Unverified
5	MetaPrompt	Harmonic mean	91.29	—	Unverified
6	DePT	Harmonic mean	91.22	—	Unverified
7	MMRL++	Harmonic mean	91.1	—	Unverified
8	PromptSRC	Harmonic mean	91.1	—	Unverified
9	HPT++	Harmonic mean	91.09	—	Unverified
10	MMRL	Harmonic mean	91.03	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Top-1 accuracy %	51.6	—	Unverified
2	MMRL	Top-1 accuracy %	51.2	—	Unverified
3	HPT++	Top-1 accuracy %	51.18	—	Unverified
4	MaPLe	Top-1 accuracy %	50.9	—	Unverified
5	PromptSRC	Top-1 accuracy %	50.9	—	Unverified
6	HPT	Top-1 accuracy %	50.85	—	Unverified
7	CoCoOp	Top-1 accuracy %	50.63	—	Unverified
8	CoPrompt	Top-1 accuracy %	50.5	—	Unverified
9	CLIP	Top-1 accuracy %	47.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Top-1 accuracy %	77.9	—	Unverified
2	PromptSRC	Top-1 accuracy %	77.8	—	Unverified
3	MMRL	Top-1 accuracy %	77.53	—	Unverified
4	HPT++	Top-1 accuracy %	77.52	—	Unverified
5	CoPrompt	Top-1 accuracy %	77.51	—	Unverified
6	HPT	Top-1 accuracy %	77.38	—	Unverified
7	MaPLe	Top-1 accuracy %	76.98	—	Unverified
8	CoCoOP	Top-1 accuracy %	76.18	—	Unverified
9	CLIP	Top-1 accuracy %	73.96	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Top-1 accuracy %	49.8	—	Unverified
2	PromptSRC	Top-1 accuracy %	49.55	—	Unverified
3	CoPrompt	Top-1 accuracy %	49.43	—	Unverified
4	HPT	Top-1 accuracy %	49.36	—	Unverified
5	HPT++	Top-1 accuracy %	49.28	—	Unverified
6	MMRL	Top-1 accuracy %	49.17	—	Unverified
7	MaPLe	Top-1 accuracy %	49.15	—	Unverified
8	CoCoOp	Top-1 accuracy %	48.75	—	Unverified
9	CLIP	Top-1 accuracy %	46.15	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	HPT++	Top-1 accuracy %	65.31	—	Unverified
2	HPT	Top-1 accuracy %	65.25	—	Unverified
3	MMRL	Top-1 accuracy %	64.47	—	Unverified
4	PromptSRC	Top-1 accuracy %	64.35	—	Unverified
5	CoCoOp	Top-1 accuracy %	64.07	—	Unverified
6	MaPLe	Top-1 accuracy %	64.07	—	Unverified
7	POMP	Top-1 accuracy %	63.8	—	Unverified
8	CLIP	Top-1 accuracy %	60.83	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Accuracy	25.3	—	Unverified
2	VPT	Accuracy	24.8	—	Unverified