Prompt Engineering

Prompt engineering is the process of designing and refining the prompts used to generate text from language models, such as GPT-3 or similar models. The goal of prompt engineering is to improve the quality and relevance of the generated text by carefully crafting the prompts to elicit the desired responses from the model.

Prompt engineering involves several steps, including selecting the appropriate model architecture and parameters, designing the prompt format and structure, selecting the appropriate task and training data, and fine-tuning the model using the selected prompt and data.

Prompt engineering is a crucial step in the development of language models, as it can greatly influence the quality and effectiveness of the model's responses. By carefully designing and refining the prompts used to generate text, researchers and developers can improve the accuracy and relevance of the model's output, making it more useful for a wide range of applications, including chatbots, language translation, content creation, and more.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 601–650 of 1236 papers

Title	Date	Tasks	Status
LLMStinger: Jailbreaking LLMs using RL fine-tuned LLMs	Nov 13, 2024	Prompt EngineeringRed Teaming	—Unverified
Responsible AI in Construction Safety: Systematic Evaluation of Large Language Models and Prompt Engineering	Nov 13, 2024	ManagementPrompt Engineering	—Unverified
Likelihood as a Performance Gauge for Retrieval-Augmented Generation	Nov 12, 2024	Language ModelingLanguage Modelling	CodeCode Available
Evaluating ChatGPT-3.5 Efficiency in Solving Coding Problems of Different Complexity Levels: An Empirical Analysis	Nov 12, 2024	Prompt Engineering	CodeCode Available
Efficient and Accurate Prompt Optimization: the Benefit of Memory in Exemplar-Guided Reflection	Nov 12, 2024	Prompt Engineering	—Unverified
Reverse Prompt Engineering	Nov 11, 2024	Language ModelingLanguage Modelling	—Unverified
Leveraging Retrieval-Augmented Generation for Persian University Knowledge Retrieval	Nov 9, 2024	Information RetrievalPrompt Engineering	—Unverified
Qwen2.5-32B: Leveraging Self-Consistent Tool-Integrated Reasoning for Bengali Mathematical Olympiad Problem Solving	Nov 8, 2024	Prompt EngineeringQuantization	—Unverified
Web Archives Metadata Generation with GPT-4o: Challenges and Insights	Nov 8, 2024	Prompt Engineering	CodeCode Available
Selecting Between BERT and GPT for Text Classification in Political Science Research	Nov 7, 2024	Few-Shot LearningPrompt Engineering	—Unverified
Leveraging LLMs to Enable Natural Language Search on Go-to-market Platforms	Nov 7, 2024	Natural Language QueriesPrompt Engineering	—Unverified
From Medprompt to o1: Exploration of Run-Time Strategies for Medical Challenge Problems and Beyond	Nov 6, 2024	In-Context LearningPrompt Engineering	—Unverified
Prompt Engineering Using GPT for Word-Level Code-Mixed Language Identification in Low-Resource Dravidian Languages	Nov 6, 2024	Information RetrievalLanguage Identification	—Unverified
MRJ-Agent: An Effective Jailbreak Agent for Multi-Round Dialogue	Nov 6, 2024	Prompt Engineering	—Unverified
Leveraging Vision-Language Models for Manufacturing Feature Recognition in CAD Designs	Nov 5, 2024	Few-Shot LearningHallucination	—Unverified
Automated, LLM enabled extraction of synthesis details for reticular materials from scientific literature	Nov 5, 2024	HallucinationIn-Context Learning	—Unverified
DiffLM: Controllable Synthetic Data Generation via Diffusion Language Models	Nov 5, 2024	Prompt EngineeringSynthetic Data Generation	—Unverified
Explainable cognitive decline detection in free dialogues with a Machine Learning approach based on pre-trained Large Language Models	Nov 4, 2024	Feature EngineeringPrompt Engineering	—Unverified
Defining and Evaluating Physical Safety for Large Language Models	Nov 4, 2024	Code GenerationIn-Context Learning	—Unverified
Ask, and it shall be given: On the Turing completeness of prompting	Nov 4, 2024	Prompt Engineering	CodeCode Available
Evaluating the Ability of Large Language Models to Generate Verifiable Specifications in VeriFast	Nov 4, 2024	Code GenerationPrompt Engineering	—Unverified
Ontology Population using LLMs	Nov 3, 2024	Data IntegrationKnowledge Graphs	—Unverified
An Exploration of Higher Education Course Evaluation by Large Language Models	Nov 3, 2024	Decision MakingPrompt Engineering	—Unverified
Large Language Models for Patient Comments Multi-Label Classification	Oct 31, 2024	De-identificationFew-Shot Learning	—Unverified
Schema Augmentation for Zero-Shot Domain Adaptation in Dialogue State Tracking	Oct 31, 2024	Data AugmentationDialogue State Tracking	—Unverified
Leveraging Large Language Models for Code Translation and Software Development in Scientific Computing	Oct 31, 2024	Code TranslationPrompt Engineering	CodeCode Available
Automatic programming via large language models with population self-evolution for dynamic job shop scheduling problem	Oct 30, 2024	Deep Reinforcement LearningEvolutionary Algorithms	—Unverified
A Comparison of Prompt Engineering Techniques for Task Planning and Execution in Service Robotics	Oct 30, 2024	General KnowledgePrompt Engineering	CodeCode Available
Combining Domain-Specific Models and LLMs for Automated Disease Phenotyping from Survey Data	Oct 28, 2024	Logical Reasoningnamed-entity-recognition	—Unverified
From Cool Demos to Production-Ready FMware: Core Challenges and a Technology Roadmap	Oct 28, 2024	Prompt Engineering	—Unverified
Rethinking Data Synthesis: A Teacher Model Training Recipe with Interpretation	Oct 27, 2024	GSM8KLanguage Modeling	—Unverified
Generative AI in Health Economics and Outcomes Research: A Taxonomy of Key Definitions and Emerging Applications, an ISPOR Working Group Report	Oct 26, 2024	Prompt EngineeringRetrieval-augmented Generation	—Unverified
Introducing MAPO: Momentum-Aided Gradient Descent Prompt Optimization	Oct 25, 2024	Prompt Engineering	—Unverified
Provable optimal transport with transformers: The essence of depth and prompt engineering	Oct 25, 2024	Prompt Engineering	CodeCode Available
Intelligent Understanding of Large Language Models in Traditional Chinese Medicine Based on Prompt Engineering Framework	Oct 25, 2024	Prompt Engineering	—Unverified
Investigating the Role of Prompting and External Tools in Hallucination Rates of Large Language Models	Oct 25, 2024	HallucinationPrompt Engineering	—Unverified
Inference time LLM alignment in single and multidomain preference spectrum	Oct 24, 2024	Model EditingPrompt Engineering	—Unverified
Lightweight Neural App Control	Oct 23, 2024	Decision MakingLanguage Modeling	—Unverified
Benchmarking Foundation Models on Exceptional Cases: Dataset Creation and Validation	Oct 23, 2024	ArticlesBenchmarking	CodeCode Available
GeoCode-GPT: A Large Language Model for Geospatial Code Generation Tasks	Oct 22, 2024	Code GenerationCode Summarization	—Unverified
DNAHLM -- DNA sequence and Human Language mixed large language Model	Oct 22, 2024	Language ModelingLanguage Modelling	CodeCode Available
PromptHive: Bringing Subject Matter Experts Back to the Forefront with Collaborative Prompt Engineering for Educational Content Creation	Oct 21, 2024	MathPrompt Engineering	—Unverified
Generative Design of Functional Metal Complexes Utilizing the Internal Knowledge of Large Language Models	Oct 21, 2024	Prompt Engineering	—Unverified
Comparative Study of Multilingual Idioms and Similes in Large Language Models	Oct 21, 2024	Prompt Engineering	CodeCode Available
A Prompt Engineering Approach and a Knowledge Graph based Framework for Tackling Legal Implications of Large Language Model Answers	Oct 19, 2024	Language ModelingLanguage Modelling	—Unverified
A Prompt Refinement-based Large Language Model for Metro Passenger Flow Forecasting under Delay Conditions	Oct 19, 2024	DescriptiveFew-Shot Learning	—Unverified
Rationale Behind Essay Scores: Enhancing S-LLM's Multi-Trait Essay Scoring with Rationale Generated by LLMs	Oct 18, 2024	Automated Essay ScoringLanguage Modeling	—Unverified
CLIP-VAD: Exploiting Vision-Language Models for Voice Activity Detection	Oct 18, 2024	Action DetectionActivity Detection	—Unverified
CELI: Controller-Embedded Language Model Interactions	Oct 18, 2024	ArticlesCode Generation	—Unverified
ChartifyText: Automated Chart Generation from Data-Involved Texts via LLM	Oct 18, 2024	Prompt Engineering	—Unverified

Show:10 25 50

← PrevPage 13 of 25Next →

All datasets ImageNet Caltech-101 DTD EuroSAT FGVC-Aircraft Oxford 102 Flower Oxford-IIIT Pet Dataset Stanford Cars SUN397 UCF101 Food-101 ImageNet-A

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	77.62	—	Unverified
2	Customized Ensemble	Harmonic mean	75.49	—	Unverified
3	MMRL	Harmonic mean	74.45	—	Unverified
4	MMRL++	Harmonic mean	74.44	—	Unverified
5	CoPrompt	Harmonic mean	74.33	—	Unverified
6	HPT++	Harmonic mean	74.24	—	Unverified
7	HPT	Harmonic mean	74.17	—	Unverified
8	ProMetaR	Harmonic mean	74.09	—	Unverified
9	MetaPrompt	Harmonic mean	74.02	—	Unverified
10	DePT	Harmonic mean	74.02	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	97.77	—	Unverified
2	HPT++	Harmonic mean	96.96	—	Unverified
3	MMRL++	Harmonic mean	96.75	—	Unverified
4	MMRL	Harmonic mean	96.68	—	Unverified
5	HPT	Harmonic mean	96.65	—	Unverified
6	CoPrompt	Harmonic mean	96.55	—	Unverified
7	MetaPrompt	Harmonic mean	96.32	—	Unverified
8	DePT	Harmonic mean	96.28	—	Unverified
9	ProMetaR	Harmonic mean	96.16	—	Unverified
10	RPO	Harmonic mean	96.03	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	77.94	—	Unverified
2	MMRL++	Harmonic mean	74.46	—	Unverified
3	HPT++	Harmonic mean	74.23	—	Unverified
4	MMRL	Harmonic mean	73.82	—	Unverified
5	CoPrompt	Harmonic mean	72.79	—	Unverified
6	ProMetaR	Harmonic mean	72.31	—	Unverified
7	HPT	Harmonic mean	72.16	—	Unverified
8	PromptSRC	Harmonic mean	71.75	—	Unverified
9	DePT	Harmonic mean	71.09	—	Unverified
10	RPO	Harmonic mean	68.61	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MMRL++	Harmonic mean	91.94	—	Unverified
2	PromptKD	Harmonic mean	89.14	—	Unverified
3	HPT++	Harmonic mean	87.36	—	Unverified
4	MMRL	Harmonic mean	87.21	—	Unverified
5	CoPrompt	Harmonic mean	85.84	—	Unverified
6	ProMetaR	Harmonic mean	85.3	—	Unverified
7	DePT	Harmonic mean	84.88	—	Unverified
8	HPT	Harmonic mean	84.82	—	Unverified
9	MetaPrompt	Harmonic mean	83.38	—	Unverified
10	MaPLe	Harmonic mean	82.35	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	45.17	—	Unverified
2	MMRL++	Harmonic mean	42.24	—	Unverified
3	HPT++	Harmonic mean	41.33	—	Unverified
4	MMRL	Harmonic mean	41.15	—	Unverified
5	DePT	Harmonic mean	40.73	—	Unverified
6	HPT	Harmonic mean	40.28	—	Unverified
7	ProMetaR	Harmonic mean	40.25	—	Unverified
8	PromptSRC	Harmonic mean	40.15	—	Unverified
9	CoPrompt	Harmonic mean	39.76	—	Unverified
10	MetaPrompt	Harmonic mean	38.24	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	90.24	—	Unverified
2	HPT	Harmonic mean	87.16	—	Unverified
3	MMRL++	Harmonic mean	87.01	—	Unverified
4	MMRL	Harmonic mean	86.78	—	Unverified
5	ProMetaR	Harmonic mean	86.7	—	Unverified
6	DePT	Harmonic mean	86.46	—	Unverified
7	PromptSRC	Harmonic mean	85.95	—	Unverified
8	HPT++	Harmonic mean	85.85	—	Unverified
9	CoPrompt	Harmonic mean	85.71	—	Unverified
10	MetaPrompt	Harmonic mean	84.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	97.15	—	Unverified
2	HPT++	Harmonic mean	96.91	—	Unverified
3	CoPrompt	Harmonic mean	96.87	—	Unverified
4	MMRL	Harmonic mean	96.74	—	Unverified
5	HPT	Harmonic mean	96.71	—	Unverified
6	MaPLe	Harmonic mean	96.58	—	Unverified
7	MMRL++	Harmonic mean	96.51	—	Unverified
8	ProMetaR	Harmonic mean	96.49	—	Unverified
9	CoCoOp	Harmonic mean	96.43	—	Unverified
10	DePT	Harmonic mean	96.37	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	83.13	—	Unverified
2	MMRL++	Harmonic mean	78.18	—	Unverified
3	MMRL	Harmonic mean	78.06	—	Unverified
4	DePT	Harmonic mean	77.79	—	Unverified
5	ProMetaR	Harmonic mean	76.72	—	Unverified
6	PromptSRC	Harmonic mean	76.58	—	Unverified
7	CoPrompt	Harmonic mean	75.66	—	Unverified
8	HPT++	Harmonic mean	75.59	—	Unverified
9	HPT	Harmonic mean	75.57	—	Unverified
10	MetaPrompt	Harmonic mean	75.48	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	82.6	—	Unverified
2	CoPrompt	Harmonic mean	81.31	—	Unverified
3	MMRL++	Harmonic mean	81.28	—	Unverified
4	MMRL	Harmonic mean	81.2	—	Unverified
5	HPT++	Harmonic mean	81.11	—	Unverified
6	DePT	Harmonic mean	81.06	—	Unverified
7	HPT	Harmonic mean	80.88	—	Unverified
8	ProMetaR	Harmonic mean	80.82	—	Unverified
9	MetaPrompt	Harmonic mean	80.62	—	Unverified
10	PromptSRC	Harmonic mean	80.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	86.1	—	Unverified
2	MMRL	Harmonic mean	83.89	—	Unverified
3	HPT++	Harmonic mean	83.81	—	Unverified
4	MMRL++	Harmonic mean	83.81	—	Unverified
5	ProMetaR	Harmonic mean	83.25	—	Unverified
6	HPT	Harmonic mean	83.16	—	Unverified
7	CoPrompt	Harmonic mean	83.07	—	Unverified
8	PromptSRC	Harmonic mean	82.74	—	Unverified
9	DePT	Harmonic mean	82.46	—	Unverified
10	MetaPrompt	Harmonic mean	81.35	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	93.05	—	Unverified
2	CoPrompt	Harmonic mean	91.4	—	Unverified
3	MaPLe	Harmonic mean	91.38	—	Unverified
4	ProMetaR	Harmonic mean	91.34	—	Unverified
5	MetaPrompt	Harmonic mean	91.29	—	Unverified
6	DePT	Harmonic mean	91.22	—	Unverified
7	MMRL++	Harmonic mean	91.1	—	Unverified
8	PromptSRC	Harmonic mean	91.1	—	Unverified
9	HPT++	Harmonic mean	91.09	—	Unverified
10	MMRL	Harmonic mean	91.03	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Top-1 accuracy %	51.6	—	Unverified
2	MMRL	Top-1 accuracy %	51.2	—	Unverified
3	HPT++	Top-1 accuracy %	51.18	—	Unverified
4	MaPLe	Top-1 accuracy %	50.9	—	Unverified
5	PromptSRC	Top-1 accuracy %	50.9	—	Unverified
6	HPT	Top-1 accuracy %	50.85	—	Unverified
7	CoCoOp	Top-1 accuracy %	50.63	—	Unverified
8	CoPrompt	Top-1 accuracy %	50.5	—	Unverified
9	CLIP	Top-1 accuracy %	47.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Top-1 accuracy %	77.9	—	Unverified
2	PromptSRC	Top-1 accuracy %	77.8	—	Unverified
3	MMRL	Top-1 accuracy %	77.53	—	Unverified
4	HPT++	Top-1 accuracy %	77.52	—	Unverified
5	CoPrompt	Top-1 accuracy %	77.51	—	Unverified
6	HPT	Top-1 accuracy %	77.38	—	Unverified
7	MaPLe	Top-1 accuracy %	76.98	—	Unverified
8	CoCoOP	Top-1 accuracy %	76.18	—	Unverified
9	CLIP	Top-1 accuracy %	73.96	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Top-1 accuracy %	49.8	—	Unverified
2	PromptSRC	Top-1 accuracy %	49.55	—	Unverified
3	CoPrompt	Top-1 accuracy %	49.43	—	Unverified
4	HPT	Top-1 accuracy %	49.36	—	Unverified
5	HPT++	Top-1 accuracy %	49.28	—	Unverified
6	MMRL	Top-1 accuracy %	49.17	—	Unverified
7	MaPLe	Top-1 accuracy %	49.15	—	Unverified
8	CoCoOp	Top-1 accuracy %	48.75	—	Unverified
9	CLIP	Top-1 accuracy %	46.15	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	HPT++	Top-1 accuracy %	65.31	—	Unverified
2	HPT	Top-1 accuracy %	65.25	—	Unverified
3	MMRL	Top-1 accuracy %	64.47	—	Unverified
4	PromptSRC	Top-1 accuracy %	64.35	—	Unverified
5	CoCoOp	Top-1 accuracy %	64.07	—	Unverified
6	MaPLe	Top-1 accuracy %	64.07	—	Unverified
7	POMP	Top-1 accuracy %	63.8	—	Unverified
8	CLIP	Top-1 accuracy %	60.83	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Accuracy	25.3	—	Unverified
2	VPT	Accuracy	24.8	—	Unverified