Prompt Engineering

Prompt engineering is the process of designing and refining the prompts used to generate text from language models, such as GPT-3 or similar models. The goal of prompt engineering is to improve the quality and relevance of the generated text by carefully crafting the prompts to elicit the desired responses from the model.

Prompt engineering involves several steps, including selecting the appropriate model architecture and parameters, designing the prompt format and structure, selecting the appropriate task and training data, and fine-tuning the model using the selected prompt and data.

Prompt engineering is a crucial step in the development of language models, as it can greatly influence the quality and effectiveness of the model's responses. By carefully designing and refining the prompts used to generate text, researchers and developers can improve the accuracy and relevance of the model's output, making it more useful for a wide range of applications, including chatbots, language translation, content creation, and more.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 151–200 of 1236 papers

Title	Date	Tasks	Status	Hype
Beyond the Next Token: Towards Prompt-Robust Zero-Shot Classification via Efficient Multi-Token Prediction	Apr 4, 2025	AttributeLanguage Modeling	CodeCode Available	1
Large (Vision) Language Models are Unsupervised In-Context Learners	Apr 3, 2025	GSM8KIn-Context Learning	CodeCode Available	1
CoTAL: Human-in-the-Loop Prompt Engineering, Chain-of-Thought Reasoning, and Active Learning for Generalizable Formative Assessment Scoring	Apr 3, 2025	Active LearningPrompt Engineering	—Unverified	0
LearNAT: Learning NL2SQL with AST-guided Task Decomposition for Large Language Models	Apr 3, 2025	Mathematical Problem-SolvingPrompt Engineering	—Unverified	0
GeoRAG: A Question-Answering Approach from a Geographical Perspective	Apr 2, 2025	AttributeGeographic Question Answering	—Unverified	0
Text Speaks Louder than Vision: ASCII Art Reveals Textual Biases in Vision-Language Models	Apr 2, 2025	Prompt Engineering	—Unverified	0
Catastrophic Forgetting in LLMs: A Comparative Analysis Across Language Tasks	Apr 1, 2025	CoLAContinual Learning	—Unverified	0
A Systematic Evaluation of LLM Strategies for Mental Health Text Analysis: Fine-tuning vs. Prompt Engineering vs. RAG	Mar 31, 2025	Emotion ClassificationPrompt Engineering	—Unverified	0
GRASP: Municipal Budget AI Chatbots for Enhancing Civic Engagement	Mar 30, 2025	ChatbotInformation Retrieval	—Unverified	0
Task Tokens: A Flexible Approach to Adapting Behavior Foundation Models	Mar 28, 2025	Imitation LearningPrompt Engineering	—Unverified	0
Generative Reliability-Based Design Optimization Using In-Context Learning Capabilities of Large Language Models	Mar 28, 2025	In-Context LearningPrompt Engineering	—Unverified	0
Modeling Challenging Patient Interactions: LLMs for Medical Communication Training	Mar 28, 2025	DiagnosticEmotion Recognition	—Unverified	0
Cognitive Prompts Using Guilford's Structure of Intellect Model	Mar 27, 2025	Decision MakingPosition	—Unverified	0
HyperFree: A Channel-adaptive and Tuning-free Foundation Model for Hyperspectral Remote Sensing Imagery	Mar 27, 2025	Earth ObservationPrompt Engineering	—Unverified	0
Unlocking the Potential of Past Research: Using Generative AI to Reconstruct Healthcare Simulation Models	Mar 27, 2025	Code GenerationPrompt Engineering	—Unverified	0
A Measure Based Generalizable Approach to Understandability	Mar 27, 2025	Prompt Engineering	—Unverified	0
Prompting Vision-Language Model for Nuclei Instance Segmentation and Classification	Mar 27, 2025	Cell SegmentationContrastive Learning	CodeCode Available	0
Patients Speak, AI Listens: LLM-based Analysis of Online Reviews Uncovers Key Drivers for Urgent Care Satisfaction	Mar 26, 2025	Prompt Engineering	—Unverified	0
Unlocking Efficient Long-to-Short LLM Reasoning with Model Merging	Mar 26, 2025	Prompt EngineeringReinforcement Learning (RL)	CodeCode Available	2
A Theoretical Framework for Prompt Engineering: Approximating Smooth Functions with Transformer Prompts	Mar 26, 2025	AI AgentPrompt Engineering	—Unverified	0
LayerCraft: Enhancing Text-to-Image Generation with CoT Reasoning and Layered Object Integration	Mar 25, 2025	Image GenerationObject	CodeCode Available	0
HausaNLP at SemEval-2025 Task 2: Entity-Aware Fine-tuning vs. Prompt Engineering in Entity-Aware Machine Translation	Mar 25, 2025	Machine TranslationPrompt Engineering	—Unverified	0
Optimizing Photonic Structures with Large Language Model Driven Algorithm Discovery	Mar 25, 2025	Language ModelingLanguage Modelling	CodeCode Available	0
Reverse Prompt: Cracking the Recipe Inside Text-to-Image Generation	Mar 25, 2025	Image CaptioningImage Generation	—Unverified	0
MMCR: Advancing Visual Language Model in Multimodal Multi-Turn Contextual Reasoning	Mar 24, 2025	DiagnosticLanguage Modeling	—Unverified	0
Instructing the Architecture Search for Spatial-temporal Sequence Forecasting with LLM	Mar 23, 2025	Neural Architecture SearchPrompt Engineering	—Unverified	0
Strategic Prompt Pricing for AIGC Services: A User-Centric Approach	Mar 23, 2025	Decision MakingPrompt Engineering	—Unverified	0
A Survey on Mathematical Reasoning and Optimization with Large Language Models	Mar 22, 2025	Automated Theorem ProvingHeuristic Search	CodeCode Available	0
When Debate Fails: Bias Reinforcement in Large Language Models	Mar 21, 2025	Decision MakingDiversity	—Unverified	0
Enhancing Zero-Shot Image Recognition in Vision-Language Models through Human-like Concept Guidance	Mar 20, 2025	Prompt EngineeringZero-shot Generalization	—Unverified	0
Bias Evaluation and Mitigation in Retrieval-Augmented Medical Question-Answering Systems	Mar 19, 2025	counterfactualDecision Making	—Unverified	0
Synthetic Data Generation Using Large Language Models: Advances in Text and Code	Mar 18, 2025	Code TranslationPrompt Engineering	—Unverified	0
Organ-aware Multi-scale Medical Image Segmentation Using Text Prompt Engineering	Mar 18, 2025	BenchmarkingDescriptive	—Unverified	0
3DAxisPrompt: Promoting the 3D Grounding and Reasoning in GPT-4o	Mar 17, 2025	Logical ReasoningPrompt Engineering	—Unverified	0
Synthesizing Privacy-Preserving Text Data via Finetuning without Finetuning Billion-Scale LLMs	Mar 16, 2025	ClusteringPrivacy Preserving	—Unverified	0
A Survey on the Optimization of Large Language Model-based Agents	Mar 16, 2025	Decision MakingLanguage Modeling	CodeCode Available	3
Examples as the Prompt: A Scalable Approach for Efficient LLM Adaptation in E-Commerce	Mar 14, 2025	Prompt EngineeringRecommendation Systems	—Unverified	0
Prompt Sentiment: The Catalyst for LLM Change	Mar 14, 2025	Financial AnalysisPrompt Engineering	—Unverified	0
MoLEx: Mixture of Layer Experts for Finetuning with Sparse Upcycling	Mar 14, 2025	Mixture-of-Expertsparameter-efficient fine-tuning	CodeCode Available	0
The Power of One: A Single Example is All it Takes for Segmentation in VLMs	Mar 13, 2025	Allobject-detection	—Unverified	0
"Well, Keep Thinking": Enhancing LLM Reasoning with Adaptive Injection Decoding	Mar 13, 2025	Prompt Engineering	—Unverified	0
Phishsense-1B: A Technical Perspective on an AI-Powered Phishing Detection Model	Mar 13, 2025	Prompt Engineering	—Unverified	0
Rethinking Prompt-based Debiasing in Large Language Models	Mar 12, 2025	Prompt Engineering	—Unverified	0
Evaluating the Generalizability of LLMs in Automated Program Repair	Mar 12, 2025	Program RepairPrompt Engineering	—Unverified	0
Lend a Hand: Semi Training-Free Cued Speech Recognition via MLLM-Driven Hand Modeling for Barrier-free Communication	Mar 11, 2025	Lip ReadingPrompt Engineering	CodeCode Available	0
Modeling Variants of Prompts for Vision-Language Models	Mar 11, 2025	Prompt EngineeringPrompt Learning	CodeCode Available	0
Instruction-Augmented Long-Horizon Planning: Embedding Grounding Mechanisms in Embodied Mobile Manipulation	Mar 11, 2025	Prompt Engineering	—Unverified	0
Bokeh Diffusion: Defocus Blur Control in Text-to-Image Diffusion Models	Mar 11, 2025	Prompt Engineering	—Unverified	0
MMRL: Multi-Modal Representation Learning for Vision-Language Models	Mar 11, 2025	Prompt EngineeringRepresentation Learning	CodeCode Available	2
Benchmarking Chinese Medical LLMs: A Medbench-based Analysis of Performance Gaps and Hierarchical Optimization Strategies	Mar 10, 2025	BenchmarkingEthics	—Unverified	0

Show:10 25 50

← PrevPage 4 of 25Next →

All datasets ImageNet Caltech-101 DTD EuroSAT FGVC-Aircraft Oxford 102 Flower Oxford-IIIT Pet Dataset Stanford Cars SUN397 UCF101 Food-101 ImageNet-A

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	77.62	—	Unverified
2	Customized Ensemble	Harmonic mean	75.49	—	Unverified
3	MMRL	Harmonic mean	74.45	—	Unverified
4	MMRL++	Harmonic mean	74.44	—	Unverified
5	CoPrompt	Harmonic mean	74.33	—	Unverified
6	HPT++	Harmonic mean	74.24	—	Unverified
7	HPT	Harmonic mean	74.17	—	Unverified
8	ProMetaR	Harmonic mean	74.09	—	Unverified
9	MetaPrompt	Harmonic mean	74.02	—	Unverified
10	DePT	Harmonic mean	74.02	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	97.77	—	Unverified
2	HPT++	Harmonic mean	96.96	—	Unverified
3	MMRL++	Harmonic mean	96.75	—	Unverified
4	MMRL	Harmonic mean	96.68	—	Unverified
5	HPT	Harmonic mean	96.65	—	Unverified
6	CoPrompt	Harmonic mean	96.55	—	Unverified
7	MetaPrompt	Harmonic mean	96.32	—	Unverified
8	DePT	Harmonic mean	96.28	—	Unverified
9	ProMetaR	Harmonic mean	96.16	—	Unverified
10	RPO	Harmonic mean	96.03	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	77.94	—	Unverified
2	MMRL++	Harmonic mean	74.46	—	Unverified
3	HPT++	Harmonic mean	74.23	—	Unverified
4	MMRL	Harmonic mean	73.82	—	Unverified
5	CoPrompt	Harmonic mean	72.79	—	Unverified
6	ProMetaR	Harmonic mean	72.31	—	Unverified
7	HPT	Harmonic mean	72.16	—	Unverified
8	PromptSRC	Harmonic mean	71.75	—	Unverified
9	DePT	Harmonic mean	71.09	—	Unverified
10	RPO	Harmonic mean	68.61	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MMRL++	Harmonic mean	91.94	—	Unverified
2	PromptKD	Harmonic mean	89.14	—	Unverified
3	HPT++	Harmonic mean	87.36	—	Unverified
4	MMRL	Harmonic mean	87.21	—	Unverified
5	CoPrompt	Harmonic mean	85.84	—	Unverified
6	ProMetaR	Harmonic mean	85.3	—	Unverified
7	DePT	Harmonic mean	84.88	—	Unverified
8	HPT	Harmonic mean	84.82	—	Unverified
9	MetaPrompt	Harmonic mean	83.38	—	Unverified
10	MaPLe	Harmonic mean	82.35	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	45.17	—	Unverified
2	MMRL++	Harmonic mean	42.24	—	Unverified
3	HPT++	Harmonic mean	41.33	—	Unverified
4	MMRL	Harmonic mean	41.15	—	Unverified
5	DePT	Harmonic mean	40.73	—	Unverified
6	HPT	Harmonic mean	40.28	—	Unverified
7	ProMetaR	Harmonic mean	40.25	—	Unverified
8	PromptSRC	Harmonic mean	40.15	—	Unverified
9	CoPrompt	Harmonic mean	39.76	—	Unverified
10	MetaPrompt	Harmonic mean	38.24	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	90.24	—	Unverified
2	HPT	Harmonic mean	87.16	—	Unverified
3	MMRL++	Harmonic mean	87.01	—	Unverified
4	MMRL	Harmonic mean	86.78	—	Unverified
5	ProMetaR	Harmonic mean	86.7	—	Unverified
6	DePT	Harmonic mean	86.46	—	Unverified
7	PromptSRC	Harmonic mean	85.95	—	Unverified
8	HPT++	Harmonic mean	85.85	—	Unverified
9	CoPrompt	Harmonic mean	85.71	—	Unverified
10	MetaPrompt	Harmonic mean	84.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	97.15	—	Unverified
2	HPT++	Harmonic mean	96.91	—	Unverified
3	CoPrompt	Harmonic mean	96.87	—	Unverified
4	MMRL	Harmonic mean	96.74	—	Unverified
5	HPT	Harmonic mean	96.71	—	Unverified
6	MaPLe	Harmonic mean	96.58	—	Unverified
7	MMRL++	Harmonic mean	96.51	—	Unverified
8	ProMetaR	Harmonic mean	96.49	—	Unverified
9	CoCoOp	Harmonic mean	96.43	—	Unverified
10	DePT	Harmonic mean	96.37	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	83.13	—	Unverified
2	MMRL++	Harmonic mean	78.18	—	Unverified
3	MMRL	Harmonic mean	78.06	—	Unverified
4	DePT	Harmonic mean	77.79	—	Unverified
5	ProMetaR	Harmonic mean	76.72	—	Unverified
6	PromptSRC	Harmonic mean	76.58	—	Unverified
7	CoPrompt	Harmonic mean	75.66	—	Unverified
8	HPT++	Harmonic mean	75.59	—	Unverified
9	HPT	Harmonic mean	75.57	—	Unverified
10	MetaPrompt	Harmonic mean	75.48	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	82.6	—	Unverified
2	CoPrompt	Harmonic mean	81.31	—	Unverified
3	MMRL++	Harmonic mean	81.28	—	Unverified
4	MMRL	Harmonic mean	81.2	—	Unverified
5	HPT++	Harmonic mean	81.11	—	Unverified
6	DePT	Harmonic mean	81.06	—	Unverified
7	HPT	Harmonic mean	80.88	—	Unverified
8	ProMetaR	Harmonic mean	80.82	—	Unverified
9	MetaPrompt	Harmonic mean	80.62	—	Unverified
10	PromptSRC	Harmonic mean	80.52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	86.1	—	Unverified
2	MMRL	Harmonic mean	83.89	—	Unverified
3	HPT++	Harmonic mean	83.81	—	Unverified
4	MMRL++	Harmonic mean	83.81	—	Unverified
5	ProMetaR	Harmonic mean	83.25	—	Unverified
6	HPT	Harmonic mean	83.16	—	Unverified
7	CoPrompt	Harmonic mean	83.07	—	Unverified
8	PromptSRC	Harmonic mean	82.74	—	Unverified
9	DePT	Harmonic mean	82.46	—	Unverified
10	MetaPrompt	Harmonic mean	81.35	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PromptKD	Harmonic mean	93.05	—	Unverified
2	CoPrompt	Harmonic mean	91.4	—	Unverified
3	MaPLe	Harmonic mean	91.38	—	Unverified
4	ProMetaR	Harmonic mean	91.34	—	Unverified
5	MetaPrompt	Harmonic mean	91.29	—	Unverified
6	DePT	Harmonic mean	91.22	—	Unverified
7	PromptSRC	Harmonic mean	91.1	—	Unverified
8	MMRL++	Harmonic mean	91.1	—	Unverified
9	HPT++	Harmonic mean	91.09	—	Unverified
10	MMRL	Harmonic mean	91.03	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Top-1 accuracy %	51.6	—	Unverified
2	MMRL	Top-1 accuracy %	51.2	—	Unverified
3	HPT++	Top-1 accuracy %	51.18	—	Unverified
4	PromptSRC	Top-1 accuracy %	50.9	—	Unverified
5	MaPLe	Top-1 accuracy %	50.9	—	Unverified
6	HPT	Top-1 accuracy %	50.85	—	Unverified
7	CoCoOp	Top-1 accuracy %	50.63	—	Unverified
8	CoPrompt	Top-1 accuracy %	50.5	—	Unverified
9	CLIP	Top-1 accuracy %	47.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Top-1 accuracy %	77.9	—	Unverified
2	PromptSRC	Top-1 accuracy %	77.8	—	Unverified
3	MMRL	Top-1 accuracy %	77.53	—	Unverified
4	HPT++	Top-1 accuracy %	77.52	—	Unverified
5	CoPrompt	Top-1 accuracy %	77.51	—	Unverified
6	HPT	Top-1 accuracy %	77.38	—	Unverified
7	MaPLe	Top-1 accuracy %	76.98	—	Unverified
8	CoCoOP	Top-1 accuracy %	76.18	—	Unverified
9	CLIP	Top-1 accuracy %	73.96	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Top-1 accuracy %	49.8	—	Unverified
2	PromptSRC	Top-1 accuracy %	49.55	—	Unverified
3	CoPrompt	Top-1 accuracy %	49.43	—	Unverified
4	HPT	Top-1 accuracy %	49.36	—	Unverified
5	HPT++	Top-1 accuracy %	49.28	—	Unverified
6	MMRL	Top-1 accuracy %	49.17	—	Unverified
7	MaPLe	Top-1 accuracy %	49.15	—	Unverified
8	CoCoOp	Top-1 accuracy %	48.75	—	Unverified
9	CLIP	Top-1 accuracy %	46.15	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	HPT++	Top-1 accuracy %	65.31	—	Unverified
2	HPT	Top-1 accuracy %	65.25	—	Unverified
3	MMRL	Top-1 accuracy %	64.47	—	Unverified
4	PromptSRC	Top-1 accuracy %	64.35	—	Unverified
5	CoCoOp	Top-1 accuracy %	64.07	—	Unverified
6	MaPLe	Top-1 accuracy %	64.07	—	Unverified
7	POMP	Top-1 accuracy %	63.8	—	Unverified
8	CLIP	Top-1 accuracy %	60.83	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	POMP	Accuracy	25.3	—	Unverified
2	VPT	Accuracy	24.8	—	Unverified