Text Generation

Text Generation is the task of generating text with the goal of appearing indistinguishable to human-written text. This task is more formally known as "natural language generation" in the literature.

Text generation can be addressed with Markov processes or deep generative models like LSTMs. Recently, some of the most advanced methods for text generation include BART, GPT and other GAN-based approaches. Text generation systems are evaluated either through human ratings or automatic evaluation metrics like METEOR, ROUGE, and BLEU.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 251–300 of 5335 papers

Title	Date	Tasks	Status	Hype
MELLM: Exploring LLM-Powered Micro-Expression Understanding Enhanced by Subtle Motion Perception	May 11, 2025	Emotion ClassificationLarge Language Model	CodeCode Available	1
Adaptive Markup Language Generation for Contextually-Grounded Visual Document Understanding	May 8, 2025	document understandingInstruction Following	CodeCode Available	1
UniBiomed: A Universal Foundation Model for Grounded Biomedical Image Interpretation	Apr 30, 2025	DiagnosticLarge Language Model	CodeCode Available	1
Reviving Any-Subset Autoregressive Models with Principled Parallel Sampling and Speculative Decoding	Apr 29, 2025	Code GenerationDensity Estimation	CodeCode Available	1
LLMSR@XLLM25: Less is More: Enhancing Structured Multi-Agent Reasoning via Quality-Guided Distillation	Apr 23, 2025	Text Generation	CodeCode Available	1
AlignRAG: Leveraging Critique Learning for Evidence-Sensitive Retrieval-Augmented Reasoning	Apr 21, 2025	RAGRetrieval	CodeCode Available	1
Understanding the Repeat Curse in Large Language Models from a Feature Perspective	Apr 19, 2025	Text Generation	CodeCode Available	1
ReasonDrive: Efficient Visual Question Answering for Autonomous Vehicles with Reasoning-Enhanced Small Vision-Language Models	Apr 14, 2025	Autonomous DrivingAutonomous Vehicles	CodeCode Available	1
Parameterized Synthetic Text Generation with SimpleStories	Apr 12, 2025	DiversityLanguage Modeling	CodeCode Available	1
Retrieval Augmented Generation with Collaborative Filtering for Personalized Text Generation	Apr 8, 2025	Collaborative FilteringContrastive Learning	CodeCode Available	1
An Empirical Study of GPT-4o Image Generation Capabilities	Apr 8, 2025	BenchmarkingImage Generation	CodeCode Available	1
MSL: Not All Tokens Are What You Need for Tuning LLM as a Recommender	Apr 5, 2025	AllLanguage Modeling	CodeCode Available	1
MEPNet: Medical Entity-balanced Prompting Network for Brain CT Report Generation	Mar 22, 2025	AnatomyLarge Language Model	CodeCode Available	1
Lost-in-the-Middle in Long-Text Generation: Synthetic Dataset, Evaluation Framework, and Mitigation	Mar 10, 2025	Text Generation	CodeCode Available	1
Unleashing the Potential of Large Language Models for Text-to-Image Generation through Autoregressive Representation Alignment	Mar 10, 2025	Domain AdaptationImage Generation	CodeCode Available	1
Q-Filters: Leveraging QK Geometry for Efficient KV Cache Compression	Mar 4, 2025	Text Generation	CodeCode Available	1
Mapping 1,000+ Language Models via the Log-Likelihood Vector	Feb 22, 2025	Text Generation	CodeCode Available	1
Almost AI, Almost Human: The Challenge of Detecting AI-Polished Writing	Feb 21, 2025	Text Generation	CodeCode Available	1
Middle-Layer Representation Alignment for Cross-Lingual Transfer in Fine-Tuned LLMs	Feb 20, 2025	Cross-Lingual TransferMachine Translation	CodeCode Available	1
A Cognitive Writing Perspective for Constrained Long-Form Text Generation	Feb 18, 2025	FormText Generation	CodeCode Available	1
UniGuardian: A Unified Defense for Detecting Prompt Injection, Backdoor Attacks and Adversarial Attacks in Large Language Models	Feb 18, 2025	Text Generation	CodeCode Available	1
Knowledge Graph-Driven Retrieval-Augmented Generation: Integrating Deepseek-R1 with Weaviate for Advanced Chatbot Applications	Feb 16, 2025	ChatbotLanguage Modeling	CodeCode Available	1
ReLearn: Unlearning via Learning for Large Language Models	Feb 16, 2025	Data AugmentationText Generation	CodeCode Available	1
Exposing Numeracy Gaps: A Benchmark to Evaluate Fundamental Numerical Abilities in Large Language Models	Feb 16, 2025	Language ModelingLanguage Modelling	CodeCode Available	1
LANTERN++: Enhancing Relaxed Speculative Decoding with Static Tree Drafting for Visual Auto-regressive Models	Feb 10, 2025	Text Generation	CodeCode Available	1
UniCMs: A Unified Consistency Model For Efficient Multimodal Generation and Understanding	Feb 8, 2025	DenoisingImage Generation	CodeCode Available	1
Polynomial, trigonometric, and tropical activations	Feb 3, 2025	image-classificationImage Classification	CodeCode Available	1
Joint Localization and Activation Editing for Low-Resource Fine-Tuning	Feb 3, 2025	Natural Language Understandingparameter-efficient fine-tuning	CodeCode Available	1
How to Select Datapoints for Efficient Human Evaluation of NLG Models?	Jan 30, 2025	HumanEvalMachine Translation	CodeCode Available	1
Pix2Cap-COCO: Advancing Visual Comprehension via Pixel-Level Captioning	Jan 23, 2025	Panoptic SegmentationText Generation	CodeCode Available	1
Personalized Graph-Based Retrieval for Large Language Models	Jan 4, 2025	Knowledge GraphsRetrieval	CodeCode Available	1
Mitigating Hallucination for Large Vision Language Model by Inter-Modality Correlation Calibration Decoding	Jan 3, 2025	HallucinationLanguage Modeling	CodeCode Available	1
Large Language Models Are Read/Write Policy-Makers for Simultaneous Generation	Jan 1, 2025	Automatic Speech RecognitionDecoder	CodeCode Available	1
Facilitating large language model Russian adaptation with Learned Embedding Propagation	Dec 30, 2024	Language ModelingLanguage Modelling	CodeCode Available	1
A Survey of RWKV	Dec 19, 2024	Natural Language UnderstandingSurvey	CodeCode Available	1
ECG-Byte: A Tokenizer for End-to-End Generative Electrocardiogram Language Modeling	Dec 18, 2024	Language ModelingLanguage Modelling	CodeCode Available	1
Typhoon 2: A Family of Open Text and Multimodal Thai Large Language Models	Dec 18, 2024	document understandingImage Captioning	CodeCode Available	1
AD-LLM: Benchmarking Large Language Models for Anomaly Detection	Dec 15, 2024	Anomaly DetectionBenchmarking	CodeCode Available	1
Concept Bottleneck Large Language Models	Dec 11, 2024	Language ModelingLanguage Modelling	CodeCode Available	1
Truth or Mirage? Towards End-to-End Factuality Evaluation with LLM-Oasis	Nov 29, 2024	BenchmarkingClaim Verification	CodeCode Available	1
OpenING: A Comprehensive Benchmark for Judging Open-ended Interleaved Image-Text Generation	Nov 27, 2024	Image Generationmultimodal generation	CodeCode Available	1
CROW: Eliminating Backdoors from Large Language Models via Internal Consistency Regularization	Nov 18, 2024	backdoor defenseText Generation	CodeCode Available	1
SAM Decoding: Speculative Decoding via Suffix Automaton	Nov 16, 2024	RetrievalText Generation	CodeCode Available	1
Bag of Design Choices for Inference of High-Resolution Masked Generative Transformer	Nov 16, 2024	Text Generation	CodeCode Available	1
Towards Interpreting Language Models: A Case Study in Multi-Hop Reasoning	Nov 6, 2024	Text Generation	CodeCode Available	1
Regress, Don't Guess -- A Regression-like Loss on Number Tokens for Language Models	Nov 4, 2024	Inductive BiasLanguage Modeling	CodeCode Available	1
Explaining and Improving Contrastive Decoding by Extrapolating the Probabilities of a Huge and Hypothetical LM	Nov 3, 2024	LAMBADAText Generation	CodeCode Available	1
NeuGPT: Unified multi-modal Neural GPT	Oct 28, 2024	EEGText Generation	CodeCode Available	1
Peptide-GPT: Generative Design of Peptides using Generative Pre-trained Transformers and Bio-informatic Supervision	Oct 25, 2024	Language ModellingProtein Design	CodeCode Available	1
Not All Heads Matter: A Head-Level KV Cache Compression Method with Integrated Retrieval and Reasoning	Oct 25, 2024	AllComputational Efficiency	CodeCode Available	1

Show:10 25 50

← PrevPage 6 of 107Next →

All datasets DART COCO Captions EMNLP2017 WMT ReDial CommonGen ROCStories Chinese Poems Czech restaurant information OpenWebText SciQ Yahoo Questions ADGEN

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	T5B Baseline	BLEU	48.74	—	Unverified
2	FactT5B	BLEU	48.37	—	Unverified
3	JointGT Baseline	BLEU	47.51	—	Unverified
4	FactJointGT	BLEU	47.39	—	Unverified
5	Control Prefixes (T5-large)	METEOR	0.41	—	Unverified
6	T5	METEOR	0.12	—	Unverified
7	BART	METEOR	0.11	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LeakGAN	BLEU-2	0.95	—	Unverified
2	partGAN	BLEU-2	0.91	—	Unverified
3	RankGAN	BLEU-2	0.85	—	Unverified
4	RelGAN (100)	BLEU-2	0.85	—	Unverified
5	SeqGAN	BLEU-2	0.83	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LeakGAN	BLEU-2	0.96	—	Unverified
2	PPOGAN	BLEU-2	0.91	—	Unverified
3	RelGAN	BLEU-2	0.88	—	Unverified
4	SeqGAN	BLEU-2	0.86	—	Unverified
5	RankGAN	BLEU-2	0.78	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	UniCRS	Distinct-3	0.65	—	Unverified
2	CRFR	Distinct-3	0.52	—	Unverified
3	KGSF	Distinct-3	0.43	—	Unverified
4	C2CRS	Distinct-3	0.33	—	Unverified
5	KBRD	Distinct-3	0.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	UniLM	CIDEr	14.92	—	Unverified
2	BART (TextBox 2.0)	CIDEr	12.98	—	Unverified
3	BART	METEOR	0.3	—	Unverified
4	T5	METEOR	0.29	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Beam search + A*esque (beam)	BLEU-1	34.4	—	Unverified
2	Beam search + A*esque (sample)	BLEU-1	34.4	—	Unverified
3	Beam search + A*esque (greedy)	BLEU-1	34.3	—	Unverified
4	Beam search	BLEU-1	33.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RankGAN	BLEU-2	0.81	—	Unverified
2	SeqGAN	BLEU-2	0.74	—	Unverified
3	LeakGAN	BLEU-2	0.46	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TGen++	METEOR	0.17	—	Unverified
2	TGen	METEOR	0.15	—	Unverified
3	TGen+	METEOR	0.15	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT2-124M	eval_loss	3.12	—	Unverified
2	GPT2-81M-LOOP	eval_loss	3.11	—	Unverified
3	GPT2-Hermite	eval_loss	2.91	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LLaMA-65B+CFG (zero-shot)	Accuracy	96.6	—	Unverified
2	LLaMA-30B+CFG (zero-shot)	Accuracy	96.4	—	Unverified
3	LLaMA-13B+CFG (zero-shot)	Accuracy	95.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CNN-VAE	NLL	332.1	—	Unverified
2	SA-VAE	NLL	327.5	—	Unverified
3	Aggressive VAE	NLL	326.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BART (TextBox 2.0)	BLEU-4	10.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STWGAN-GP	BLEU-3	0.62	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PALM	ROUGE-L	41.41	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BART (TextBox 2.0)	ROUGE-L	64.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AEM+Attention	BLEU-1	14.17	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4	ASR	65.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BART (TextBox 2.0)	ROUGE-L	42.96	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Graph2Seq	BLEU	22	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WGANGP + DGflow	JS-4	0.19	—	Unverified