Text Generation

Text Generation is the task of generating text with the goal of appearing indistinguishable to human-written text. This task is more formally known as "natural language generation" in the literature.

Text generation can be addressed with Markov processes or deep generative models like LSTMs. Recently, some of the most advanced methods for text generation include BART, GPT and other GAN-based approaches. Text generation systems are evaluated either through human ratings or automatic evaluation metrics like METEOR, ROUGE, and BLEU.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 651–700 of 5335 papers

Title	Date	Tasks	Status	Hype
Data-QuestEval: A Referenceless Metric for Data-to-Text Semantic Evaluation	Apr 15, 2021	Data-to-Text GenerationQuestion Generation	CodeCode Available	1
Fork or Fail: Cycle-Consistent Training with Many-to-One Mappings	Dec 14, 2020	DiversityKnowledge Graphs	CodeCode Available	1
Bag of Design Choices for Inference of High-Resolution Masked Generative Transformer	Nov 16, 2024	Text Generation	CodeCode Available	1
Bag of Tricks for Training Data Extraction from Language Models	Feb 9, 2023	Text Generation	CodeCode Available	1
Data-to-Text Generation with Iterative Text Editing	Nov 3, 2020	Data-to-Text GenerationDomain Adaptation	CodeCode Available	1
Data Feedback Loops: Model-driven Amplification of Dataset Biases	Sep 8, 2022	image-classificationImage Classification	CodeCode Available	1
OpenING: A Comprehensive Benchmark for Judging Open-ended Interleaved Image-Text Generation	Nov 27, 2024	Image Generationmultimodal generation	CodeCode Available	1
Balancing Diversity and Risk in LLM Sampling: How to Select Your Method and Parameter for Open-Ended Text Generation	Aug 24, 2024	DiversitySentence	CodeCode Available	1
GenAug: Data Augmentation for Finetuning Text Generators	Oct 5, 2020	Data AugmentationDiversity	CodeCode Available	1
GenderCARE: A Comprehensive Framework for Assessing and Reducing Gender Bias in Large Language Models	Aug 22, 2024	counterfactualData Augmentation	CodeCode Available	1
Generate, Prune, Select: A Pipeline for Counterspeech Generation against Online Hate Speech	Jun 3, 2021	BlockingDiversity	CodeCode Available	1
BanglaNLG and BanglaT5: Benchmarks and Resources for Evaluating Low-Resource Natural Language Generation in Bangla	May 23, 2022	Conditional Text GenerationDialogue Generation	CodeCode Available	1
DART: Open-Domain Structured Data Record to Text Generation	Jul 6, 2020	Domain GeneralizationSemantic Parsing	CodeCode Available	1
BART: Denoising Sequence-to-Sequence Pre-training for Natural Language Generation, Translation, and Comprehension	Oct 29, 2019	Abstractive Text SummarizationDecoder	CodeCode Available	1
Generating Radiology Reports via Memory-driven Transformer	Oct 30, 2020	DecoderText Generation	CodeCode Available	1
BARTScore: Evaluating Generated Text as Text Generation	Jun 22, 2021	DecoderInformativeness	CodeCode Available	1
Generating Training Data with Language Models: Towards Zero-Shot Language Understanding	Feb 9, 2022	Few-Shot LearningMNLI-m	CodeCode Available	1
Generating Visual Spatial Description via Holistic 3D Scene Understanding	May 19, 2023	Scene UnderstandingText Generation	CodeCode Available	1
Data Generation for Post-OCR correction of Cyrillic handwriting	Nov 27, 2023	Handwriting generationHandwritten Text Recognition	CodeCode Available	1
An Empirical Investigation of Pre-Trained Transformer Language Models for Open-Domain Dialogue Generation	Mar 9, 2020	Dialogue GenerationDiversity	CodeCode Available	1
Data-to-text Generation with Macro Planning	Feb 4, 2021	Data-to-Text GenerationDecoder	CodeCode Available	1
Defending Against Unforeseen Failure Modes with Latent Adversarial Training	Mar 8, 2024	image-classificationImage Classification	CodeCode Available	1
A Call for Clarity in Beam Search: How It Works and When It Stops	Apr 11, 2022	Machine TranslationText Generation	CodeCode Available	1
BEAMetrics: A Benchmark for Language Generation Evaluation Evaluation	Oct 18, 2021	General KnowledgeInformativeness	CodeCode Available	1
Bounding the Capabilities of Large Language Models in Open Text Generation with Prompt Constraints	Feb 17, 2023	Text Generation	CodeCode Available	1
GenWiki: A Dataset of 1.3 Million Content-Sharing Text and Graphs for Unsupervised Graph-to-Text Generation	Dec 1, 2020	Knowledge GraphsText Generation	CodeCode Available	1
An Empirical Study of GPT-4o Image Generation Capabilities	Apr 8, 2025	BenchmarkingImage Generation	CodeCode Available	1
GLAT: Glancing at Latent Variables for Parallel Text Generation	May 1, 2022	Text Generation	CodeCode Available	1
AutoAD: Movie Description in Context	Mar 29, 2023	Image CaptioningText Generation	CodeCode Available	1
BenchCLAMP: A Benchmark for Evaluating Language Models on Syntactic and Semantic Parsing	Jun 21, 2022	DecoderLanguage Modeling	CodeCode Available	1
An Empirical Study On Contrastive Search And Contrastive Decoding For Open-ended Text Generation	Nov 19, 2022	DiversityText Generation	CodeCode Available	1
Goodtriever: Adaptive Toxicity Mitigation with Retrieval-augmented Models	Oct 11, 2023	RetrievalText Generation	CodeCode Available	1
A Comprehensive Survey of Accelerated Generation Techniques in Large Language Models	May 15, 2024	SurveyText Generation	CodeCode Available	1
CTRLEval: An Unsupervised Reference-Free Metric for Evaluating Controlled Text Generation	Apr 2, 2022	Language ModelingLanguage Modelling	CodeCode Available	1
GPTutor: a ChatGPT-powered programming tool for code explanation	May 3, 2023	Text Generation	CodeCode Available	1
Benchmarking Large Language Models on Controllable Generation under Diversified Instructions	Jan 1, 2024	BenchmarkingInstruction Following	CodeCode Available	1
CROW: Eliminating Backdoors from Large Language Models via Internal Consistency Regularization	Nov 18, 2024	backdoor defenseText Generation	CodeCode Available	1
CTRL: A Conditional Transformer Language Model for Controllable Generation	Sep 11, 2019	Language ModelingLanguage Modelling	CodeCode Available	1
Towards Reliable Detection of LLM-Generated Texts: A Comprehensive Evaluation Framework with CUDRT	Jun 13, 2024	BenchmarkingLLM-generated Text Detection	CodeCode Available	1
GRUEN for Evaluating Linguistic Quality of Generated Text	Oct 6, 2020	Text Generation	CodeCode Available	1
UniTAB: Unifying Text and Box Outputs for Grounded Vision-Language Modeling	Nov 23, 2021	Image CaptioningImage Description	CodeCode Available	1
A Methodology for Generative Spelling Correction via Natural Spelling Errors Emulation across Multiple Domains and Languages	Aug 18, 2023	Spelling CorrectionText Generation	CodeCode Available	1
Cross-modality Data Augmentation for End-to-End Sign Language Translation	May 18, 2023	Data AugmentationKnowledge Distillation	CodeCode Available	1
Handwritten Text Generation from Visual Archetypes	Mar 27, 2023	Text Generation	CodeCode Available	1
CriSPO: Multi-Aspect Critique-Suggestion-guided Automatic Prompt Optimization for Text Generation	Oct 3, 2024	Abstractive Text SummarizationHallucination	CodeCode Available	1
Have Your Text and Use It Too! End-to-End Neural Data-to-Text Generation with Semantic Fidelity	Apr 8, 2020	AMR-to-Text GenerationData-to-Text Generation	CodeCode Available	1
BERTGEN: Multi-task Generation through BERT	Jun 7, 2021	DecoderImage Captioning	CodeCode Available	1
BERTScore: Evaluating Text Generation with BERT	Apr 21, 2019	Image CaptioningMachine Translation	CodeCode Available	1
BERTScore is Unfair: On Social Bias in Language Model-Based Metrics for Text Generation	Oct 14, 2022	FairnessLanguage Modeling	CodeCode Available	1
A Universal Question-Answering Platform for Knowledge Graphs	Mar 1, 2023	Knowledge Base Question AnsweringKnowledge Graphs	CodeCode Available	1

Show:10 25 50

← PrevPage 14 of 107Next →

All datasets DART COCO Captions EMNLP2017 WMT ReDial CommonGen ROCStories Chinese Poems Czech restaurant information OpenWebText SciQ Yahoo Questions ADGEN

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	T5B Baseline	BLEU	48.74	—	Unverified
2	FactT5B	BLEU	48.37	—	Unverified
3	JointGT Baseline	BLEU	47.51	—	Unverified
4	FactJointGT	BLEU	47.39	—	Unverified
5	Control Prefixes (T5-large)	METEOR	0.41	—	Unverified
6	T5	METEOR	0.12	—	Unverified
7	BART	METEOR	0.11	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LeakGAN	BLEU-2	0.95	—	Unverified
2	partGAN	BLEU-2	0.91	—	Unverified
3	RankGAN	BLEU-2	0.85	—	Unverified
4	RelGAN (100)	BLEU-2	0.85	—	Unverified
5	SeqGAN	BLEU-2	0.83	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LeakGAN	BLEU-2	0.96	—	Unverified
2	PPOGAN	BLEU-2	0.91	—	Unverified
3	RelGAN	BLEU-2	0.88	—	Unverified
4	SeqGAN	BLEU-2	0.86	—	Unverified
5	RankGAN	BLEU-2	0.78	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	UniCRS	Distinct-3	0.65	—	Unverified
2	CRFR	Distinct-3	0.52	—	Unverified
3	KGSF	Distinct-3	0.43	—	Unverified
4	C2CRS	Distinct-3	0.33	—	Unverified
5	KBRD	Distinct-3	0.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	UniLM	CIDEr	14.92	—	Unverified
2	BART (TextBox 2.0)	CIDEr	12.98	—	Unverified
3	BART	METEOR	0.3	—	Unverified
4	T5	METEOR	0.29	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Beam search + A*esque (beam)	BLEU-1	34.4	—	Unverified
2	Beam search + A*esque (sample)	BLEU-1	34.4	—	Unverified
3	Beam search + A*esque (greedy)	BLEU-1	34.3	—	Unverified
4	Beam search	BLEU-1	33.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RankGAN	BLEU-2	0.81	—	Unverified
2	SeqGAN	BLEU-2	0.74	—	Unverified
3	LeakGAN	BLEU-2	0.46	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TGen++	METEOR	0.17	—	Unverified
2	TGen	METEOR	0.15	—	Unverified
3	TGen+	METEOR	0.15	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT2-124M	eval_loss	3.12	—	Unverified
2	GPT2-81M-LOOP	eval_loss	3.11	—	Unverified
3	GPT2-Hermite	eval_loss	2.91	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LLaMA-65B+CFG (zero-shot)	Accuracy	96.6	—	Unverified
2	LLaMA-30B+CFG (zero-shot)	Accuracy	96.4	—	Unverified
3	LLaMA-13B+CFG (zero-shot)	Accuracy	95.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CNN-VAE	NLL	332.1	—	Unverified
2	SA-VAE	NLL	327.5	—	Unverified
3	Aggressive VAE	NLL	326.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BART (TextBox 2.0)	BLEU-4	10.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STWGAN-GP	BLEU-3	0.62	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PALM	ROUGE-L	41.41	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BART (TextBox 2.0)	ROUGE-L	64.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AEM+Attention	BLEU-1	14.17	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4	ASR	65.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BART (TextBox 2.0)	ROUGE-L	42.96	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Graph2Seq	BLEU	22	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WGANGP + DGflow	JS-4	0.19	—	Unverified