Text Generation

Text Generation is the task of generating text with the goal of appearing indistinguishable to human-written text. This task is more formally known as "natural language generation" in the literature.

Text generation can be addressed with Markov processes or deep generative models like LSTMs. Recently, some of the most advanced methods for text generation include BART, GPT and other GAN-based approaches. Text generation systems are evaluated either through human ratings or automatic evaluation metrics like METEOR, ROUGE, and BLEU.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 851–900 of 5335 papers

Title	Date	Tasks	Status	Hype
The Unreasonable Ineffectiveness of Nucleus Sampling on Mitigating Text Memorization	Aug 29, 2024	DiagnosticMemorization	CodeCode Available	0
CBF-LLM: Safe Control for LLM Alignment	Aug 28, 2024	Text Generation	CodeCode Available	1
Generative Verifiers: Reward Modeling as Next-Token Prediction	Aug 27, 2024	MathPrediction	—Unverified	0
Predictability and Causality in Spanish and English Natural Language Generation	Aug 26, 2024	Causal Language ModelingLanguage Modeling	—Unverified	0
MODOC: A Modular Interface for Flexible Interlinking of Text Retrieval and Text Generation Functions	Aug 26, 2024	Information RetrievalRetrieval	CodeCode Available	0
Biomedical Large Languages Models Seem not to be Superior to Generalist Models on Unseen Medical Data	Aug 25, 2024	Document SummarizationGeneral Knowledge	—Unverified	0
DHP Benchmark: Are LLMs Good NLG Evaluators?	Aug 25, 2024	Benchmarkingnlg evaluation	—Unverified	0
Balancing Diversity and Risk in LLM Sampling: How to Select Your Method and Parameter for Open-Ended Text Generation	Aug 24, 2024	DiversitySentence	CodeCode Available	1
BackdoorLLM: A Comprehensive Benchmark for Backdoor Attacks and Defenses on Large Language Models	Aug 23, 2024	Data Poisoningtext-classification	CodeCode Available	3
Urban Mobility Assessment Using LLMs	Aug 22, 2024	SurveyText Generation	—Unverified	0
Controllable Text Generation for Large Language Models: A Survey	Aug 22, 2024	AttributePrompt Engineering	CodeCode Available	3
Preference-Guided Reflective Sampling for Aligning Language Models	Aug 22, 2024	Document SummarizationInstruction Following	CodeCode Available	0
MDD-5k: A New Diagnostic Conversation Dataset for Mental Disorders Synthesized via Neuro-Symbolic LLM Agents	Aug 22, 2024	DiagnosticText Generation	CodeCode Available	1
GenderCARE: A Comprehensive Framework for Assessing and Reducing Gender Bias in Large Language Models	Aug 22, 2024	counterfactualData Augmentation	CodeCode Available	1
Probabilistic Medical Predictions of Large Language Models	Aug 21, 2024	Decision MakingPrompt Engineering	—Unverified	0
Xinyu: An Efficient LLM-based System for Commentary Generation	Aug 21, 2024	RAGRetrieval-augmented Generation	—Unverified	0
Clinical Context-aware Radiology Report Generation from Medical Images using Transformers	Aug 21, 2024	DecoderDiagnostic	—Unverified	0
UniFashion: A Unified Vision-Language Model for Multimodal Fashion Retrieval and Generation	Aug 21, 2024	Image GenerationImage Retrieval	CodeCode Available	1
WeQA: A Benchmark for Retrieval Augmented Generation in Wind Energy Domain	Aug 21, 2024	Answer GenerationBenchmarking	—Unverified	0
Clinical Insights: A Comprehensive Review of Language Models in Medicine	Aug 21, 2024	EthicsIn-Context Learning	—Unverified	0
Analysis of Plan-based Retrieval for Grounded Text Generation	Aug 20, 2024	Language ModelingLanguage Modelling	—Unverified	0
DELIA: Diversity-Enhanced Learning for Instruction Adaptation in Large Language Models	Aug 19, 2024	DiversityText Generation	—Unverified	0
Goldfish: Monolingual Language Models for 350 Languages	Aug 19, 2024	Text Generation	CodeCode Available	1
Customizing Language Models with Instance-wise LoRA for Sequential Recommendation	Aug 19, 2024	Mixture-of-ExpertsMulti-Task Learning	CodeCode Available	1
Rhyme-aware Chinese lyric generator based on GPT	Aug 19, 2024	Text Generation	—Unverified	0
SMILE: Zero-Shot Sparse Mixture of Low-Rank Experts Construction From Pre-Trained Foundation Models	Aug 19, 2024	image-classificationImage Classification	CodeCode Available	3
R2GenCSR: Retrieving Context Samples for Large Language Model based X-ray Medical Report Generation	Aug 19, 2024	Language ModelingLanguage Modelling	—Unverified	0
Unraveling Text Generation in LLMs: A Stochastic Differential Equation Approach	Aug 17, 2024	Text Generation	—Unverified	0
Automatic Metrics in Natural Language Generation: A Survey of Current Evaluation Practices	Aug 17, 2024	SurveyText Generation	CodeCode Available	0
ECG-Chat: A Large ECG-Language Model for Cardiac Disease Diagnosis	Aug 16, 2024	Contrastive LearningDiagnostic	CodeCode Available	2
An End-to-End Model for Photo-Sharing Multi-modal Dialogue Generation	Aug 16, 2024	Dialogue GenerationImage Generation	CodeCode Available	0
PEDAL: Enhancing Greedy Decoding with Large Language Models using Diverse Exemplars	Aug 16, 2024	ARCDiversity	—Unverified	0
EmoDynamiX: Emotional Support Dialogue Strategy Prediction by Modelling MiXed Emotions and Discourse Dynamics	Aug 16, 2024	Decision MakingEmotion Recognition	CodeCode Available	1
JPEG-LM: LLMs as Image Generators with Canonical Codec Representations	Aug 15, 2024	Image GenerationQuantization	—Unverified	0
Coupling without Communication and Drafter-Invariant Speculative Decoding	Aug 15, 2024	Text Generation	CodeCode Available	0
CodeMirage: Hallucinations in Code Generated by Large Language Models	Aug 14, 2024	Code GenerationHallucination	—Unverified	0
Transformers and Large Language Models for Efficient Intrusion Detection Systems: A Comprehensive Survey	Aug 14, 2024	Autonomous VehiclesCloud Computing	—Unverified	0
Exploring Retrieval Augmented Generation in Arabic	Aug 14, 2024	RAGRetrieval	CodeCode Available	0
Parallel Speculative Decoding with Adaptive Draft Length	Aug 13, 2024	Text Generation	CodeCode Available	2
Towards Robust and Parameter-Efficient Knowledge Unlearning for LLMs	Aug 13, 2024	Machine UnlearningMemorization	CodeCode Available	1
Creating Arabic LLM Prompts at Scale	Aug 12, 2024	Headline GenerationInstruction Following	—Unverified	0
AdTEC: A Unified Benchmark for Evaluating Text Quality in Search Engine Advertising	Aug 12, 2024	Text Generation	CodeCode Available	0
Global-to-Local Support Spectrums for Language Model Explainability	Aug 12, 2024	image-classificationImage Classification	—Unverified	0
Speculative Diffusion Decoding: Accelerating Language Generation through Diffusion	Aug 10, 2024	Language ModelingLanguage Modelling	—Unverified	0
Get Confused Cautiously: Textual Sequence Memorization Erasure with Selective Entropy Maximization	Aug 9, 2024	MemorizationText Generation	—Unverified	0
An Evaluation of Standard Statistical Models and LLMs on Time Series Forecasting	Aug 9, 2024	Sentiment AnalysisText Generation	CodeCode Available	0
Multi-Turn Context Jailbreak Attack on Large Language Models From First Principles	Aug 8, 2024	Text Generation	—Unverified	0
mbrs: A Library for Minimum Bayes Risk Decoding	Aug 8, 2024	Text Generation	CodeCode Available	2
Diffusion Guided Language Modeling	Aug 8, 2024	AttributeLanguage Modeling	CodeCode Available	1
BA-LoRA: Bias-Alleviating Low-Rank Adaptation to Mitigate Catastrophic Inheritance in Large Language Models	Aug 8, 2024	DiversityNatural Language Understanding	CodeCode Available	0

Show:10 25 50

← PrevPage 18 of 107Next →

All datasets DART COCO Captions EMNLP2017 WMT ReDial CommonGen ROCStories Chinese Poems Czech restaurant information OpenWebText SciQ Yahoo Questions ADGEN

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	T5B Baseline	BLEU	48.74	—	Unverified
2	FactT5B	BLEU	48.37	—	Unverified
3	JointGT Baseline	BLEU	47.51	—	Unverified
4	FactJointGT	BLEU	47.39	—	Unverified
5	Control Prefixes (T5-large)	METEOR	0.41	—	Unverified
6	T5	METEOR	0.12	—	Unverified
7	BART	METEOR	0.11	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LeakGAN	BLEU-2	0.95	—	Unverified
2	partGAN	BLEU-2	0.91	—	Unverified
3	RankGAN	BLEU-2	0.85	—	Unverified
4	RelGAN (100)	BLEU-2	0.85	—	Unverified
5	SeqGAN	BLEU-2	0.83	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LeakGAN	BLEU-2	0.96	—	Unverified
2	PPOGAN	BLEU-2	0.91	—	Unverified
3	RelGAN	BLEU-2	0.88	—	Unverified
4	SeqGAN	BLEU-2	0.86	—	Unverified
5	RankGAN	BLEU-2	0.78	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	UniCRS	Distinct-3	0.65	—	Unverified
2	CRFR	Distinct-3	0.52	—	Unverified
3	KGSF	Distinct-3	0.43	—	Unverified
4	C2CRS	Distinct-3	0.33	—	Unverified
5	KBRD	Distinct-3	0.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	UniLM	CIDEr	14.92	—	Unverified
2	BART (TextBox 2.0)	CIDEr	12.98	—	Unverified
3	BART	METEOR	0.3	—	Unverified
4	T5	METEOR	0.29	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Beam search + A*esque (sample)	BLEU-1	34.4	—	Unverified
2	Beam search + A*esque (beam)	BLEU-1	34.4	—	Unverified
3	Beam search + A*esque (greedy)	BLEU-1	34.3	—	Unverified
4	Beam search	BLEU-1	33.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RankGAN	BLEU-2	0.81	—	Unverified
2	SeqGAN	BLEU-2	0.74	—	Unverified
3	LeakGAN	BLEU-2	0.46	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TGen++	METEOR	0.17	—	Unverified
2	TGen	METEOR	0.15	—	Unverified
3	TGen+	METEOR	0.15	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT2-124M	eval_loss	3.12	—	Unverified
2	GPT2-81M-LOOP	eval_loss	3.11	—	Unverified
3	GPT2-Hermite	eval_loss	2.91	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LLaMA-65B+CFG (zero-shot)	Accuracy	96.6	—	Unverified
2	LLaMA-30B+CFG (zero-shot)	Accuracy	96.4	—	Unverified
3	LLaMA-13B+CFG (zero-shot)	Accuracy	95.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CNN-VAE	NLL	332.1	—	Unverified
2	SA-VAE	NLL	327.5	—	Unverified
3	Aggressive VAE	NLL	326.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BART (TextBox 2.0)	BLEU-4	10.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STWGAN-GP	BLEU-3	0.62	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PALM	ROUGE-L	41.41	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BART (TextBox 2.0)	ROUGE-L	64.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AEM+Attention	BLEU-1	14.17	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4	ASR	65.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BART (TextBox 2.0)	ROUGE-L	42.96	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Graph2Seq	BLEU	22	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WGANGP + DGflow	JS-4	0.19	—	Unverified