Text Generation

Text Generation is the task of generating text with the goal of appearing indistinguishable to human-written text. This task is more formally known as "natural language generation" in the literature.

Text generation can be addressed with Markov processes or deep generative models like LSTMs. Recently, some of the most advanced methods for text generation include BART, GPT and other GAN-based approaches. Text generation systems are evaluated either through human ratings or automatic evaluation metrics like METEOR, ROUGE, and BLEU.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1401–1450 of 5335 papers

Title	Date	Tasks	Status	Hype
"My Answer is C": First-Token Probabilities Do Not Match Text Answers in Instruction-Tuned Language Models	Feb 22, 2024	Multiple-choiceText Generation	CodeCode Available	0
Generalizing Reward Modeling for Out-of-Distribution Preference Learning	Feb 22, 2024	Bilevel OptimizationMeta-Learning	CodeCode Available	0
Typographic Text Generation with Off-the-Shelf Diffusion Model	Feb 22, 2024	Text Generation	—Unverified	0
CEV-LM: Controlled Edit Vector Language Model for Shaping Natural Language Generations	Feb 22, 2024	Language ModelingLanguage Modelling	CodeCode Available	0
UFO: a Unified and Flexible Framework for Evaluating Factuality of Large Language Models	Feb 22, 2024	HallucinationRetrieval	CodeCode Available	0
MORE: Multi-mOdal REtrieval Augmented Generative Commonsense Reasoning	Feb 21, 2024	RetrievalText Generation	—Unverified	0
Ouroboros: Generating Longer Drafts Phrase by Phrase for Faster Speculative Decoding	Feb 21, 2024	Text Generation	CodeCode Available	2
GCOF: Self-iterative Text Generation for Copywriting Using Large Language Model	Feb 21, 2024	Feature EngineeringLanguage Modeling	—Unverified	0
From Self-Attention to Markov Models: Unveiling the Dynamics of Generative Transformers	Feb 21, 2024	Text Generation	—Unverified	0
Hallucinations or Attention Misdirection? The Path to Strategic Value Extraction in Business Using Large Language Models	Feb 21, 2024	Text Generation	—Unverified	0
A Multimodal In-Context Tuning Approach for E-Commerce Product Description Generation	Feb 21, 2024	DiversityIn-Context Learning	CodeCode Available	1
CHATATC: Large Language Model-Driven Conversational Agents for Supporting Strategic Air Traffic Flow Management	Feb 20, 2024	Language ModelingLanguage Modelling	—Unverified	0
A Simple but Effective Approach to Improve Structured Language Model Output for Information Extraction	Feb 20, 2024	Language ModelingLanguage Modelling	CodeCode Available	1
OWSM-CTC: An Open Encoder-Only Speech Foundation Model for Speech Recognition, Translation, and Language Identification	Feb 20, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
FinBen: A Holistic Financial Benchmark for Large Language Models	Feb 20, 2024	Question AnsweringRAG	CodeCode Available	4
Exploring the Impact of Table-to-Text Methods on Augmenting LLM-based Question Answering with Domain Hybrid Data	Feb 20, 2024	Question AnsweringRAG	—Unverified	0
Bias in Language Models: Beyond Trick Tests and Toward RUTEd Evaluation	Feb 20, 2024	FairnessText Generation	—Unverified	0
A User-Friendly Framework for Generating Model-Preferred Prompts in Text-to-Image Synthesis	Feb 20, 2024	Image GenerationPrompt Engineering	CodeCode Available	0
A Touch, Vision, and Language Dataset for Multimodal Alignment	Feb 20, 2024	Language ModelingLanguage Modelling	CodeCode Available	2
OPDAI at SemEval-2024 Task 6: Small LLMs can Accelerate Hallucination Detection with Weakly Supervised Data	Feb 20, 2024	Few-Shot LearningHallucination	—Unverified	0
CounterCurate: Enhancing Physical and Semantic Visio-Linguistic Compositional Reasoning via Counterfactual Examples	Feb 20, 2024	counterfactualData Augmentation	CodeCode Available	1
Standardize: Aligning Language Models with Expert-Defined Standards for Content Generation	Feb 19, 2024	In-Context LearningRetrieval	CodeCode Available	0
High-quality Data-to-Text Generation for Severely Under-Resourced Languages with Out-of-the-box Large Language Models	Feb 19, 2024	Data-to-Text GenerationText Generation	CodeCode Available	0
HU at SemEval-2024 Task 8A: Can Contrastive Learning Learn Embeddings to Detect Machine-Generated Text?	Feb 19, 2024	Contrastive LearningData Augmentation	CodeCode Available	0
WKVQuant: Quantizing Weight and Key/Value Cache for Large Language Models Gains More	Feb 19, 2024	QuantizationText Generation	—Unverified	0
Pride and Prejudice: LLM Amplifies Self-Bias in Self-Refinement	Feb 18, 2024	Mathematical ReasoningText Generation	CodeCode Available	0
Learning From Failure: Integrating Negative Examples when Fine-tuning Large Language Models as Agents	Feb 18, 2024	Mathematical ReasoningMulti-hop Question Answering	CodeCode Available	1
LLM can Achieve Self-Regulation via Hyperparameter Aware Generation	Feb 17, 2024	Text Generation	—Unverified	0
ToBlend: Token-Level Blending With an Ensemble of LLMs to Attack AI-Generated Text Detection	Feb 17, 2024	Text DetectionText Generation	—Unverified	0
PEDANTS: Cheap but Effective and Interpretable Answer Equivalence	Feb 17, 2024	BenchmarkingForm	CodeCode Available	2
k-SemStamp: A Clustering-Based Semantic Watermark for Detection of Machine-Generated Text	Feb 17, 2024	Text DetectionText Generation	CodeCode Available	1
Controlled Text Generation for Large Language Model with Dynamic Attribute Graphs	Feb 17, 2024	AttributeLanguage Modeling	CodeCode Available	1
VATr++: Choose Your Words Wisely for Handwritten Text Generation	Feb 16, 2024	BenchmarkingText Generation	—Unverified	0
Neural paraphrasing by automatically crawled and aligned sentence pairs	Feb 16, 2024	SentenceText Generation	—Unverified	0
Exploring Precision and Recall to assess the quality and diversity of LLMs	Feb 16, 2024	DiversityImage Generation	CodeCode Available	0
Unlocking Structure Measuring: Introducing PDD, an Automatic Metric for Positional Discourse Coherence	Feb 15, 2024	ArticlesCoherence Evaluation	CodeCode Available	0
Quantized Embedding Vectors for Controllable Diffusion Language Models	Feb 15, 2024	Language ModelingLanguage Modelling	—Unverified	0
Structured Language Generation Model for Robust Structure Prediction	Feb 14, 2024	modelNER	—Unverified	0
Long-form evaluation of model editing	Feb 14, 2024	Formmodel	CodeCode Available	0
SyntaxShap: Syntax-aware Explainability Method for Text Generation	Feb 14, 2024	Text Generation	CodeCode Available	0
Exploring the Adversarial Capabilities of Large Language Models	Feb 14, 2024	Hate Speech DetectionText Generation	—Unverified	0
COLD-Attack: Jailbreaking LLMs with Stealthiness and Controllability	Feb 13, 2024	Text Generation	CodeCode Available	2
Visually Dehallucinative Instruction Generation	Feb 13, 2024	HallucinationLanguage Modeling	CodeCode Available	0
A Systematic Review of Data-to-Text NLG	Feb 13, 2024	Data-to-Text GenerationHallucination	—Unverified	0
Can LLMs Produce Faithful Explanations For Fact-checking? Towards Faithful Explainable Fact-Checking via Multi-Agent Debate	Feb 12, 2024	Fact CheckingText Generation	—Unverified	0
Intrinsic Task-based Evaluation for Referring Expression Generation	Feb 12, 2024	Referring ExpressionReferring expression generation	—Unverified	0
Label-Efficient Model Selection for Text Generation	Feb 12, 2024	modelModel Selection	—Unverified	0
Synthesizing Sentiment-Controlled Feedback For Multimodal Text and Image Data	Feb 12, 2024	DecoderMarketing	CodeCode Available	0
Prompt Perturbation in Retrieval-Augmented Generation based Large Language Models	Feb 11, 2024	RAGRetrieval	—Unverified	0
CPSDBench: A Large Language Model Evaluation Benchmark and Baseline for Chinese Public Security Domain	Feb 11, 2024	Language Model EvaluationLanguage Modeling	—Unverified	0

Show:10 25 50

← PrevPage 29 of 107Next →

All datasets DART COCO Captions EMNLP2017 WMT ReDial CommonGen ROCStories Chinese Poems Czech restaurant information OpenWebText SciQ Yahoo Questions ADGEN

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	T5B Baseline	BLEU	48.74	—	Unverified
2	FactT5B	BLEU	48.37	—	Unverified
3	JointGT Baseline	BLEU	47.51	—	Unverified
4	FactJointGT	BLEU	47.39	—	Unverified
5	Control Prefixes (T5-large)	METEOR	0.41	—	Unverified
6	T5	METEOR	0.12	—	Unverified
7	BART	METEOR	0.11	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LeakGAN	BLEU-2	0.95	—	Unverified
2	partGAN	BLEU-2	0.91	—	Unverified
3	RankGAN	BLEU-2	0.85	—	Unverified
4	RelGAN (100)	BLEU-2	0.85	—	Unverified
5	SeqGAN	BLEU-2	0.83	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LeakGAN	BLEU-2	0.96	—	Unverified
2	PPOGAN	BLEU-2	0.91	—	Unverified
3	RelGAN	BLEU-2	0.88	—	Unverified
4	SeqGAN	BLEU-2	0.86	—	Unverified
5	RankGAN	BLEU-2	0.78	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	UniCRS	Distinct-3	0.65	—	Unverified
2	CRFR	Distinct-3	0.52	—	Unverified
3	KGSF	Distinct-3	0.43	—	Unverified
4	C2CRS	Distinct-3	0.33	—	Unverified
5	KBRD	Distinct-3	0.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	UniLM	CIDEr	14.92	—	Unverified
2	BART (TextBox 2.0)	CIDEr	12.98	—	Unverified
3	BART	METEOR	0.3	—	Unverified
4	T5	METEOR	0.29	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Beam search + A*esque (beam)	BLEU-1	34.4	—	Unverified
2	Beam search + A*esque (sample)	BLEU-1	34.4	—	Unverified
3	Beam search + A*esque (greedy)	BLEU-1	34.3	—	Unverified
4	Beam search	BLEU-1	33.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RankGAN	BLEU-2	0.81	—	Unverified
2	SeqGAN	BLEU-2	0.74	—	Unverified
3	LeakGAN	BLEU-2	0.46	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TGen++	METEOR	0.17	—	Unverified
2	TGen	METEOR	0.15	—	Unverified
3	TGen+	METEOR	0.15	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT2-124M	eval_loss	3.12	—	Unverified
2	GPT2-81M-LOOP	eval_loss	3.11	—	Unverified
3	GPT2-Hermite	eval_loss	2.91	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LLaMA-65B+CFG (zero-shot)	Accuracy	96.6	—	Unverified
2	LLaMA-30B+CFG (zero-shot)	Accuracy	96.4	—	Unverified
3	LLaMA-13B+CFG (zero-shot)	Accuracy	95.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CNN-VAE	NLL	332.1	—	Unverified
2	SA-VAE	NLL	327.5	—	Unverified
3	Aggressive VAE	NLL	326.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BART (TextBox 2.0)	BLEU-4	10.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STWGAN-GP	BLEU-3	0.62	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PALM	ROUGE-L	41.41	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BART (TextBox 2.0)	ROUGE-L	64.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AEM+Attention	BLEU-1	14.17	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4	ASR	65.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BART (TextBox 2.0)	ROUGE-L	42.96	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Graph2Seq	BLEU	22	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WGANGP + DGflow	JS-4	0.19	—	Unverified