Text Generation

Text Generation is the task of generating text with the goal of appearing indistinguishable to human-written text. This task is more formally known as "natural language generation" in the literature.

Text generation can be addressed with Markov processes or deep generative models like LSTMs. Recently, some of the most advanced methods for text generation include BART, GPT and other GAN-based approaches. Text generation systems are evaluated either through human ratings or automatic evaluation metrics like METEOR, ROUGE, and BLEU.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 151–200 of 5335 papers

Title	Date	Tasks	Status	Hype
HALC: Object Hallucination Reduction via Adaptive Focal-Contrast Decoding	Mar 1, 2024	HallucinationObject	CodeCode Available	2
Retrieval is Accurate Generation	Feb 27, 2024	Language ModelingLanguage Modelling	CodeCode Available	2
TruthX: Alleviating Hallucinations by Editing Large Language Models in Truthful Space	Feb 27, 2024	Contrastive LearningHallucination	CodeCode Available	2
Ouroboros: Generating Longer Drafts Phrase by Phrase for Faster Speculative Decoding	Feb 21, 2024	Text Generation	CodeCode Available	2
A Touch, Vision, and Language Dataset for Multimodal Alignment	Feb 20, 2024	Language ModelingLanguage Modelling	CodeCode Available	2
PEDANTS: Cheap but Effective and Interpretable Answer Equivalence	Feb 17, 2024	BenchmarkingForm	CodeCode Available	2
COLD-Attack: Jailbreaking LLMs with Stealthiness and Controllability	Feb 13, 2024	Text Generation	CodeCode Available	2
Linear-time Minimum Bayes Risk Decoding with Reference Aggregation	Feb 6, 2024	Text Generation	CodeCode Available	2
Shadowcast: Stealthy Data Poisoning Attacks Against Vision-Language Models	Feb 5, 2024	Data AugmentationData Poisoning	CodeCode Available	2
TeenyTinyLlama: open-source tiny language models trained in Brazilian Portuguese	Jan 30, 2024	Text Generation	CodeCode Available	2
The Power of Noise: Redefining Retrieval for RAG Systems	Jan 26, 2024	Information RetrievalRAG	CodeCode Available	2
With Greater Text Comes Greater Necessity: Inference-Time Training Helps Long Text Generation	Jan 21, 2024	Language ModelingLanguage Modelling	CodeCode Available	2
Evolutionary Computation in the Era of Large Language Model: Survey and Roadmap	Jan 18, 2024	Code GenerationEvolutionary Algorithms	CodeCode Available	2
Authorship Obfuscation in Multilingual Machine-Generated Text Detection	Jan 15, 2024	Adversarial RobustnessBenchmarking	CodeCode Available	2
Large Language Models Can Learn Temporal Reasoning	Jan 12, 2024	Data AugmentationDiversity	CodeCode Available	2
Machine Mindset: An MBTI Exploration of Large Language Models	Dec 20, 2023	Large Language ModelPersonality Alignment	CodeCode Available	2
LLMGA: Multimodal Large Language Model based Generation Assistant	Nov 27, 2023	Image GenerationLanguage Modeling	CodeCode Available	2
Controlled Text Generation via Language Model Arithmetic	Nov 24, 2023	Language ModelingLanguage Modelling	CodeCode Available	2
REST: Retrieval-Based Speculative Decoding	Nov 14, 2023	Language ModelingLanguage Modelling	CodeCode Available	2
Tamil-Llama: A New Tamil Language Model Based on Llama 2	Nov 10, 2023	Language ModelingLanguage Modelling	CodeCode Available	2
LoftQ: LoRA-Fine-Tuning-Aware Quantization for Large Language Models	Oct 12, 2023	Natural Language UnderstandingQuantization	CodeCode Available	2
MiniGPT-5: Interleaved Vision-and-Language Generation via Generative Vokens	Oct 3, 2023	Image Generationmultimodal generation	CodeCode Available	2
Unified Language-Vision Pretraining in LLM with Dynamic Discrete Visual Tokenization	Sep 9, 2023	Language ModellingLarge Language Model	CodeCode Available	2
Scaling Autoregressive Multi-Modal Models: Pretraining and Instruction Tuning	Sep 5, 2023	DecoderImage Generation	CodeCode Available	2
The Gender-GAP Pipeline: A Gender-Aware Polyglot Pipeline for Gender Characterisation in 55 Languages	Aug 31, 2023	Data AugmentationText Generation	CodeCode Available	2
ChatEval: Towards Better LLM-based Evaluators through Multi-Agent Debate	Aug 14, 2023	Text Generation	CodeCode Available	2
A Systematic Survey of Prompt Engineering on Vision-Language Foundation Models	Jul 24, 2023	Image GenerationImage-text matching	CodeCode Available	2
Building Cooperative Embodied Agents Modularly with Large Language Models	Jul 5, 2023	Text Generation	CodeCode Available	2
BatGPT: A Bidirectional Autoregessive Talker from Generative Pre-trained Transformer	Jul 1, 2023	Language ModelingLanguage Modelling	CodeCode Available	2
Most Language Models can be Poets too: An AI Writing Assistant and Constrained Text Generation Studio	Jun 28, 2023	Language ModellingText Generation	CodeCode Available	2
SituatedGen: Incorporating Geographical and Temporal Contexts into Generative Commonsense Reasoning	Jun 21, 2023	SentenceText Generation	CodeCode Available	2
BayLing: Bridging Cross-lingual Alignment and Instruction Following through Interactive Translation for Large Language Models	Jun 19, 2023	Instruction FollowingText Generation	CodeCode Available	2
MiniLLM: Knowledge Distillation of Large Language Models	Jun 14, 2023	Instruction FollowingKnowledge Distillation	CodeCode Available	2
Fine-Grained Human Feedback Gives Better Rewards for Language Model Training	Jun 2, 2023	Language ModelingLanguage Modelling	CodeCode Available	2
GlyphControl: Glyph Conditional Control for Visual Text Generation	May 29, 2023	Optical Character Recognition (OCR)Text Generation	CodeCode Available	2
KoSBi: A Dataset for Mitigating Social Bias Risks Towards Safer Large Language Model Application	May 28, 2023	Language ModelingLanguage Modelling	CodeCode Available	2
FActScore: Fine-grained Atomic Evaluation of Factual Precision in Long Form Text Generation	May 23, 2023	FormLanguage Modelling	CodeCode Available	2
Improving Factuality and Reasoning in Language Models through Multiagent Debate	May 23, 2023	Few-Shot LearningLanguage Modeling	CodeCode Available	2
MAGE: Machine-generated Text Detection in the Wild	May 22, 2023	Binary text classificationFace Swapping	CodeCode Available	2
Pengi: An Audio Language Model for Audio Tasks	May 19, 2023	Audio captioningAudio Question Answering	CodeCode Available	2
ULIP-2: Towards Scalable Multimodal Pre-training for 3D Understanding	May 14, 2023	3D Classification3D Point Cloud Classification	CodeCode Available	2
GPT-NER: Named Entity Recognition via Large Language Models	Apr 20, 2023	Hallucinationnamed-entity-recognition	CodeCode Available	2
VALOR: Vision-Audio-Language Omni-Perception Pretraining Model and Dataset	Apr 17, 2023	Audio captioningAudio-Video Question Answering (AVQA)	CodeCode Available	2
LongForm: Effective Instruction Tuning with Reverse Instructions	Apr 17, 2023	Long Form Question AnsweringNews Generation	CodeCode Available	2
Expressive Text-to-Image Generation with Rich Text	Apr 13, 2023	Image GenerationText Generation	CodeCode Available	2
CelebV-Text: A Large-Scale Facial Text-Video Dataset	Mar 26, 2023	Text GenerationText-to-Video Generation	CodeCode Available	2
SpikeGPT: Generative Pre-trained Language Model with Spiking Neural Networks	Feb 27, 2023	Language ModelingLanguage Modelling	CodeCode Available	2
Inseq: An Interpretability Toolkit for Sequence Generation Models	Feb 27, 2023	DecoderFeature Importance	CodeCode Available	2
Language-Driven Representation Learning for Robotics	Feb 24, 2023	Contrastive LearningImitation Learning	CodeCode Available	2
GPTScore: Evaluate as You Desire	Feb 8, 2023	Text Generation	CodeCode Available	2

Show:10 25 50

← PrevPage 4 of 107Next →

All datasets DART COCO Captions EMNLP2017 WMT ReDial CommonGen ROCStories Chinese Poems Czech restaurant information OpenWebText SciQ Yahoo Questions ADGEN

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	T5B Baseline	BLEU	48.74	—	Unverified
2	FactT5B	BLEU	48.37	—	Unverified
3	JointGT Baseline	BLEU	47.51	—	Unverified
4	FactJointGT	BLEU	47.39	—	Unverified
5	Control Prefixes (T5-large)	METEOR	0.41	—	Unverified
6	T5	METEOR	0.12	—	Unverified
7	BART	METEOR	0.11	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LeakGAN	BLEU-2	0.95	—	Unverified
2	partGAN	BLEU-2	0.91	—	Unverified
3	RankGAN	BLEU-2	0.85	—	Unverified
4	RelGAN (100)	BLEU-2	0.85	—	Unverified
5	SeqGAN	BLEU-2	0.83	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LeakGAN	BLEU-2	0.96	—	Unverified
2	PPOGAN	BLEU-2	0.91	—	Unverified
3	RelGAN	BLEU-2	0.88	—	Unverified
4	SeqGAN	BLEU-2	0.86	—	Unverified
5	RankGAN	BLEU-2	0.78	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	UniCRS	Distinct-3	0.65	—	Unverified
2	CRFR	Distinct-3	0.52	—	Unverified
3	KGSF	Distinct-3	0.43	—	Unverified
4	C2CRS	Distinct-3	0.33	—	Unverified
5	KBRD	Distinct-3	0.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	UniLM	CIDEr	14.92	—	Unverified
2	BART (TextBox 2.0)	CIDEr	12.98	—	Unverified
3	BART	METEOR	0.3	—	Unverified
4	T5	METEOR	0.29	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Beam search + A*esque (beam)	BLEU-1	34.4	—	Unverified
2	Beam search + A*esque (sample)	BLEU-1	34.4	—	Unverified
3	Beam search + A*esque (greedy)	BLEU-1	34.3	—	Unverified
4	Beam search	BLEU-1	33.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RankGAN	BLEU-2	0.81	—	Unverified
2	SeqGAN	BLEU-2	0.74	—	Unverified
3	LeakGAN	BLEU-2	0.46	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TGen++	METEOR	0.17	—	Unverified
2	TGen	METEOR	0.15	—	Unverified
3	TGen+	METEOR	0.15	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT2-124M	eval_loss	3.12	—	Unverified
2	GPT2-81M-LOOP	eval_loss	3.11	—	Unverified
3	GPT2-Hermite	eval_loss	2.91	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LLaMA-65B+CFG (zero-shot)	Accuracy	96.6	—	Unverified
2	LLaMA-30B+CFG (zero-shot)	Accuracy	96.4	—	Unverified
3	LLaMA-13B+CFG (zero-shot)	Accuracy	95.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CNN-VAE	NLL	332.1	—	Unverified
2	SA-VAE	NLL	327.5	—	Unverified
3	Aggressive VAE	NLL	326.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BART (TextBox 2.0)	BLEU-4	10.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STWGAN-GP	BLEU-3	0.62	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PALM	ROUGE-L	41.41	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BART (TextBox 2.0)	ROUGE-L	64.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AEM+Attention	BLEU-1	14.17	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4	ASR	65.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BART (TextBox 2.0)	ROUGE-L	42.96	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Graph2Seq	BLEU	22	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WGANGP + DGflow	JS-4	0.19	—	Unverified