Text Generation

Text Generation is the task of generating text with the goal of appearing indistinguishable to human-written text. This task is more formally known as "natural language generation" in the literature.

Text generation can be addressed with Markov processes or deep generative models like LSTMs. Recently, some of the most advanced methods for text generation include BART, GPT and other GAN-based approaches. Text generation systems are evaluated either through human ratings or automatic evaluation metrics like METEOR, ROUGE, and BLEU.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1051–1100 of 5335 papers

Title	Date	Tasks	Status	Hype
Integrating Large Language Models with Graph-based Reasoning for Conversational Question Answering	Jun 14, 2024	Conversational Question AnsweringKnowledge Graphs	—Unverified	0
FreeCtrl: Constructing Control Centers with Feedforward Layers for Learning-Free Controllable Text Generation	Jun 14, 2024	AttributeText Generation	CodeCode Available	0
A Probability--Quality Trade-off in Aligned Language Models and its Relation to Sampling Adaptors	Jun 14, 2024	Language ModelingLanguage Modelling	—Unverified	0
A Better LLM Evaluator for Text Generation: The Impact of Prompt Output Sequencing and Optimization	Jun 14, 2024	SensitivityText Generation	—Unverified	0
Regularizing Hidden States Enables Learning Generalizable Reward Model for LLMs	Jun 14, 2024	Language ModelingLanguage Modelling	CodeCode Available	4
A Training-free Sub-quadratic Cost Transformer Model Serving Framework With Hierarchically Pruned Attention	Jun 14, 2024	GPUQuestion Answering	—Unverified	0
Modeling Comparative Logical Relation with Contrastive Learning for Text Generation	Jun 13, 2024	Contrastive LearningData-to-Text Generation	—Unverified	0
Towards Reliable Detection of LLM-Generated Texts: A Comprehensive Evaluation Framework with CUDRT	Jun 13, 2024	BenchmarkingLLM-generated Text Detection	CodeCode Available	1
ReadCtrl: Personalizing text generation with readability-controlled instruction learning	Jun 13, 2024	Text Generation	—Unverified	0
MMRel: A Relation Understanding Benchmark in the MLLM Era	Jun 13, 2024	DiversityHallucination	CodeCode Available	1
Improving Autoregressive Training with Dynamic Oracles	Jun 13, 2024	Machine Translationnamed-entity-recognition	—Unverified	0
A Critical Look At Tokenwise Reward-Guided Text Generation	Jun 12, 2024	Text Generation	—Unverified	0
A Generative Marker Enhanced End-to-End Framework for Argument Mining	Jun 12, 2024	Argument MiningDependency Parsing	—Unverified	0
Defining and Detecting Vulnerability in Human Evaluation Guidelines: A Preliminary Study Towards Reliable NLG Evaluation	Jun 12, 2024	nlg evaluationText Generation	CodeCode Available	0
ConMe: Rethinking Evaluation of Compositional Reasoning for Modern VLMs	Jun 12, 2024	DecoderLanguage Modelling	CodeCode Available	0
Analyzing constrained LLM through PDFA-learning	Jun 12, 2024	Language ModelingLanguage Modelling	CodeCode Available	0
Leveraging Large Language Models for Web Scraping	Jun 12, 2024	ChunkingRAG	—Unverified	0
Markov Constraint as Large Language Model Surrogate	Jun 11, 2024	Language ModelingLanguage Modelling	—Unverified	0
TernaryLLM: Ternarized Large Language Model	Jun 11, 2024	Knowledge DistillationLanguage Modeling	—Unverified	0
QCQA: Quality and Capacity-aware grouped Query Attention	Jun 8, 2024	Text Generation	—Unverified	0
Write Summary Step-by-Step: A Pilot Study of Stepwise Summarization	Jun 8, 2024	Abstractive Text SummarizationStory Generation	—Unverified	0
Verbalized Probabilistic Graphical Modeling with Large Language Models	Jun 8, 2024	Bayesian InferenceText Generation	—Unverified	0
CERET: Cost-Effective Extrinsic Refinement for Text Generation	Jun 8, 2024	Abstractive Text SummarizationQuestion Answering	CodeCode Available	0
DALD: Improving Logits-based Detector without Logits from Black-box LLMs	Jun 7, 2024	Text DetectionText Generation	CodeCode Available	1
On Subjective Uncertainty Quantification and Calibration in Natural Language Generation	Jun 7, 2024	In-Context LearningMachine Translation	CodeCode Available	0
Annotating FrameNet via Structure-Conditioned Language Generation	Jun 7, 2024	Data AugmentationSemantic Role Labeling	CodeCode Available	0
Extroversion or Introversion? Controlling The Personality of Your Large Language Models	Jun 7, 2024	Text Generation	CodeCode Available	0
Effective Context Selection in LLM-based Leaderboard Generation: An Empirical Study	Jun 6, 2024	ArticlesNatural Language Inference	—Unverified	0
Evaluating the Smooth Control of Attribute Intensity in Text Generation with LLMs	Jun 6, 2024	AttributeText Generation	CodeCode Available	0
Uncovering Limitations of Large Language Models in Information Seeking from Tables	Jun 6, 2024	Single Choice QuestionText Generation	CodeCode Available	0
Evaluating Durability: Benchmark Insights into Multimodal Watermarking	Jun 6, 2024	Text Generation	—Unverified	0
End-to-End Trainable Retrieval-Augmented Generation for Relation Extraction	Jun 6, 2024	RelationRelation Extraction	—Unverified	0
MAIRA-2: Grounded Radiology Report Generation	Jun 6, 2024	Text Generation	CodeCode Available	2
BEADs: Bias Evaluation Across Domains	Jun 6, 2024	BenchmarkingBias Detection	—Unverified	0
Semantically Diverse Language Generation for Uncertainty Estimation in Language Models	Jun 6, 2024	Question AnsweringText Generation	CodeCode Available	1
Confabulation: The Surprising Value of Large Language Model Hallucinations	Jun 6, 2024	HallucinationLanguage Modeling	—Unverified	0
PatentEval: Understanding Errors in Patent Generation	Jun 5, 2024	Abstract generationText Generation	CodeCode Available	0
Open Grounded Planning: Challenges and Benchmark Construction	Jun 5, 2024	Decision MakingText Generation	CodeCode Available	1
Efficient Minimum Bayes Risk Decoding using Low-Rank Matrix Completion Algorithms	Jun 5, 2024	Low-Rank Matrix CompletionMachine Translation	CodeCode Available	2
Towards Detecting LLMs Hallucination via Markov Chain-based Multi-agent Debate Framework	Jun 5, 2024	Fact CheckingHallucination	—Unverified	0
DriVLMe: Enhancing LLM-based Autonomous Driving Agents with Embodied and Social Experiences	Jun 5, 2024	Autonomous DrivingAutonomous Vehicles	CodeCode Available	2
The Challenges of Evaluating LLM Applications: An Analysis of Automated, Human, and LLM-Based Approaches	Jun 5, 2024	ChatbotInformation Retrieval	—Unverified	0
AD-H: Autonomous Driving with Hierarchical Agents	Jun 5, 2024	Autonomous DrivingText Generation	CodeCode Available	0
CSS: Contrastive Semantic Similarity for Uncertainty Quantification of LLMs	Jun 5, 2024	ClusteringNatural Language Inference	CodeCode Available	0
FusionBench: A Comprehensive Benchmark of Deep Model Fusion	Jun 5, 2024	image-classificationImage Classification	CodeCode Available	3
Order-Independence Without Fine Tuning	Jun 4, 2024	Language ModellingMultiple-choice	CodeCode Available	0
OccamLLM: Fast and Exact Language Model Arithmetic in a Single Step	Jun 4, 2024	Language ModelingLanguage Modelling	—Unverified	0
Adaptive Preference Scaling for Reinforcement Learning with Human Feedback	Jun 4, 2024	reinforcement-learningReinforcement Learning	—Unverified	0
Exploring Mathematical Extrapolation of Large Language Models with Synthetic Data	Jun 4, 2024	Mathematical ReasoningText Generation	—Unverified	0
The current status of large language models in summarizing radiology report impressions	Jun 4, 2024	Text Generation	—Unverified	0

Show:10 25 50

← PrevPage 22 of 107Next →

All datasets DART COCO Captions EMNLP2017 WMT ReDial CommonGen ROCStories Chinese Poems Czech restaurant information OpenWebText SciQ Yahoo Questions ADGEN

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	T5B Baseline	BLEU	48.74	—	Unverified
2	FactT5B	BLEU	48.37	—	Unverified
3	JointGT Baseline	BLEU	47.51	—	Unverified
4	FactJointGT	BLEU	47.39	—	Unverified
5	Control Prefixes (T5-large)	METEOR	0.41	—	Unverified
6	T5	METEOR	0.12	—	Unverified
7	BART	METEOR	0.11	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LeakGAN	BLEU-2	0.95	—	Unverified
2	partGAN	BLEU-2	0.91	—	Unverified
3	RankGAN	BLEU-2	0.85	—	Unverified
4	RelGAN (100)	BLEU-2	0.85	—	Unverified
5	SeqGAN	BLEU-2	0.83	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LeakGAN	BLEU-2	0.96	—	Unverified
2	PPOGAN	BLEU-2	0.91	—	Unverified
3	RelGAN	BLEU-2	0.88	—	Unverified
4	SeqGAN	BLEU-2	0.86	—	Unverified
5	RankGAN	BLEU-2	0.78	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	UniCRS	Distinct-3	0.65	—	Unverified
2	CRFR	Distinct-3	0.52	—	Unverified
3	KGSF	Distinct-3	0.43	—	Unverified
4	C2CRS	Distinct-3	0.33	—	Unverified
5	KBRD	Distinct-3	0.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	UniLM	CIDEr	14.92	—	Unverified
2	BART (TextBox 2.0)	CIDEr	12.98	—	Unverified
3	BART	METEOR	0.3	—	Unverified
4	T5	METEOR	0.29	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Beam search + A*esque (beam)	BLEU-1	34.4	—	Unverified
2	Beam search + A*esque (sample)	BLEU-1	34.4	—	Unverified
3	Beam search + A*esque (greedy)	BLEU-1	34.3	—	Unverified
4	Beam search	BLEU-1	33.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RankGAN	BLEU-2	0.81	—	Unverified
2	SeqGAN	BLEU-2	0.74	—	Unverified
3	LeakGAN	BLEU-2	0.46	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TGen++	METEOR	0.17	—	Unverified
2	TGen	METEOR	0.15	—	Unverified
3	TGen+	METEOR	0.15	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT2-124M	eval_loss	3.12	—	Unverified
2	GPT2-81M-LOOP	eval_loss	3.11	—	Unverified
3	GPT2-Hermite	eval_loss	2.91	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LLaMA-65B+CFG (zero-shot)	Accuracy	96.6	—	Unverified
2	LLaMA-30B+CFG (zero-shot)	Accuracy	96.4	—	Unverified
3	LLaMA-13B+CFG (zero-shot)	Accuracy	95.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CNN-VAE	NLL	332.1	—	Unverified
2	SA-VAE	NLL	327.5	—	Unverified
3	Aggressive VAE	NLL	326.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BART (TextBox 2.0)	BLEU-4	10.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STWGAN-GP	BLEU-3	0.62	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PALM	ROUGE-L	41.41	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BART (TextBox 2.0)	ROUGE-L	64.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AEM+Attention	BLEU-1	14.17	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4	ASR	65.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BART (TextBox 2.0)	ROUGE-L	42.96	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Graph2Seq	BLEU	22	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WGANGP + DGflow	JS-4	0.19	—	Unverified