Text Generation

Text Generation is the task of generating text with the goal of appearing indistinguishable to human-written text. This task is more formally known as "natural language generation" in the literature.

Text generation can be addressed with Markov processes or deep generative models like LSTMs. Recently, some of the most advanced methods for text generation include BART, GPT and other GAN-based approaches. Text generation systems are evaluated either through human ratings or automatic evaluation metrics like METEOR, ROUGE, and BLEU.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1551–1600 of 5335 papers

Title	Date	Tasks	Status
Fine-Tuning LLMs with Noisy Data for Political Argument Generation and Post Guidance	Nov 25, 2024	Text Generation	—Unverified
Dynamic Self-Distillation via Previous Mini-batches for Fine-tuning Small Language Models	Nov 25, 2024	Knowledge DistillationNatural Language Understanding	—Unverified
KL-geodesics flow matching with a novel sampling scheme	Nov 25, 2024	Text Generation	—Unverified
Development of Pre-Trained Transformer-based Models for the Nepali Language	Nov 24, 2024	DecoderText Generation	—Unverified
Investigating Factuality in Long-Form Text Generation: The Roles of Self-Known and Self-Unknown	Nov 24, 2024	FormText Generation	—Unverified
Improving Factuality of 3D Brain MRI Report Generation with Paired Image-domain Retrieval and Text-domain Augmentation	Nov 23, 2024	Cross-Modal RetrievalImage to text	—Unverified
Two Heads Are Better Than One: Collaborative LLM Embodied Agents for Human-Robot Interaction	Nov 23, 2024	AI AgentText Generation	—Unverified
MolMetaLM: a Physicochemical Knowledge-Guided Molecular Meta Language Model	Nov 23, 2024	Language ModelingLanguage Modelling	CodeCode Available
Exploring Facets of Language Generation in the Limit	Nov 22, 2024	Language IdentificationText Generation	—Unverified
Benchmarking Multimodal Models for Ukrainian Language Understanding Across Academic and Cultural Domains	Nov 22, 2024	BenchmarkingCaption Generation	—Unverified
The Master-Slave Encoder Model for Improving Patent Text Summarization: A New Approach to Combining Specifications and Claims	Nov 21, 2024	Abstract generationText Generation	—Unverified
GenBFA: An Evolutionary Optimization Approach to Bit-Flip Attacks on LLMs	Nov 21, 2024	MMLUText Generation	—Unverified
Knowledge Graphs, Large Language Models, and Hallucinations: An NLP Perspective	Nov 21, 2024	Knowledge GraphsQuestion Answering	—Unverified
Restructuring Tractable Probabilistic Circuits	Nov 19, 2024	Text Generation	—Unverified
A Combined Encoder and Transformer Approach for Coherent and High-Quality Text Generation	Nov 19, 2024	Text Generation	—Unverified
Do Captioning Metrics Reflect Music Semantic Alignment?	Nov 18, 2024	Music CaptioningText Generation	—Unverified
FedCoLLM: A Parameter-Efficient Federated Co-tuning Framework for Large and Small Language Models	Nov 18, 2024	Text Generation	—Unverified
Anatomy-Guided Radiology Report Generation with Pathology-Aware Regional Prompts	Nov 16, 2024	AnatomyDiagnostic	—Unverified
Debias your Large Multi-Modal Model at Test-Time with Non-Contrastive Visual Attribute Steering	Nov 15, 2024	AttributeLanguage Modeling	—Unverified
LLaMA-Mesh: Unifying 3D Mesh Generation with Language Models	Nov 14, 2024	3D GenerationText Generation	—Unverified
Towards a Classification of Open-Source ML Models and Datasets for Software Engineering	Nov 14, 2024	Code GenerationText Generation	—Unverified
DAHL: Domain-specific Automated Hallucination Evaluation of Long-Form Text through a Benchmark Dataset in Biomedicine	Nov 14, 2024	FormHallucination	CodeCode Available
On the Limits of Language Generation: Trade-Offs Between Hallucination and Mode Collapse	Nov 14, 2024	HallucinationLanguage Modeling	—Unverified
Direct Speech-to-Speech Neural Machine Translation: A Survey	Nov 13, 2024	Machine TranslationSpeech-to-Speech Translation	—Unverified
Trustful LLMs: Customizing and Grounding Text Generation with Knowledge Bases and Dual Decoders	Nov 12, 2024	DecoderHallucination	—Unverified
SCAR: Sparse Conditioned Autoencoders for Concept Detection and Steering in LLMs	Nov 11, 2024	Text Generation	CodeCode Available
Benchmarking LLMs' Judgments with No Gold Standard	Nov 11, 2024	BenchmarkingMachine Translation	CodeCode Available
Probabilistic Consensus through Ensemble Validation: A Framework for LLM Reliability	Nov 10, 2024	Multiple-choiceText Generation	—Unverified
Does This Summary Answer My Question? Modeling Query-Focused Summary Readers with Rational Speech Acts	Nov 10, 2024	Query-focused SummarizationText Generation	CodeCode Available
In-Context Learning for Preserving Patient Privacy: A Framework for Synthesizing Realistic Patient Portal Messages	Nov 10, 2024	De-identificationIn-Context Learning	CodeCode Available
Prompt-Efficient Fine-Tuning for GPT-like Deep Models to Reduce Hallucination and to Improve Reproducibility in Scientific Text Generation Using Stochastic Optimisation Techniques	Nov 10, 2024	Hallucinationparameter-efficient fine-tuning	—Unverified
Quasi-random Multi-Sample Inference for Large Language Models	Nov 9, 2024	DiversityGSM8K	—Unverified
FactLens: Benchmarking Fine-Grained Fact Verification	Nov 8, 2024	BenchmarkingFact Verification	—Unverified
Cyclic Vision-Language Manipulator: Towards Reliable and Fine-Grained Image Interpretation for Automated Report Generation	Nov 8, 2024	counterfactualDecision Making	—Unverified
Image2Text2Image: A Novel Framework for Label-Free Evaluation of Image-to-Text Generation with Text-to-Image Diffusion Models	Nov 8, 2024	Image CaptioningImage Generation	—Unverified
Ev2R: Evaluating Evidence Retrieval in Automated Fact-Checking	Nov 8, 2024	Fact Checkingnlg evaluation	—Unverified
VTechAGP: An Academic-to-General-Audience Text Paraphrase Dataset and Benchmark Models	Nov 7, 2024	Language ModelingLanguage Modelling	—Unverified
Performance-Guided LLM Knowledge Distillation for Efficient Text Classification at Scale	Nov 7, 2024	Active LearningBenchmarking	—Unverified
Interactive Dialogue Agents via Reinforcement Learning on Hindsight Regenerations	Nov 7, 2024	reinforcement-learningReinforcement Learning	—Unverified
FMEA Builder: Expert Guided Text Generation for Equipment Maintenance	Nov 7, 2024	Text Generation	—Unverified
Understanding the Effects of Human-written Paraphrases in LLM-generated Text Detection	Nov 6, 2024	LLM-generated Text DetectionText Detection	CodeCode Available
Advanced RAG Models with Graph Structures: Optimizing Complex Knowledge Reasoning and Text Generation	Nov 6, 2024	Graph Neural NetworkKnowledge Graphs	—Unverified
RAGulator: Lightweight Out-of-Context Detectors for Grounded Text Generation	Nov 6, 2024	Feature EngineeringRAG	—Unverified
From Pixels to Prose: Advancing Multi-Modal Language Models for Remote Sensing	Nov 5, 2024	Change DetectionContrastive Learning	—Unverified
Graph-DPEP: Decomposed Plug and Ensemble Play for Few-Shot Document Relation Extraction with Graph-of-Thoughts Reasoning	Nov 5, 2024	Document-level Relation ExtractionFew-Shot Learning	—Unverified
One VLM to Keep it Learning: Generation and Balancing for Data-free Continual Visual Question Answering	Nov 4, 2024	Continual LearningQuestion Answering	—Unverified
SPES: Spectrogram Perturbation for Explainable Speech-to-Text Generation	Nov 3, 2024	speech-recognitionSpeech Recognition	—Unverified
Rate, Explain and Cite (REC): Enhanced Explanation and Attribution in Automatic Evaluation by Large Language Models	Nov 3, 2024	HallucinationInstruction Following	CodeCode Available
TypeScore: A Text Fidelity Metric for Text-to-Image Generative Models	Nov 2, 2024	Image DescriptionImage Generation	—Unverified
Magnitude Pruning of Large Pretrained Transformer Models with a Mixture Gaussian Prior	Nov 1, 2024	Natural Language UnderstandingQuestion Answering	—Unverified

Show:10 25 50

← PrevPage 32 of 107Next →

All datasets DART COCO Captions EMNLP2017 WMT ReDial CommonGen ROCStories Chinese Poems Czech restaurant information OpenWebText SciQ Yahoo Questions ADGEN

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	T5B Baseline	BLEU	48.74	—	Unverified
2	FactT5B	BLEU	48.37	—	Unverified
3	JointGT Baseline	BLEU	47.51	—	Unverified
4	FactJointGT	BLEU	47.39	—	Unverified
5	Control Prefixes (T5-large)	METEOR	0.41	—	Unverified
6	T5	METEOR	0.12	—	Unverified
7	BART	METEOR	0.11	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LeakGAN	BLEU-2	0.95	—	Unverified
2	partGAN	BLEU-2	0.91	—	Unverified
3	RankGAN	BLEU-2	0.85	—	Unverified
4	RelGAN (100)	BLEU-2	0.85	—	Unverified
5	SeqGAN	BLEU-2	0.83	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LeakGAN	BLEU-2	0.96	—	Unverified
2	PPOGAN	BLEU-2	0.91	—	Unverified
3	RelGAN	BLEU-2	0.88	—	Unverified
4	SeqGAN	BLEU-2	0.86	—	Unverified
5	RankGAN	BLEU-2	0.78	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	UniCRS	Distinct-3	0.65	—	Unverified
2	CRFR	Distinct-3	0.52	—	Unverified
3	KGSF	Distinct-3	0.43	—	Unverified
4	C2CRS	Distinct-3	0.33	—	Unverified
5	KBRD	Distinct-3	0.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	UniLM	CIDEr	14.92	—	Unverified
2	BART (TextBox 2.0)	CIDEr	12.98	—	Unverified
3	BART	METEOR	0.3	—	Unverified
4	T5	METEOR	0.29	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Beam search + A*esque (beam)	BLEU-1	34.4	—	Unverified
2	Beam search + A*esque (sample)	BLEU-1	34.4	—	Unverified
3	Beam search + A*esque (greedy)	BLEU-1	34.3	—	Unverified
4	Beam search	BLEU-1	33.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RankGAN	BLEU-2	0.81	—	Unverified
2	SeqGAN	BLEU-2	0.74	—	Unverified
3	LeakGAN	BLEU-2	0.46	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TGen++	METEOR	0.17	—	Unverified
2	TGen	METEOR	0.15	—	Unverified
3	TGen+	METEOR	0.15	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT2-124M	eval_loss	3.12	—	Unverified
2	GPT2-81M-LOOP	eval_loss	3.11	—	Unverified
3	GPT2-Hermite	eval_loss	2.91	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LLaMA-65B+CFG (zero-shot)	Accuracy	96.6	—	Unverified
2	LLaMA-30B+CFG (zero-shot)	Accuracy	96.4	—	Unverified
3	LLaMA-13B+CFG (zero-shot)	Accuracy	95.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CNN-VAE	NLL	332.1	—	Unverified
2	SA-VAE	NLL	327.5	—	Unverified
3	Aggressive VAE	NLL	326.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BART (TextBox 2.0)	BLEU-4	10.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STWGAN-GP	BLEU-3	0.62	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PALM	ROUGE-L	41.41	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BART (TextBox 2.0)	ROUGE-L	64.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AEM+Attention	BLEU-1	14.17	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4	ASR	65.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BART (TextBox 2.0)	ROUGE-L	42.96	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Graph2Seq	BLEU	22	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WGANGP + DGflow	JS-4	0.19	—	Unverified