Data-to-Text Generation

A classic problem in natural-language generation (NLG) involves taking structured data, such as a table, as input, and producing text that adequately and fluently describes this data as output. Unlike machine translation, which aims for complete transduction of the sentence to be translated, this form of NLG is usually taken to require addressing (at least) two separate challenges: what to say, the selection of an appropriate subset of the input data to discuss, and how to say it, the surface realization of a generation.

( Image credit: Data-to-Text Generation with Content Selection and Planning )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–10 of 219 papers

Title	Date	Tasks	Status	Hype
Large Language Models as Span Annotators	Apr 11, 2025	Data-to-Text GenerationMachine Translation	—Unverified	0
SCOPE: A Self-supervised Framework for Improving Faithfulness in Conditional Text Generation	Feb 19, 2025	Conditional Text GenerationData-to-Text Generation	—Unverified	0
Evaluation of NMT-Assisted Grammar Transfer for a Multi-Language Configurable Data-to-Text System	Jan 27, 2025	Data-to-Text GenerationMachine Translation	—Unverified	0
Curriculum Learning for Cross-Lingual Data-to-Text Generation With Noisy Data	Dec 18, 2024	Data-to-Text GenerationText Generation	—Unverified	0
An Extensive Evaluation of Factual Consistency in Large Language Models for Data-to-Text Generation	Nov 28, 2024	Data-to-Text GenerationText Generation	—Unverified	0
Ontology-Free General-Domain Knowledge Graph-to-Text Generation Dataset Synthesis using Large Language Model	Sep 11, 2024	Data-to-Text GenerationGraph-to-Sequence	CodeCode Available	1
Impact of Model Size on Fine-tuned LLM Performance in Data-to-Text Generation: A State-of-the-Art Investigation	Jul 19, 2024	Data-to-Text GenerationInformativeness	—Unverified	0
Modeling Comparative Logical Relation with Contrastive Learning for Text Generation	Jun 13, 2024	Contrastive LearningData-to-Text Generation	—Unverified	0
SPOR: A Comprehensive and Practical Evaluation Method for Compositional Generalization in Data-to-Text Generation	May 17, 2024	Data-to-Text GenerationText Generation	CodeCode Available	0
Bridging the Gap between Different Vocabularies for LLM Ensemble	Apr 15, 2024	Arithmetic ReasoningData-to-Text Generation	CodeCode Available	1

Show:10 25 50

← PrevPage 1 of 22Next →

All datasets WebNLG E2E NLG Challenge WebNLG Full Cleaned E2E NLG Challenge RotoWire RotoWire (Relation Generation)ToTTo XAlign DART MULTIWOZ 2.1 RotoWire (Content Ordering)Rotowire (Content Selection)

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Fact-aware embedding with mT5	BLEU4	29.27	—	Unverified
2	Bi-lingual mT5	BLEU4	25.88	—	Unverified
3	mT5	BLEU4	25	—	Unverified
4	Vanilla Transformer	BLEU4	19.9	—	Unverified
5	Translate-Output mT5	BLEU4	18.91	—	Unverified
6	Graph Attention Network Encoder +Transformer Decoder	BLEU4	18.3	—	Unverified