Dialogue Generation

Dialogue generation is the task of "understanding" natural language inputs - within natural language processing in order to produce output. The systems are usually intended for conversing with humans, for instance back and forth dialogue with a conversation agent like a chatbot. Some example benchmarks for this task (see others such as Natural Language Understanding) include FusedChat and Ubuntu DIalogue Corpus (UDC). Models can be evaluated via metrics such as BLEU, ROUGE, and METEOR albeit with challenges in terms of weak correlation with human judgement, that may be addressed by new ones like UnSupervised and Reference-free (USR) and Metric for automatic Unreferenced dialog evaluation (MaUde).

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 501–525 of 606 papers

Title	Date	Tasks	Status
Bridging Cultural Nuances in Dialogue Agents through Cultural Value Surveys	Jan 18, 2024	Dialogue Generation	CodeCode Available
Approximation of Response Knowledge Retrieval in Knowledge-grounded Dialogue Generation	Nov 1, 2020	DecoderDialogue Generation	CodeCode Available
Long-term Control for Dialogue Generation: Methods and Evaluation	May 15, 2022	Dialogue GenerationResponse Generation	CodeCode Available
Long Time No See! Open-Domain Conversation with Long-Term Persona Memory	Mar 11, 2022	Dialogue GenerationManagement	CodeCode Available
Improving Knowledge-aware Dialogue Generation via Knowledge Base Question Answering	Dec 16, 2019	Dialogue GenerationKnowledge Base Question Answering	CodeCode Available
ReCoSa: Detecting the Relevant Contexts with Self-Attention for Multi-turn Dialogue Generation	Jul 9, 2019	Dialogue GenerationResponse Generation	CodeCode Available
DialoGen: Generalized Long-Range Context Representation for Dialogue Systems	Oct 12, 2022	Conversational Response GenerationDecoder	CodeCode Available
Improving Context Modelling in Multimodal Dialogue Generation	Oct 20, 2018	DecoderDialogue Generation	CodeCode Available
DESED: Dialogue-based Explanation for Sentence-level Event Detection	Oct 1, 2022	Dialogue GenerationEvent Detection	CodeCode Available
Another Diversity-Promoting Objective Function for Neural Dialogue Generation	Nov 20, 2018	Dialogue GenerationDiversity	CodeCode Available
Improving Conditional Sequence Generative Adversarial Networks by Stepwise Evaluation	Aug 16, 2018	Dialogue Generation	CodeCode Available
MDIA: A Benchmark for Multilingual Dialogue Generation in 46 Languages	Aug 27, 2022	ChatbotDialogue Generation	CodeCode Available
Adaptive Parameterization for Neural Dialogue Generation	Jan 18, 2020	DecoderDialogue Generation	CodeCode Available
Measuring and Improving Semantic Diversity of Dialogue Generation	Oct 11, 2022	Dialogue GenerationDiversity	CodeCode Available
Importance of Search and Evaluation Strategies in Neural Dialogue Modeling	Nov 2, 2018	Dialogue GenerationDiversity	CodeCode Available
MedDialog: Large-scale Medical Dialogue Datasets	Nov 1, 2020	Dialogue GenerationTransfer Learning	CodeCode Available
IMAD: IMage-Augmented multi-modal Dialogue	May 17, 2023	Dialogue GenerationQuestion Answering	CodeCode Available
Concept Matching with Agent for Out-of-Distribution Detection	May 27, 2024	Dialogue GenerationOut-of-Distribution Detection	CodeCode Available
BoK: Introducing Bag-of-Keywords Loss for Interpretable Dialogue Response Generation	Jan 17, 2025	DecoderDialogue Evaluation	CodeCode Available
Relevance of Unsupervised Metrics in Task-Oriented Dialogue for Evaluating Natural Language Generation	Jun 29, 2017	Dialogue GenerationDiversity	CodeCode Available
MELD: A Multimodal Multi-Party Dataset for Emotion Recognition in Conversations	Oct 5, 2018	Dialogue GenerationEmotion Recognition	CodeCode Available
Unsupervised Knowledge Selection for Dialogue Generation	Aug 1, 2021	Dialogue Generation	CodeCode Available
Hierarchical Text Generation using an Outline	Oct 20, 2018	Dialogue Generationspeech-recognition	CodeCode Available
Meta-Context Transformers for Domain-Specific Response Generation	Oct 12, 2020	Dialogue GenerationLanguage Modeling	CodeCode Available
Towards Less Generic Responses in Neural Conversation Models: A Statistical Re-weighting Method	Oct 1, 2018	Dialogue GenerationMachine Translation	CodeCode Available

Show:10 25 50

← PrevPage 21 of 25Next →

All datasets Persona-Chat FusedChat Harry Potter Dialogue Dataset Amazon-5 CMU DoG PG-19 Reddit (multi-ref)Twitter Dialogue (Noun)Twitter Dialogue (Tense)Ubuntu Dialogue (Activity)Ubuntu Dialogue (Cmd)Ubuntu Dialogue (Entity)

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	LMEDR	Avg F1	21.99	—	Unverified
2	P^2 Bot	Avg F1	19.77	—	Unverified
3	TransferTransfo	Avg F1	19.09	—	Unverified
4	Seq2Seq + Attention	Avg F1	16.18	—	Unverified
5	Synthesizer (R+V)	BLEU-1	14.7	—	Unverified
6	KV Profile Memory	Avg F1	11.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Classification-based model	Slot Accuracy	0.97	—	Unverified
2	Two-in-one model	Slot Accuracy	0.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	EVA	mauve	0.97	—	Unverified
2	Per-BOB	mauve	0.95	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	mm	1 in 10 R@2	5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	∞-former (Sticky memories)	F1	9.01	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	∞-former (Sticky memories + initialized GPT-2 Small)	Perplexity	32.48	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SpaceFusion	interest (human)	2.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MrRNN Act.-Ent.	F1	4.63	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MrRNN Act.-Ent.	Accuracy	34.48	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MrRNN Act.-Ent.	F1	11.43	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MrRNN Act.-Ent.	Accuracy	95.04	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MrRNN Act.-Ent.	F1	3.72	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MrRNN Act.-Ent.	Accuracy	29.01	—	Unverified