Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9426–9450 of 10817 papers

Title	Date	Tasks	Status
Gotta: Generative Few-shot Question Answering by Prompt-based Cloze Data Augmentation	Jun 7, 2023	Data AugmentationQuestion Answering	CodeCode Available
Knowledge Graph Embedding via Dynamic Mapping Matrix	Jul 1, 2015	Graph EmbeddingKnowledge Graph Completion	CodeCode Available
Question-Answering Approach to Evaluating Legal Summaries	Sep 26, 2023	Question Answering	CodeCode Available
Gold: A Global and Local-aware Denoising Framework for Commonsense Knowledge Graph Noise Detection	Oct 18, 2023	DenoisingKnowledge Graphs	CodeCode Available
Question Answering as Global Reasoning over Semantic Abstractions	Jun 9, 2019	Information RetrievalMultiple-choice	CodeCode Available
Are you tough enough? Framework for Robustness Validation of Machine Comprehension Systems	Dec 5, 2018	Question AnsweringReading Comprehension	CodeCode Available
GNN2R: Weakly-Supervised Rationale-Providing Question Answering over Knowledge Graphs	Dec 4, 2023	Explanation GenerationGraph Neural Network	CodeCode Available
GloVe: Global Vectors for Word Representation	Oct 1, 2014	Document ClassificationInformation Retrieval	CodeCode Available
GlossGPT: GPT for Word Sense Disambiguation using Few-shot Chain-of-Thought Prompting	Mar 1, 2025	Question AnsweringWord Sense Disambiguation	CodeCode Available
PediaBench: A Comprehensive Chinese Pediatric Dataset for Benchmarking Large Language Models	Dec 9, 2024	BenchmarkingInstruction Following	CodeCode Available
GLoMo: Unsupervisedly Learned Relational Graphs as Transferable Representations	Jun 14, 2018	image-classificationImage Classification	CodeCode Available
Peek Across: Improving Multi-Document Modeling via Cross-Document Question-Answering	May 24, 2023	Query-focused SummarizationQuestion Answering	CodeCode Available
Beyond Accuracy: A Consolidated Tool for Visual Question Answering Benchmarking	Oct 11, 2021	BenchmarkingQuestion Answering	CodeCode Available
Peering into the Mind of Language Models: An Approach for Attribution in Contextual Question Answering	May 28, 2024	Question Answering	CodeCode Available
Multilevel Hierarchical Network with Multiscale Sampling for Video Question Answering	May 9, 2022	multimodal interactionQuestion Answering	CodeCode Available
Beyond 512 Tokens: Siamese Multi-depth Transformer-based Hierarchical Encoder for Long-Form Document Matching	Apr 26, 2020	ClusteringForm	CodeCode Available
Globally Normalized Reader	Sep 8, 2017	Data AugmentationQuestion Answering	CodeCode Available
Better RAG using Relevant Information Gain	Jul 16, 2024	DiversityQuestion Answering	CodeCode Available
AdvisorQA: Towards Helpful and Harmless Advice-seeking Question Answering with Collective Intelligence	Apr 18, 2024	Question Answering	CodeCode Available
A BERT Baseline for the Natural Questions	Jan 24, 2019	Natural QuestionsQuestion Answering	CodeCode Available
Question Answering by Reasoning Across Documents with Graph Convolutional Networks	Aug 29, 2018	Question AnsweringReading Comprehension	CodeCode Available
Give me Some Hard Questions: Synthetic Data Generation for Clinical QA	Dec 5, 2024	Question AnsweringQuestion Generation	CodeCode Available
Knowledge-Guided Prompt Learning for Request Quality Assurance in Public Code Review	Oct 29, 2024	Prompt LearningQuestion Answering	CodeCode Available
GETT-QA: Graph Embedding based T2T Transformer for Knowledge Graph Question Answering	Mar 23, 2023	Graph EmbeddingGraph Question Answering	CodeCode Available
Better Explain Transformers by Illuminating Important Information	Jan 18, 2024	Question Answering	CodeCode Available

Show:10 25 50

← PrevPage 378 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified