Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3451–3500 of 10817 papers

Title	Date	Tasks	Status	Score
IQA: Interactive Query Construction in Semantic Question Answering Systems	Jun 20, 2020	Question Answering	CodeCode Available	5
RepLiQA: A Question-Answering Dataset for Benchmarking LLMs on Unseen Reference Content	Jun 17, 2024	BenchmarkingGeneral Knowledge	CodeCode Available	5
Investigating the Shortcomings of LLMs in Step-by-Step Legal Reasoning	Feb 8, 2025	Legal ReasoningMultiple-choice	CodeCode Available	5
IQ-VQA: Intelligent Visual Question Answering	Jul 8, 2020	Question AnsweringVisual Question Answering	CodeCode Available	5
IUCM at SemEval-2018 Task 11: Similar-Topic Texts as a Comprehension Knowledge Source	Jun 1, 2018	ClusteringLemmatization	CodeCode Available	5
Introducing MathQA -- A Math-Aware Question Answering System	Jun 28, 2019	MathQuestion Answering	CodeCode Available	5
Investigating Post-pretraining Representation Alignment for Cross-Lingual Question Answering	Sep 24, 2021	Cross-Lingual Question AnsweringQuestion Answering	CodeCode Available	5
IntKB: A Verifiable Interactive Framework for Knowledge Base Completion	Dec 1, 2020	Knowledge Base CompletionQuestion Answering	CodeCode Available	5
InterroLang: Exploring NLP Models and Datasets through Dialogue-based Explanations	Oct 9, 2023	Dialogue Act ClassificationHate Speech Detection	CodeCode Available	5
Intrinsic Subgraph Generation for Interpretable Graph based Visual Question Answering	Mar 26, 2024	Decision MakingExplainable artificial intelligence	CodeCode Available	5
Interpretable Natural Language Segmentation Based on Link Grammar	Nov 14, 2020	Question AnsweringRetrieval	CodeCode Available	5
Evaluating Fairness in Large Vision-Language Models Across Diverse Demographic Attributes and Prompts	Jun 25, 2024	FairnessQuestion Answering	CodeCode Available	5
Audiopedia: Audio QA with Knowledge	Dec 29, 2024	Audio Question AnsweringEntity Linking	CodeCode Available	5
Interpretable Proof Generation via Iterative Backward Reasoning	May 22, 2022	Question Answering	CodeCode Available	5
CROPE: Evaluating In-Context Adaptation of Vision and Language Models to Culture-Specific Concepts	Oct 20, 2024	Question AnsweringVisual Question Answering	CodeCode Available	5
Interpretable Multi-hop Reasoning for Forecasting Future Links on Temporal Knowledge Graphs	Sep 29, 2021	Knowledge GraphsQuestion Answering	CodeCode Available	5
Interactive Text Ranking with Bayesian Optimisation: A Case Study on Community QA and Summarisation	Nov 22, 2019	Bayesian OptimisationCommunity Question Answering	CodeCode Available	5
Leveraging QA Datasets to Improve Generative Data Augmentation	May 25, 2022	Common Sense ReasoningData Augmentation	CodeCode Available	5
Jack the Reader -- A Machine Reading Framework	Jul 1, 2018	ArticlesInformation Retrieval	CodeCode Available	5
CRiskEval: A Chinese Multi-Level Risk Evaluation Benchmark Dataset for Large Language Models	Jun 7, 2024	Multiple-choicePhilosophy	CodeCode Available	5
CRIPP-VQA: Counterfactual Reasoning about Implicit Physical Properties via Video Question Answering	Nov 7, 2022	Add - POAdd - PQ	CodeCode Available	5
Interactive Instance-based Evaluation of Knowledge Base Question Answering	Nov 1, 2018	Entity LinkingKnowledge Base Question Answering	CodeCode Available	5
Intelligent Assistant for People with Low Vision Abilities	Nov 20, 2017	Question Answering	CodeCode Available	5
Integrating question answering and text-to-SQL in Portuguese	Feb 8, 2022	Question AnsweringText to SQL	CodeCode Available	5
Integrating Semantic Knowledge into Lexical Embeddings Based on Information Content Measurement	Apr 1, 2017	Document ClassificationInformation Retrieval	CodeCode Available	5
Intent Classification in Question-Answering Using LSTM Architectures	Jan 25, 2020	ClassificationGeneral Classification	CodeCode Available	5
Instruction Makes a Difference	Feb 1, 2024	HallucinationInstruction Following	CodeCode Available	5
Crake: Causal-Enhanced Table-Filler for Question Answering over Large Scale Knowledge Base	Jul 8, 2022	Question AnsweringRelation Extraction	CodeCode Available	5
Attribute Diversity Determines the Systematicity Gap in VQA	Nov 15, 2023	AttributeDiagnostic	CodeCode Available	5
Analyzing Vietnamese Legal Questions Using Deep Neural Networks with Biaffine Classifiers	Apr 27, 2023	Dependency ParsingPOS	CodeCode Available	5
Integrating Image Features with Convolutional Sequence-to-sequence Network for Multilingual Visual Question Answering	Mar 22, 2023	Question AnsweringVisual Question Answering	CodeCode Available	5
Attributed and Predictive Entity Embedding for Fine-Grained Entity Typing in Knowledge Bases	Aug 1, 2018	Entity LinkingEntity Typing	CodeCode Available	5
Crafting In-context Examples according to LMs' Parametric Knowledge	Nov 16, 2023	HallucinationIn-Context Learning	CodeCode Available	5
AttenWalker: Unsupervised Long-Document Question Answering via Attention-based Graph Walking	May 3, 2023	Few-Shot LearningQuestion Answering	CodeCode Available	5
A Discrete Hard EM Approach for Weakly Supervised Question Answering	Sep 11, 2019	Question AnsweringTriviaQA	CodeCode Available	5
Injecting Numerical Reasoning Skills into Knowledge Base Question Answering Models	Dec 12, 2021	Data AugmentationKnowledge Base Question Answering	CodeCode Available	5
Attentive Pooling Networks	Feb 11, 2016	Answer SelectionQuestion Answering	CodeCode Available	5
CQASUMM: Building References for Community Question Answering Summarization Corpora	Nov 12, 2018	Community Question AnsweringDocument Summarization	CodeCode Available	5
Attentive History Selection for Conversational Question Answering	Aug 26, 2019	Conversational Question AnsweringConversational Search	CodeCode Available	5
Analyzing the Behavior of Visual Question Answering Models	Jun 23, 2016	Question AnsweringVisual Question Answering	CodeCode Available	5
Inducing Temporal Relations from Time Anchor Annotation	Jun 1, 2018	ArticlesInformativeness	CodeCode Available	5
Inexpensive Domain Adaptation of Pretrained Language Models: Case Studies on Biomedical NER and Covid-19 QA	Apr 7, 2020	Domain Adaptationnamed-entity-recognition	CodeCode Available	5
Analyzing Sustainability Reports Using Natural Language Processing	Nov 3, 2020	Question Answering	CodeCode Available	5
Inferring Implicit Relations in Complex Questions with Language Models	Apr 28, 2022	Implicit RelationsQuestion Answering	CodeCode Available	5
Interactive Machine Comprehension with Information Seeking Agents	Aug 27, 2019	Decision MakingInformation Retrieval	CodeCode Available	5
Incremental and Iterative Learning of Answer Set Programs from Mutually Distinct Examples	Feb 22, 2018	BIG-bench Machine LearningHandwritten Digit Recognition	CodeCode Available	5
CODAH: An Adversarially Authored Question-Answer Dataset for Common Sense	Apr 8, 2019	Common Sense ReasoningQuestion Answering	CodeCode Available	5
Analyzing Social Biases in Japanese Large Language Models	Jun 4, 2024	Question Answering	CodeCode Available	5
A Qualitative Comparison of CoQA, SQuAD 2.0 and QuAC	Sep 27, 2018	Question Answering	CodeCode Available	5
COV19IR : COVID-19 Domain Literature Information Retrieval	Nov 8, 2022	Information RetrievalQuestion Answering	CodeCode Available	5

Show:10 25 50

← PrevPage 70 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified