Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9751–9775 of 10817 papers

Title	Date	Tasks	Status
Analysing Mathematical Reasoning Abilities of Neural Models	Apr 2, 2019	Mathematical Question AnsweringMathematical Reasoning	CodeCode Available
RefuteBench: Evaluating Refuting Instruction-Following for Large Language Models	Feb 21, 2024	Instruction FollowingMachine Translation	CodeCode Available
Learning to Compose Neural Networks for Question Answering	Jan 7, 2016	Question Answeringreinforcement-learning	CodeCode Available
Combining Lexical and Dense Retrieval for Computationally Efficient Multi-hop Question Answering	Jun 15, 2021	Multi-hop Question AnsweringOpen-Domain Question Answering	CodeCode Available
Regularization of Distinct Strategies for Unsupervised Question Generation	Nov 1, 2020	Few-Shot LearningQuestion Answering	CodeCode Available
Facts That Matter	Oct 1, 2018	ClusteringDiversity	CodeCode Available
Common-Knowledge Concept Recognition for SEVA	Mar 26, 2020	Entity Extraction using GANgraph construction	CodeCode Available
Learning to Deceive Knowledge Graph Augmented Models via Targeted Perturbation	Oct 24, 2020	Knowledge GraphsQuestion Answering	CodeCode Available
Automatic Spanish Translation of the SQuAD Dataset for Multilingual Question Answering	Dec 11, 2019	Question AnsweringTAR	CodeCode Available
Porting an Open Information Extraction System from English to German	Nov 1, 2016	Open Information ExtractionQuestion Answering	CodeCode Available
CommonGen: A Constrained Text Generation Challenge for Generative Commonsense Reasoning	Nov 9, 2019	Common Sense ReasoningQuestion Answering	CodeCode Available
Factor Graph Attention	Apr 11, 2019	Graph AttentionQuestion Answering	CodeCode Available
Fact Checking in Community Forums	Mar 8, 2018	Community Question AnsweringFact Checking	CodeCode Available
Learning to Exploit Structured Resources for Lexical Inference	Jul 1, 2015	Question Answering	CodeCode Available
A Distributional and Orthographic Aggregation Model for English Derivational Morphology	Jul 1, 2018	abstractive question answeringMachine Translation	CodeCode Available
Fact-and-Reflection (FaR) Improves Confidence Calibration of Large Language Models	Feb 27, 2024	Common Sense ReasoningQuestion Answering	CodeCode Available
Natural Language Generation Using Link Grammar for General Conversational Intelligence	Apr 19, 2021	Question AnsweringText Generation	CodeCode Available
Learning to Follow Object-Centric Image Editing Instructions Faithfully	Oct 29, 2023	ObjectQuestion Answering	CodeCode Available
Learning to Generalize for Cross-domain QA	May 14, 2023	Data AugmentationDomain Generalization	CodeCode Available
F1 is Not Enough! Models and Evaluation Towards User-Centered Explainable Question Answering	Oct 13, 2020	Model SelectionQuestion Answering	CodeCode Available
Question Condensing Networks for Answer Selection in Community Question Answering	Jul 1, 2018	Answer SelectionCommunity Question Answering	CodeCode Available
Natural Language Processing for Information Extraction	Jul 6, 2018	Articlescoreference-resolution	CodeCode Available
A Discrete Hard EM Approach for Weakly Supervised Question Answering	Sep 11, 2019	Question AnsweringTriviaQA	CodeCode Available
Portuguese Named Entity Recognition using BERT-CRF	Sep 23, 2019	named-entity-recognitionNamed Entity Recognition	CodeCode Available
Automatic Opinion Question Generation	Nov 1, 2018	Community Question AnsweringQuestion Answering	CodeCode Available

Show:10 25 50

← PrevPage 391 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified