Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5851–5900 of 10817 papers

Title	Date	Tasks	Status	Hype
An Automated Question-Answering Framework Based on Evolution Algorithm	Jan 26, 2022	Question Answering	—Unverified	0
SCAI-QReCC Shared Task on Conversational Question Answering	Jan 26, 2022	Answer GenerationConversational Question Answering	CodeCode Available	1
DOM-LM: Learning Generalizable Representations for HTML Documents	Jan 25, 2022	AttributeAttribute Extraction	CodeCode Available	1
MGA-VQA: Multi-Granularity Alignment for Visual Question Answering	Jan 25, 2022	Question AnsweringVisual Question Answering	—Unverified	0
SA-VQA: Structured Alignment of Visual and Semantic Representations for Visual Question Answering	Jan 25, 2022	Question AnsweringVisual Question Answering	—Unverified	0
Artefact Retrieval: Overview of NLP Models with Knowledge Base Access	Jan 24, 2022	DiversityFact Checking	—Unverified	0
Question Generation for Evaluating Cross-Dataset Shifts in Multi-modal Grounding	Jan 24, 2022	Question AnsweringQuestion Generation	—Unverified	0
Unified Question Generation with Continual Lifelong Learning	Jan 24, 2022	Lifelong learningQuestion Answering	—Unverified	0
Towards Collaborative Question Answering: A Preliminary Study	Jan 24, 2022	Question Answering	—Unverified	0
Table Pre-training: A Survey on Model Architectures, Pre-training Objectives, and Downstream Tasks	Jan 24, 2022	DenoisingQuestion Answering	CodeCode Available	1
Leaf: Multiple-Choice Question Generation	Jan 22, 2022	Multiple-choiceQuestion Answering	CodeCode Available	1
Question rewriting? Assessing its importance for conversational question answering	Jan 22, 2022	Conversational Question AnsweringQuestion Answering	CodeCode Available	0
Conversational Information Seeking	Jan 21, 2022	Conversational Question AnsweringConversational Recommendation	—Unverified	0
GreaseLM: Graph REASoning Enhanced Language Models for Question Answering	Jan 21, 2022	Knowledge GraphsMedical Question Answering	CodeCode Available	2
Enhanced Knowledge Graphs Using Typed Entailment Graphs	Jan 20, 2022	Knowledge GraphsOpen Information Extraction	—Unverified	0
Knowledge Graph Question Answering Leaderboard: A Community Resource to Prevent a Replication Crisis	Jan 20, 2022	Graph Question AnsweringQuestion Answering	CodeCode Available	1
AstBERT: Enabling Language Model for Financial Code Understanding with Abstract Syntax Trees	Jan 20, 2022	Clone DetectionCode Search	—Unverified	0
Expert Finding in Legal Community Question Answering	Jan 19, 2022	Community Question AnsweringQuestion Answering	CodeCode Available	0
Evaluating Machine Common Sense via Cloze Testing	Jan 19, 2022	Common Sense ReasoningOpen-Ended Question Answering	—Unverified	0
Improving Biomedical Information Retrieval with Neural Retrievers	Jan 19, 2022	Biomedical Information RetrievalInformation Retrieval	—Unverified	0
Do KG-augmented Models Leverage Knowledge as Humans Do?	Jan 17, 2022	Knowledge GraphsQuestion Answering	—Unverified	0
Knowledge Graph Papers @ ICLR 2021	Jan 17, 2022	Complex Query AnsweringEntity Linking	—Unverified	0
Korean-Specific Dataset for Table Question Answering	Jan 17, 2022	Language ModelingLanguage Modelling	CodeCode Available	1
RuMedBench: A Russian Medical Language Understanding Benchmark	Jan 17, 2022	Medical Diagnosisnamed-entity-recognition	CodeCode Available	1
Generalizable Neuro-symbolic Systems for Commonsense Question Answering	Jan 17, 2022	Knowledge GraphsQuestion Answering	—Unverified	0
FORTAP: Using Formulas for Numerical-Reasoning-Aware Table Pretraining	Jan 16, 2022	PredictionQuestion Answering	—Unverified	0
FedNLP: Benchmarking Federated Learning Methods for Natural Language Processing Tasks	Jan 16, 2022	BenchmarkingFederated Learning	—Unverified	0
FAQ Search using Transformers	Jan 16, 2022	Question Answering	—Unverified	0
ERNIE-Layout: Layout-Knowledge Enhanced Multi-modal Pre-training for Document Understanding	Jan 16, 2022	cross-modal alignmentDocument Classification	CodeCode Available	0
Dynamic Relevance Graph Network for Knowledge-Aware Question Answering	Jan 16, 2022	Graph Neural NetworkQuestion Answering	—Unverified	0
Retrieval Enhanced Data Augmentation for Question Answering on Privacy Policies	Jan 16, 2022	Data AugmentationDiversity	—Unverified	0
Interpretable Proof Generation via Iterative Backward Reasoning	Jan 16, 2022	PredictionQuestion Answering	—Unverified	0
On Measuring Social Biases in Prompt-Based Learning	Jan 16, 2022	FormLanguage Modelling	—Unverified	0
XLTime: A Cross-Lingual Knowledge Transfer Framework for Temporal Expression Extraction	Jan 16, 2022	Causal InferenceInformation Retrieval	—Unverified	0
Tapping BERT for Preposition Sense Disambiguation	Jan 16, 2022	Question Answering	—Unverified	0
Modeling Exemplification in Long-form Question Answering via Retrieval	Jan 16, 2022	FormLong Form Question Answering	—Unverified	0
How do QA models combine knowledge from LM and 100 passages?	Jan 16, 2022	Language ModelingLanguage Modelling	—Unverified	0
Consecutive Question Generation with Multitask Joint Reranking and Dynamic Rationale Search	Jan 16, 2022	DiversityInformativeness	—Unverified	0
All You May Need for VQA are Image Captions	Jan 16, 2022	AllImage Captioning	—Unverified	0
Framework for Weakly Supervised Causal Knowledge Extraction from Text	Jan 16, 2022	ManagementNatural Language Inference	—Unverified	0
CL-ReKD: Cross-lingual Knowledge Distillation for Multilingual Retrieval Question Answering	Jan 16, 2022	Knowledge DistillationLanguage Modeling	—Unverified	0
Fine-tuning Strategies for Domain Specific Question Answering under Low Annotation Budget Constraints	Jan 16, 2022	Language ModelingLanguage Modelling	—Unverified	0
Causal Distillation for Language Models	Jan 16, 2022	Language ModelingLanguage Modelling	—Unverified	0
Mosaic Augmentation for Text: Cropping and Collaging as Cross-Domain Techniques	Jan 16, 2022	Abstractive Text SummarizationExtractive Question-Answering	—Unverified	0
Evidentiality-guided Generation for Knowledge-Intensive NLP Tasks	Jan 16, 2022	Fact VerificationMemorization	—Unverified	0
MANGO: Enhancing the Robustness of VQA Models via Adversarial Noise Generation	Jan 16, 2022	Logical ReasoningQuestion Answering	—Unverified	0
StoryQA: Story Grounded Question Answering Dataset	Jan 16, 2022	Question Answering	—Unverified	0
MixQG: Neural Question Generation with Mixed Answer Types	Jan 16, 2022	Multiple-choiceQuestion Answering	—Unverified	0
Re2G: Retrieve, Rerank, Generate	Jan 16, 2022	Fact CheckingGPU	—Unverified	0
Probing the Role of Positional Information in Vision-Language Models	Jan 16, 2022	Contrastive LearningImage-text matching	—Unverified	0

Show:10 25 50

← PrevPage 118 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified