Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5451–5500 of 10817 papers

Title	Date	Tasks	Status	Hype
cViL: Cross-Lingual Training of Vision-Language Models using Knowledge Distillation	Jun 7, 2022	Knowledge DistillationQuestion Answering	CodeCode Available	0
No Parameter Left Behind: How Distillation and Model Size Affect Zero-Shot Retrieval	Jun 6, 2022	Argument RetrievalBiomedical Information Retrieval	CodeCode Available	1
Learning to Ask Like a Physician	Jun 6, 2022	Question AnsweringQuestion Generation	CodeCode Available	1
Investigating the use of Paraphrase Generation for Question Reformulation in the FRANK QA system	Jun 6, 2022	Paraphrase GenerationQuestion Answering	—Unverified	0
Invariant Grounding for Video Question Answering	Jun 6, 2022	Question AnsweringVideo Question Answering	CodeCode Available	1
From Pixels to Objects: Cubic Visual Attention for Visual Question Answering	Jun 4, 2022	ObjectQuestion Answering	—Unverified	0
QAGCN: Answering Multi-Relation Questions via Single-Step Implicit Reasoning over Knowledge Graphs	Jun 3, 2022	Decision MakingKnowledge Graphs	CodeCode Available	0
TCE at Qur'an QA 2022: Arabic Language Question Answering Over Holy Qur'an Using a Post-Processed Ensemble of BERT-based Models	Jun 3, 2022	Ensemble LearningNatural Language Understanding	CodeCode Available	1
A-OKVQA: A Benchmark for Visual Question Answering using World Knowledge	Jun 3, 2022	Question AnsweringVisual Question Answering	CodeCode Available	1
Egocentric Video-Language Pretraining	Jun 3, 2022	Action RecognitionContrastive Learning	CodeCode Available	2
MultiHiertt: Numerical Reasoning over Multi Hierarchical Tabular and Textual Data	Jun 3, 2022	Question Answering	CodeCode Available	1
Revisiting the "Video" in Video-Language Understanding	Jun 3, 2022	BenchmarkingQuestion Answering	CodeCode Available	1
VL-BEiT: Generative Vision-Language Pretraining	Jun 2, 2022	image-classificationImage Classification	—Unverified	0
REVIVE: Regional Visual Representation Matters in Knowledge-Based Visual Question Answering	Jun 2, 2022	Question AnsweringRetrieval	CodeCode Available	1
Structured Two-stream Attention Network for Video Question Answering	Jun 2, 2022	Question AnsweringVideo Question Answering	—Unverified	0
FinMath: Injecting a Tree-structured Solver for Question Answering over Financial Reports	Jun 1, 2022	Question Answering	—Unverified	0
eRock at Qur’an QA 2022: Contemporary Deep Neural Networks for Qur’an based Reading Comprehension Question Answers	Jun 1, 2022	Data AugmentationQuestion Answering	—Unverified	0
Building a Dataset for Automatically Learning to Detect Questions Requiring Clarification	Jun 1, 2022	Question Answering	—Unverified	0
Qur’an QA 2022: Overview of The First Shared Task on Question Answering over the Holy Qur’an	Jun 1, 2022	Machine Reading ComprehensionQuestion Answering	—Unverified	0
QQATeam at Qur’an QA 2022: Fine-Tunning Arabic QA Models for Qur’an QA Task	Jun 1, 2022	DeblurringQuestion Answering	—Unverified	0
DTW at Qur’an QA 2022: Utilising Transfer Learning with Transformers for Question Answering in a Low-resource Domain	Jun 1, 2022	Ensemble LearningMachine Reading Comprehension	CodeCode Available	0
An Open Source Contractual Language Understanding Application Using Machine Learning	Jun 1, 2022	Document Text ClassificationInformation Retrieval	CodeCode Available	0
Task-Driven and Experience-Based Question Answering Corpus for In-Home Robot Application in the House3D Virtual Environment	Jun 1, 2022	General KnowledgeQuestion Answering	CodeCode Available	0
SMASH at Qur’an QA 2022: Creating Better Faithful Data Splits for Low-resourced Question Answering Scenarios	Jun 1, 2022	Language ModelingLanguage Modelling	CodeCode Available	0
LARSA22 at Qur’an QA 2022: Text-to-Text Transformer for Finding Answers to Questions from Qur’an	Jun 1, 2022	Language ModelingLanguage Modelling	—Unverified	0
TCE at Qur’an QA 2022: Arabic Language Question Answering Over Holy Qur’an Using a Post-Processed Ensemble of BERT-based Models	Jun 1, 2022	Ensemble LearningNatural Language Understanding	CodeCode Available	1
RadQA: A Question Answering Dataset to Improve Comprehension of Radiology Reports	Jun 1, 2022	Question AnsweringReading Comprehension	—Unverified	0
VIMQA: A Vietnamese Dataset for Advanced Reasoning and Explainable Multi-hop Question Answering	Jun 1, 2022	Multi-hop Question AnsweringQuestion Answering	CodeCode Available	1
Introducing RezoJDM16k: a French KnowledgeGraph DataSet for Link Prediction	Jun 1, 2022	16kBenchmarking	—Unverified	0
Question Answering Classification for Amharic Social Media Community Based Questions	Jun 1, 2022	8kQuestion Answering	CodeCode Available	1
LK2022 at Qur’an QA 2022: Simple Transformers Model for Finding Answers to Questions from Qur’an	Jun 1, 2022	Question AnsweringReading Comprehension	—Unverified	0
HRCA+: Advanced Multiple-choice Machine Reading Comprehension Method	Jun 1, 2022	Machine Reading ComprehensionMultiple-choice	—Unverified	0
Stars at Qur’an QA 2022: Building Automatic Extractive Question Answering Systems for the Holy Qur’an with Transformer Models and Releasing a New Dataset	Jun 1, 2022	Extractive Question-AnsweringInformation Retrieval	—Unverified	0
GOF at Qur’an QA 2022: Towards an Efficient Question Answering For The Holy Qu’ran In The Arabic Language Using Deep Learning-Based Approach	Jun 1, 2022	Question Answering	—Unverified	0
niksss at Qur’an QA 2022: A Heavily Optimized BERT Based Model for Answering Questions from the Holy Qu’ran	Jun 1, 2022	ClusteringQuestion Answering	—Unverified	0
FQuAD2.0: French Question Answering and Learning When You Don’t Know	Jun 1, 2022	ArticlesFQuAD	—Unverified	0
Fine-tuning vs From Scratch: Do Vision & Language Models Have Similar Capabilities on Out-of-Distribution Visual Question Answering?	Jun 1, 2022	Question AnsweringVisual Question Answering	—Unverified	0
Argument Similarity Assessment in German for Intelligent Tutoring: Crowdsourced Dataset and First Experiments	Jun 1, 2022	Question Answeringtext-classification	—Unverified	0
Natural Questions in Icelandic	Jun 1, 2022	Extractive Question-AnsweringNatural Questions	—Unverified	0
Elvis vs. M. Jackson: Who has More Albums? Classification and Identification of Elements in Comparative Questions	Jun 1, 2022	Binary ClassificationQuestion Answering	—Unverified	0
Do Transformer Networks Improve the Discovery of Rules from Text?	Jun 1, 2022	Language ModelingLanguage Modelling	—Unverified	0
Domain Mismatch Doesn’t Always Prevent Cross-lingual Transfer Learning	Jun 1, 2022	Bilingual Lexicon InductionCross-Lingual Transfer	—Unverified	0
Russian Jeopardy! Data Set for Question-Answering Systems	Jun 1, 2022	named-entity-recognitionNamed Entity Recognition	CodeCode Available	0
DeepREF: A Framework for Optimized Deep Learning-based Relation Classification	Jun 1, 2022	Deep LearningQuestion Answering	CodeCode Available	0
Question Generation and Answering for exploring Digital Humanities collections	Jun 1, 2022	Question AnsweringQuestion Generation	—Unverified	0
Know Better – A Clickbait Resolving Challenge	Jun 1, 2022	ArticlesClickbait Detection	—Unverified	0
Question Modifiers in Visual Question Answering	Jun 1, 2022	Natural Language UnderstandingQuestion Answering	—Unverified	0
Improving Event Duration Question Answering by Leveraging Existing Temporal Information Extraction Data	Jun 1, 2022	Question AnsweringTemporal Information Extraction	CodeCode Available	0
Multilingual Image Corpus – Towards a Multimodal and Multilingual Dataset	Jun 1, 2022	Caption Generationimage-classification	—Unverified	0
A STEP towards Interpretable Multi-Hop Reasoning:Bridge Phrase Identification and Query Expansion	Jun 1, 2022	Multi-hop Question AnsweringQuestion Answering	—Unverified	0

Show:10 25 50

← PrevPage 110 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified