Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6851–6900 of 10817 papers

Title	Date	Tasks	Status	Hype
`Just because you are right, doesn't mean I am wrong': Overcoming a bottleneck in development and evaluation of Open-Ended VQA tasks	Apr 1, 2021	Question AnsweringVisual Question Answering	—Unverified	0
Complex Question Answering on knowledge graphs using machine translation and multi-task learning	Apr 1, 2021	Entity LinkingKnowledge Graphs	—Unverified	0
Structural Encoding and Pre-training Matter: Adapting BERT for Table-Based Fact Verification	Apr 1, 2021	Fact VerificationGraph Neural Network	—Unverified	0
FeTaQA: Free-form Table Question Answering	Apr 1, 2021	FormQuestion Answering	CodeCode Available	1
CUPID: Adaptive Curation of Pre-training Data for Video-and-Language Representation Learning	Apr 1, 2021	Question AnsweringRepresentation Learning	—Unverified	0
Integrating Subgraph-aware Relation and DirectionReasoning for Question Answering	Apr 1, 2021	Question AnsweringRelation	—Unverified	0
Towards General Purpose Vision Systems	Apr 1, 2021	Question AnsweringVisual Question Answering	CodeCode Available	1
UC2: Universal Cross-lingual Cross-modal Vision-and-Language Pre-training	Apr 1, 2021	Image-text matchingImage-text Retrieval	—Unverified	0
Are Bias Mitigation Techniques for Deep Learning Effective?	Apr 1, 2021	Deep LearningQuestion Answering	CodeCode Available	1
Analysis on Image Set Visual Question Answering	Mar 31, 2021	Question AnsweringVisual Question Answering	—Unverified	0
AGQA: A Benchmark for Compositional Spatio-Temporal Reasoning	Mar 30, 2021	Question AnsweringVideo Question Answering	—Unverified	0
Domain-robust VQA with diverse datasets and methods but no target labels	Mar 29, 2021	Domain AdaptationObject Recognition	—Unverified	0
SUTD-TrafficQA: A Question Answering Benchmark and an Efficient Network for Video Reasoning over Traffic Events	Mar 29, 2021	Autonomous VehiclesBenchmarking	CodeCode Available	1
Generic Attention-model Explainability for Interpreting Bi-Modal and Encoder-Decoder Transformers	Mar 29, 2021	DecoderImage Segmentation	CodeCode Available	1
'Just because you are right, doesn't mean I am wrong': Overcoming a Bottleneck in the Development and Evaluation of Open-Ended Visual Question Answering (VQA) Tasks	Mar 28, 2021	Question AnsweringVisual Question Answering	CodeCode Available	0
InsertGNN: Can Graph Neural Networks Outperform Humans in TOEFL Sentence Insertion Problem?	Mar 28, 2021	Graph Neural NetworkQuestion Answering	—Unverified	0
A Comprehensive Review of the Video-to-Text Problem	Mar 27, 2021	Question AnsweringRetrieval	CodeCode Available	1
You Can Do Better! If You Elaborate the Reason When Making Prediction	Mar 27, 2021	Multiple-choiceNatural Language Inference	—Unverified	0
Generating and Evaluating Explanations of Attended and Error-Inducing Input Regions for VQA Models	Mar 26, 2021	Question AnsweringVisual Question Answering	—Unverified	0
On the hidden treasure of dialog in video question answering	Mar 26, 2021	Question AnsweringVideo Question Answering	CodeCode Available	1
Visual Grounding Strategies for Text-Only Natural Language Processing	Mar 25, 2021	Image RetrievalLanguage Modeling	—Unverified	0
UNICORN on RAINBOW: A Universal Commonsense Reasoning Model on a New Multitask Benchmark	Mar 24, 2021	Common Sense ReasoningHellaSwag	CodeCode Available	1
Fabula Entropy Indexing: Objective Measures of Story Coherence	Mar 23, 2021	Question AnsweringStory Generation	—Unverified	0
QuestEval: Summarization Asks for Fact-based Evaluation	Mar 23, 2021	Question Answering	CodeCode Available	1
Multi-Modal Answer Validation for Knowledge-Based VQA	Mar 23, 2021	Question AnsweringRetrieval	CodeCode Available	1
Complex Factoid Question Answering with a Free-Text Knowledge Graph	Mar 23, 2021	Graph Neural NetworkGraph Question Answering	—Unverified	0
Mitigating False-Negative Contexts in Multi-document Question Answering with Retrieval Marginalization	Mar 22, 2021	Question AnsweringRetrieval	CodeCode Available	0
Open Domain Question Answering over Tables via Dense Retrieval	Mar 22, 2021	Natural QuestionsOpen-Domain Question Answering	—Unverified	0
How to Design Sample and Computationally Efficient VQA Models	Mar 22, 2021	Question AnsweringVisual Question Answering	—Unverified	0
Complementary Evidence Identification in Open-Domain Question Answering	Mar 22, 2021	DiversityEvidence Selection	—Unverified	0
Self-Supervised Test-Time Learning for Reading Comprehension	Mar 20, 2021	Question AnsweringReading Comprehension	—Unverified	0
Attention-based model for predicting question relatedness on Stack Overflow	Mar 19, 2021	Question AnsweringSentence	—Unverified	0
Controllable Generation from Pre-trained Language Models via Inverse Prompting	Mar 19, 2021	Language ModelingLanguage Modelling	CodeCode Available	1
A Comprehensive Survey of Scene Graphs: Generation and Application	Mar 17, 2021	Image CaptioningQuestion Answering	—Unverified	0
SILT: Efficient transformer training for inter-lingual inference	Mar 17, 2021	Cross-Lingual Natural Language InferenceNatural Language Inference	CodeCode Available	0
Automatic Generation of Contrast Sets from Scene Graphs: Probing the Compositional Consistency of GQA	Mar 17, 2021	Question AnsweringRelational Reasoning	CodeCode Available	0
Towards Few-Shot Fact-Checking via Perplexity	Mar 17, 2021	Fact CheckingFew-Shot Learning	—Unverified	0
KGSynNet: A Novel Entity Synonyms Discovery Framework with Knowledge Graph	Mar 16, 2021	Entity LinkingKnowledge Graphs	—Unverified	0
A Multilingual African Embedding for FAQ Chatbots	Mar 16, 2021	ChatbotQuestion Answering	—Unverified	0
ParaQA: A Question Answering Dataset with Paraphrase Responses for Single-Turn Conversation	Mar 13, 2021	Conversational Question AnsweringKnowledge Graphs	CodeCode Available	0
Context Transformer with Stacked Pointer Networks for Conversational Question Answering over Knowledge Graphs	Mar 13, 2021	Conversational Question AnsweringKnowledge Graphs	CodeCode Available	0
Characterizing Misclassifications of Deep NLP Models	Mar 12, 2021	named-entity-recognitionNamed Entity Recognition	—Unverified	0
Cooperative Self-training of Machine Reading Comprehension	Mar 12, 2021	Extractive Question-AnsweringMachine Reading Comprehension	CodeCode Available	1
Conversational Answer Generation and Factuality for Reading Comprehension Question-Answering	Mar 11, 2021	Answer GenerationPassage Ranking	—Unverified	0
Knowledge Graph Question Answering using Graph-Pattern Isomorphism	Mar 11, 2021	Domain AdaptationGraph Question Answering	CodeCode Available	1
Hurdles to Progress in Long-form Question Answering	Mar 10, 2021	FormLong Form Question Answering	CodeCode Available	1
RL-CSDia: Representation Learning of Computer Science Diagrams	Mar 10, 2021	Question AnsweringRepresentation Learning	—Unverified	0
Select, Substitute, Search: A New Benchmark for Knowledge-Augmented Visual Question Answering	Mar 9, 2021	Optical Character Recognition (OCR)Question Answering	CodeCode Available	0
MCR-Net: A Multi-Step Co-Interactive Relation Network for Unanswerable Questions on Machine Reading Comprehension	Mar 8, 2021	Machine Reading ComprehensionQuestion Answering	—Unverified	0
A Survey of Embodied AI: From Simulators to Research Tasks	Mar 8, 2021	Embodied Question AnsweringQuestion Answering	—Unverified	0

Show:10 25 50

← PrevPage 138 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified