Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1476–1500 of 10817 papers

Title	Date	Tasks	Status	Hype
RealTime QA: What's the Answer Right Now?	Jul 27, 2022	Information RetrievalQuestion Answering	CodeCode Available	1
Cross-Modal Causal Relational Reasoning for Event-Level Visual Question Answering	Jul 26, 2022	Causal InferenceQuestion Answering	CodeCode Available	1
LaKo: Knowledge-driven Visual Question Answering via Late Knowledge-to-Text Injection	Jul 26, 2022	DecoderKnowledge Graphs	CodeCode Available	1
Equivariant and Invariant Grounding for Video Question Answering	Jul 26, 2022	Question AnsweringVideo Question Answering	CodeCode Available	1
μKG: A Library for Multi-source Knowledge Graph Embeddings and Applications	Jul 23, 2022	Entity AlignmentEntity Typing	CodeCode Available	1
Rethinking Data Augmentation for Robust Visual Question Answering	Jul 18, 2022	Data AugmentationKnowledge Distillation	CodeCode Available	1
Can large language models reason about medical questions?	Jul 17, 2022	MedQAMultiple-choice	CodeCode Available	1
Clover: Towards A Unified Video-Language Alignment and Fusion Model	Jul 16, 2022	Language ModelingLanguage Modelling	CodeCode Available	1
Re2G: Retrieve, Rerank, Generate	Jul 13, 2022	Fact CheckingFact Verification	CodeCode Available	1
Video Graph Transformer for Video Question Answering	Jul 12, 2022	Question AnsweringRelation	CodeCode Available	1
ViQuAE, a Dataset for Knowledge-based Visual Question Answering about Named Entities	Jul 11, 2022	ArticlesFew-Shot Learning	CodeCode Available	1
Embedding Recycling for Language Models	Jul 11, 2022	Question AnsweringText Classification	CodeCode Available	1
OmniTab: Pretraining with Natural and Synthetic Data for Few-shot Table-based Question Answering	Jul 8, 2022	Question AnsweringRetrieval	CodeCode Available	1
CoQAR: Question Rewriting on CoQA	Jul 7, 2022	Conversational Question AnsweringForm	CodeCode Available	1
Weakly Supervised Grounding for VQA in Vision-Language Transformers	Jul 5, 2022	Question AnsweringRepresentation Learning	CodeCode Available	1
INSCIT: Information-Seeking Conversations with Mixed-Initiative Interactions	Jul 2, 2022	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	1
EA^2E: Improving Consistency with Event Awareness for Document-Level Argument Extraction	Jul 1, 2022	Event Argument ExtractionKnowledge Base Population	CodeCode Available	1
MultiSpanQA: A Dataset for Multi-Span Question Answering	Jul 1, 2022	Natural QuestionsQuestion Answering	CodeCode Available	1
CL-ReLKT: Cross-lingual Language Knowledge Transfer for Multilingual Retrieval Question Answering	Jul 1, 2022	Language ModelingLanguage Modelling	CodeCode Available	1
A Unified End-to-End Retriever-Reader Framework for Knowledge-based VQA	Jun 30, 2022	Question AnsweringRetrieval	CodeCode Available	1
CC-Riddle: A Question Answering Dataset of Chinese Character Riddles	Jun 28, 2022	General KnowledgeLanguage Modelling	CodeCode Available	1
Consistency-preserving Visual Question Answering in Medical Imaging	Jun 27, 2022	Question AnsweringVisual Question Answering	CodeCode Available	1
PLATON: Pruning Large Transformer Models with Upper Confidence Bound of Weight Importance	Jun 25, 2022	image-classificationImage Classification	CodeCode Available	1
Surgical-VQA: Visual Question Answering in Surgical Scenes using Transformer	Jun 22, 2022	Question AnsweringSentence	CodeCode Available	1
EAGER: Asking and Answering Questions for Automatic Reward Shaping in Language-guided RL	Jun 20, 2022	Question AnsweringQuestion Generation	CodeCode Available	1

Show:10 25 50

← PrevPage 60 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified