Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1401–1450 of 10817 papers

Title	Date	Tasks	Status	Hype
DisentQA: Disentangling Parametric and Contextual Knowledge with Counterfactual Question Answering	Nov 10, 2022	counterfactualData Augmentation	CodeCode Available	1
Visual Named Entity Linking: A New Dataset and A Baseline	Nov 9, 2022	Entity LinkingImage Retrieval	CodeCode Available	1
KGLM: Integrating Knowledge Graph Structure in Language Models for Link Prediction	Nov 4, 2022	Fraud DetectionKnowledge Graph Completion	CodeCode Available	1
RQUGE: Reference-Free Metric for Evaluating Question Generation by Answering the Question	Nov 2, 2022	Question AnsweringQuestion Generation	CodeCode Available	1
T5lephone: Bridging Speech and Text Self-supervised Models for Spoken Language Understanding via Phoneme level T5	Nov 1, 2022	Language ModelingLanguage Modelling	CodeCode Available	1
Lila: A Unified Benchmark for Mathematical Reasoning	Oct 31, 2022	DiversityMathematical Reasoning	CodeCode Available	1
An Efficient Memory-Augmented Transformer for Knowledge-Intensive NLP Tasks	Oct 30, 2022	Computational EfficiencyQuestion Answering	CodeCode Available	1
Two is Better than Many? Binary Classification as an Effective Approach to Multi-Choice Question Answering	Oct 29, 2022	Binary ClassificationQuestion Answering	CodeCode Available	1
MorphTE: Injecting Morphology in Tensorized Embeddings	Oct 27, 2022	Learning Word EmbeddingsMachine Translation	CodeCode Available	1
CS1QA: A Dataset for Assisting Code-based Question Answering in an Introductory Programming Course	Oct 26, 2022	Question Answering	CodeCode Available	1
RoMQA: A Benchmark for Robust, Multi-evidence, Multi-answer Question Answering	Oct 25, 2022	Question AnsweringRetrieval	CodeCode Available	1
VLC-BERT: Visual Question Answering with Contextualized Commonsense Knowledge	Oct 24, 2022	Question AnsweringVisual Question Answering	CodeCode Available	1
ReaRev: Adaptive Reasoning for Question Answering over Knowledge Graphs	Oct 24, 2022	Graph Question AnsweringKnowledge Graphs	CodeCode Available	1
Cross-document Event Coreference Search: Task, Dataset and Modeling	Oct 23, 2022	Coreference ResolutionCross Document Coreference Resolution	CodeCode Available	1
Open-domain Question Answering via Chain of Reasoning over Heterogeneous Knowledge	Oct 22, 2022	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	1
Prompt-Tuning Can Be Much Better Than Fine-Tuning on Cross-lingual Understanding With Multilingual Language Models	Oct 22, 2022	Cross-Lingual TransferNatural Language Understanding	CodeCode Available	1
ReasTAP: Injecting Table Reasoning Skills During Pre-training via Synthetic Reasoning Examples	Oct 22, 2022	Fact VerificationQuestion Answering	CodeCode Available	1
Leveraging Large Language Models for Multiple Choice Question Answering	Oct 22, 2022	Answer SelectionMultiple-choice	CodeCode Available	1
Efficiently Tuned Parameters are Task Embeddings	Oct 21, 2022	Question AnsweringText Classification	CodeCode Available	1
GraphNeT: Graph neural networks for neutrino telescope event reconstruction	Oct 21, 2022	Question Answering	CodeCode Available	1
InforMask: Unsupervised Informative Masking for Language Model Pretraining	Oct 21, 2022	Language ModelingLanguage Modelling	CodeCode Available	1
Incorporating Relevance Feedback for Information-Seeking Retrieval using Few-Shot Document Re-Ranking	Oct 19, 2022	Argument RetrievalInformation Retrieval	CodeCode Available	1
ELASTIC: Numerical Reasoning with Adaptive Symbolic Compiler	Oct 18, 2022	Math Word Problem SolvingQuestion Answering	CodeCode Available	1
PACIFIC: Towards Proactive Conversational Question Answering over Tabular and Textual Data in Finance	Oct 17, 2022	Code GenerationConversational Question Answering	CodeCode Available	1
RARR: Researching and Revising What Language Models Say, Using Language Models	Oct 17, 2022	Few-Shot LearningLanguage Modeling	CodeCode Available	1
UniRPG: Unified Discrete Reasoning over Table and Text as Program Generation	Oct 15, 2022	Question AnsweringSemantic Parsing	CodeCode Available	1
SQA3D: Situated Question Answering in 3D Scenes	Oct 14, 2022	Question AnsweringReferring Expression	CodeCode Available	1
MICO: A Multi-alternative Contrastive Learning Framework for Commonsense Knowledge Representation	Oct 14, 2022	Contrastive LearningKnowledge Graph Completion	CodeCode Available	1
MAPL: Parameter-Efficient Adaptation of Unimodal Pre-Trained Models for Vision-Language Few-Shot Prompting	Oct 13, 2022	Image CaptioningQuestion Answering	CodeCode Available	1
SlotFormer: Unsupervised Visual Dynamics Simulation with Object-Centric Models	Oct 12, 2022	ObjectQuestion Answering	CodeCode Available	1
Task Compass: Scaling Multi-task Pre-training with Task Prefix	Oct 12, 2022	Common Sense ReasoningData Augmentation	CodeCode Available	1
OpenCQA: Open-ended Question Answering with Charts	Oct 12, 2022	Arithmetic ReasoningDescriptive	CodeCode Available	1
ERNIE-Layout: Layout Knowledge Enhanced Pre-training for Visually-rich Document Understanding	Oct 12, 2022	document-image-classificationDocument Image Classification	CodeCode Available	1
Discourse Analysis via Questions and Answers: Parsing Dependency Structures of Questions Under Discussion	Oct 12, 2022	Dependency ParsingQuestion Answering	CodeCode Available	1
Task-Aware Specialization for Efficient and Robust Dense Retrieval for Open-Domain Question Answering	Oct 11, 2022	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	1
Mixed-modality Representation Learning and Pre-training for Joint Table-and-Text Retrieval in OpenQA	Oct 11, 2022	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	1
MAP: Multimodal Uncertainty-Aware Vision-Language Pre-training Model	Oct 11, 2022	Contrastive LearningImage-text matching	CodeCode Available	1
Towards Robust Visual Question Answering: Making the Most of Biased Samples via Contrastive Learning	Oct 10, 2022	Contrastive LearningQuestion Answering	CodeCode Available	1
Language Prior Is Not the Only Shortcut: A Benchmark for Shortcut Learning in VQA	Oct 10, 2022	Question AnsweringVisual Question Answering	CodeCode Available	1
Learning Fine-Grained Visual Understanding for Video Question Answering via Decoupling Spatial-Temporal Modeling	Oct 8, 2022	Language ModelingLanguage Modelling	CodeCode Available	1
EgoTaskQA: Understanding Human Tasks in Egocentric Videos	Oct 8, 2022	Action Localizationcounterfactual	CodeCode Available	1
Calibrating Factual Knowledge in Pretrained Language Models	Oct 7, 2022	Knowledge ProbingQuestion Answering	CodeCode Available	1
ConvFinQA: Exploring the Chain of Numerical Reasoning in Conversational Finance Question Answering	Oct 7, 2022	Conversational Question AnsweringQuestion Answering	CodeCode Available	1
A Unified Encoder-Decoder Framework with Entity Memory	Oct 7, 2022	DecoderQuestion Answering	CodeCode Available	1
Rainier: Reinforced Knowledge Introspector for Commonsense Question Answering	Oct 6, 2022	Question AnsweringReinforcement Learning (RL)	CodeCode Available	1
Guess the Instruction! Flipped Learning Makes Language Models Stronger Zero-Shot Learners	Oct 6, 2022	Common Sense ReasoningCoreference Resolution	CodeCode Available	1
Grape: Knowledge Graph Enhanced Passage Reader for Open-domain Question Answering	Oct 6, 2022	Entity EmbeddingsGraph Neural Network	CodeCode Available	1
Large Language Models are Pretty Good Zero-Shot Video Game Bug Detectors	Oct 5, 2022	Common Sense ReasoningLanguage Modelling	CodeCode Available	1
Mintaka: A Complex, Natural, and Multilingual Dataset for End-to-End Question Answering	Oct 4, 2022	Question Answering	CodeCode Available	1
Towards Improving Faithfulness in Abstractive Summarization	Oct 4, 2022	Abstractive Text SummarizationDecoder	CodeCode Available	1

Show:10 25 50

← PrevPage 29 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified