Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5951–6000 of 10817 papers

Title	Date	Tasks	Status
Uni-Parser: Unified Semantic Parser for Question Answering on Knowledge Base and Database	Nov 9, 2022	Question AnsweringSemantic Parsing	—Unverified
Toward a Neural Semantic Parsing System for EHR Question Answering	Nov 8, 2022	Question AnsweringSemantic Parsing	—Unverified
COV19IR : COVID-19 Domain Literature Information Retrieval	Nov 8, 2022	Information RetrievalQuestion Answering	CodeCode Available
NAPG: Non-Autoregressive Program Generation for Hybrid Tabular-Textual Question Answering	Nov 7, 2022	Question Answering	—Unverified
CRIPP-VQA: Counterfactual Reasoning about Implicit Physical Properties via Video Question Answering	Nov 7, 2022	Add - POAdd - PQ	CodeCode Available
Bridging Speech and Textual Pre-trained Models with Unsupervised ASR	Nov 6, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Measuring Progress on Scalable Oversight for Large Language Models	Nov 4, 2022	Experimental DesignLanguage Modelling	—Unverified
Miko Team: Deep Learning Approach for Legal Question Answering in ALQAC 2022	Nov 4, 2022	Information RetrievalQuestion Answering	—Unverified
Passage-Mask: A Learnable Regularization Strategy for Retriever-Reader Models	Nov 2, 2022	Answer GenerationFact Verification	—Unverified
How Stable is Knowledge Base Knowledge?	Nov 2, 2022	Question Answering	—Unverified
Chinese Movie Dialogue Question Answering Dataset	Nov 1, 2022	Information RetrievalQuestion Answering	—Unverified
Towards Zero-Shot and Few-Shot Table Question Answering using GPT-3	Oct 31, 2022	Prompt EngineeringQuestion Answering	—Unverified
Query Refinement Prompts for Closed-Book Long-Form Question Answering	Oct 31, 2022	FormLong Form Question Answering	—Unverified
QuaLA-MiniLM: a Quantized Length Adaptive MiniLM	Oct 31, 2022	Computational EfficiencyKnowledge Distillation	—Unverified
Leveraging Pre-trained Models for Failure Analysis Triplets Generation	Oct 31, 2022	Question AnsweringText Summarization	—Unverified
Learning to Navigate Wikipedia by Taking Random Walks	Oct 31, 2022	Fact VerificationNavigate	—Unverified
Transfer Learning with Synthetic Corpora for Spatial Role Labeling and Reasoning	Oct 30, 2022	Question AnsweringTransfer Learning	CodeCode Available
Zero-Shot Text Matching for Automated Auditing using Sentence Transformers	Oct 28, 2022	Information RetrievalQuestion Answering	—Unverified
Knowledge-in-Context: Towards Knowledgeable Semi-Parametric Language Models	Oct 28, 2022	Common Sense ReasoningCoreference Resolution	—Unverified
Fast DistilBERT on CPUs	Oct 27, 2022	Knowledge DistillationModel Compression	—Unverified
Reinforced Question Rewriting for Conversational Question Answering	Oct 27, 2022	Conversational Question AnsweringQuestion Answering	—Unverified
TASA: Deceiving Question Answering Models by Twin Answer Sentences Attack	Oct 27, 2022	Adversarial AttackQuestion Answering	CodeCode Available
What's Different between Visual Question Answering for Machine "Understanding" Versus for Accessibility?	Oct 26, 2022	BenchmarkingQuestion Answering	CodeCode Available
DyREx: Dynamic Query Representation for Extractive Question Answering	Oct 26, 2022	Extractive Question-AnsweringQuestion Answering	CodeCode Available
Look to the Right: Mitigating Relative Position Bias in Extractive Question Answering	Oct 26, 2022	Extractive Question-AnsweringPosition	—Unverified
Compressing And Debiasing Vision-Language Pre-Trained Models for Visual Question Answering	Oct 26, 2022	Question AnsweringVisual Question Answering	CodeCode Available
Generalization Differences between End-to-End and Neuro-Symbolic Vision-Language Reasoning Systems	Oct 26, 2022	Question AnsweringVisual Question Answering	—Unverified
Rich Knowledge Sources Bring Complex Knowledge Conflicts: Recalibrating Models to Reflect Conflicting Evidence	Oct 25, 2022	Language ModelingLanguage Modelling	—Unverified
Bridging the Training-Inference Gap for Dense Phrase Retrieval	Oct 25, 2022	Open-Domain Question AnsweringPassage Retrieval	—Unverified
Event-Centric Question Answering via Contrastive Learning and Invertible Event Transformation	Oct 24, 2022	Contrastive LearningQuestion Answering	CodeCode Available
TIARA: Multi-grained Retrieval for Robust Question Answering over Large Knowledge Bases	Oct 24, 2022	Question AnsweringRetrieval	CodeCode Available
Learning by Hallucinating: Vision-Language Pre-training with Weak Supervision	Oct 24, 2022	cross-modal alignmentCross-Modal Retrieval	—Unverified
Multi-Type Conversational Question-Answer Generation with Closed-ended and Unanswerable Questions	Oct 24, 2022	Answer GenerationConversational Question Answering	—Unverified
Speeding Up Question Answering Task of Language Models via Inverted Index	Oct 24, 2022	Question Answering	—Unverified
TAPE: Assessing Few-shot Russian Language Understanding	Oct 23, 2022	Adversarial AttackAdversarial Text	CodeCode Available
RSVG: Exploring Data and Models for Visual Grounding on Remote Sensing Data	Oct 23, 2022	Image CaptioningImage-text Retrieval	—Unverified
Knowledge Transfer from Answer Ranking to Answer Generation	Oct 23, 2022	Answer GenerationQuestion Answering	—Unverified
Varifocal Question Generation for Fact-checking	Oct 22, 2022	Fact CheckingQuestion Answering	CodeCode Available
Exploring The Landscape of Distributional Robustness for Question Answering Models	Oct 22, 2022	In-Context LearningQuestion Answering	—Unverified
P^3LM: Probabilistically Permuted Prophet Language Modeling for Generative Pre-Training	Oct 22, 2022	Conversational Question AnsweringDecoder	—Unverified
Multi-view Semantic Matching of Question retrieval using Fine-grained Semantic Representations	Oct 21, 2022	Keyword ExtractionQuestion Answering	—Unverified
Entailer: Answering Questions with Faithful and Truthful Chains of Reasoning	Oct 21, 2022	Question Answering	—Unverified
LittleBird: Efficient Faster & Longer Transformer for Question Answering	Oct 21, 2022	Language ModellingQuestion Answering	—Unverified
LiteVL: Efficient Video-Language Learning with Enhanced Spatial-Temporal Modeling	Oct 21, 2022	Language ModelingLanguage Modelling	—Unverified
WikiWhy: Answering and Explaining Cause-and-Effect Questions	Oct 21, 2022	Question Answering	—Unverified
Pre-training Language Models with Deterministic Factual Knowledge	Oct 20, 2022	Knowledge ProbingQuestion Answering	—Unverified
Large Language Models Can Self-Improve	Oct 20, 2022	Arithmetic ReasoningCommon Sense Reasoning	—Unverified
Transcending Scaling Laws with 0.1% Extra Compute	Oct 20, 2022	Arithmetic ReasoningCross-Lingual Question Answering	—Unverified
Composing Ensembles of Pre-trained Models via Iterative Consensus	Oct 20, 2022	Arithmetic ReasoningImage Generation	—Unverified
Two-Turn Debate Doesn't Help Humans Answer Hard Reading Comprehension Questions	Oct 19, 2022	Language ModelingLanguage Modelling	—Unverified

Show:10 25 50

← PrevPage 120 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified