Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5001–5050 of 10817 papers

Title	Date	Tasks	Status	Hype
Introducing Semantics into Speech Encoders	Nov 15, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
QAmeleon: Multilingual QA with Only 5 Examples	Nov 15, 2022	Few-Shot LearningQuestion Answering	CodeCode Available	1
Generative Long-form Question Answering: Relevance, Faithfulness and Succinctness	Nov 15, 2022	FormLong Form Question Answering	—Unverified	0
Large Language Models Struggle to Learn Long-Tail Knowledge	Nov 15, 2022	Entity LinkingQuestion Answering	CodeCode Available	1
Retrieval-Augmented Generative Question Answering for Event Argument Extraction	Nov 14, 2022	Event Argument ExtractionFew-Shot Learning	CodeCode Available	1
Towards Robust Numerical Question Answering: Diagnosing Numerical Capabilities of NLP Systems	Nov 14, 2022	Data AugmentationOpen-Ended Question Answering	—Unverified	0
Learning to Answer Multilingual and Code-Mixed Questions	Nov 14, 2022	AI AgentQuestion Answering	—Unverified	0
ALBERT with Knowledge Graph Encoder Utilizing Semantic Similarity for Commonsense Question Answering	Nov 14, 2022	Language ModelingLanguage Modelling	—Unverified	0
Multi-VQG: Generating Engaging Questions for Multiple Images	Nov 14, 2022	Question AnsweringQuestion Generation	CodeCode Available	0
Knowledge Base Completion using Web-Based Question Answering and Multimodal Fusion	Nov 14, 2022	Knowledge Base CompletionQuestion Answering	—Unverified	0
Mining Mathematical Documents for Question Answering via Unsupervised Formula Labeling	Nov 12, 2022	Entity LinkingKnowledge Graphs	CodeCode Available	1
MF2-MVQA: A Multi-stage Feature Fusion method for Medical Visual Question Answering	Nov 11, 2022	Medical Visual Question AnsweringQuestion Answering	—Unverified	0
Biomedical Multi-hop Question Answering Using Knowledge Graph Embeddings and Language Models	Nov 10, 2022	Knowledge Graph EmbeddingsKnowledge Graphs	—Unverified	0
DisentQA: Disentangling Parametric and Contextual Knowledge with Counterfactual Question Answering	Nov 10, 2022	counterfactualData Augmentation	CodeCode Available	1
Watching the News: Towards VideoQA Models that can Read	Nov 10, 2022	Question AnsweringVideo Question Answering	—Unverified	0
Towards Reasoning-Aware Explainable VQA	Nov 9, 2022	DecoderExplanation Generation	—Unverified	0
ERNIE-UniX2: A Unified Cross-lingual Cross-modal Framework for Understanding and Generation	Nov 9, 2022	Contrastive LearningDecoder	—Unverified	0
Uni-Parser: Unified Semantic Parser for Question Answering on Knowledge Base and Database	Nov 9, 2022	Question AnsweringSemantic Parsing	—Unverified	0
Visual Named Entity Linking: A New Dataset and A Baseline	Nov 9, 2022	Entity LinkingImage Retrieval	CodeCode Available	1
Toward a Neural Semantic Parsing System for EHR Question Answering	Nov 8, 2022	Question AnsweringSemantic Parsing	—Unverified	0
COV19IR : COVID-19 Domain Literature Information Retrieval	Nov 8, 2022	Information RetrievalQuestion Answering	CodeCode Available	0
NAPG: Non-Autoregressive Program Generation for Hybrid Tabular-Textual Question Answering	Nov 7, 2022	Question Answering	—Unverified	0
CRIPP-VQA: Counterfactual Reasoning about Implicit Physical Properties via Video Question Answering	Nov 7, 2022	Add - POAdd - PQ	CodeCode Available	0
Bridging Speech and Textual Pre-trained Models with Unsupervised ASR	Nov 6, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
KGLM: Integrating Knowledge Graph Structure in Language Models for Link Prediction	Nov 4, 2022	Fraud DetectionKnowledge Graph Completion	CodeCode Available	1
Measuring Progress on Scalable Oversight for Large Language Models	Nov 4, 2022	Experimental DesignLanguage Modelling	—Unverified	0
Miko Team: Deep Learning Approach for Legal Question Answering in ALQAC 2022	Nov 4, 2022	Information RetrievalQuestion Answering	—Unverified	0
Crosslingual Generalization through Multitask Finetuning	Nov 3, 2022	Coreference ResolutionCross-Lingual Transfer	CodeCode Available	2
RQUGE: Reference-Free Metric for Evaluating Question Generation by Answering the Question	Nov 2, 2022	Question AnsweringQuestion Generation	CodeCode Available	1
Passage-Mask: A Learnable Regularization Strategy for Retriever-Reader Models	Nov 2, 2022	Answer GenerationFact Verification	—Unverified	0
How Stable is Knowledge Base Knowledge?	Nov 2, 2022	Question Answering	—Unverified	0
Chinese Movie Dialogue Question Answering Dataset	Nov 1, 2022	Information RetrievalQuestion Answering	—Unverified	0
T5lephone: Bridging Speech and Text Self-supervised Models for Spoken Language Understanding via Phoneme level T5	Nov 1, 2022	Language ModelingLanguage Modelling	CodeCode Available	1
Query Refinement Prompts for Closed-Book Long-Form Question Answering	Oct 31, 2022	FormLong Form Question Answering	—Unverified	0
QuaLA-MiniLM: a Quantized Length Adaptive MiniLM	Oct 31, 2022	Computational EfficiencyKnowledge Distillation	—Unverified	0
Learning to Navigate Wikipedia by Taking Random Walks	Oct 31, 2022	Fact VerificationNavigate	—Unverified	0
Towards Zero-Shot and Few-Shot Table Question Answering using GPT-3	Oct 31, 2022	Prompt EngineeringQuestion Answering	—Unverified	0
Leveraging Pre-trained Models for Failure Analysis Triplets Generation	Oct 31, 2022	Question AnsweringText Summarization	—Unverified	0
Lila: A Unified Benchmark for Mathematical Reasoning	Oct 31, 2022	DiversityMathematical Reasoning	CodeCode Available	1
Transfer Learning with Synthetic Corpora for Spatial Role Labeling and Reasoning	Oct 30, 2022	Question AnsweringTransfer Learning	CodeCode Available	0
An Efficient Memory-Augmented Transformer for Knowledge-Intensive NLP Tasks	Oct 30, 2022	Computational EfficiencyQuestion Answering	CodeCode Available	1
Two is Better than Many? Binary Classification as an Effective Approach to Multi-Choice Question Answering	Oct 29, 2022	Binary ClassificationQuestion Answering	CodeCode Available	1
Zero-Shot Text Matching for Automated Auditing using Sentence Transformers	Oct 28, 2022	Information RetrievalQuestion Answering	—Unverified	0
Knowledge-in-Context: Towards Knowledgeable Semi-Parametric Language Models	Oct 28, 2022	Common Sense ReasoningCoreference Resolution	—Unverified	0
Fast DistilBERT on CPUs	Oct 27, 2022	Knowledge DistillationModel Compression	—Unverified	0
Reinforced Question Rewriting for Conversational Question Answering	Oct 27, 2022	Conversational Question AnsweringQuestion Answering	—Unverified	0
MorphTE: Injecting Morphology in Tensorized Embeddings	Oct 27, 2022	Learning Word EmbeddingsMachine Translation	CodeCode Available	1
TASA: Deceiving Question Answering Models by Twin Answer Sentences Attack	Oct 27, 2022	Adversarial AttackQuestion Answering	CodeCode Available	0
Look to the Right: Mitigating Relative Position Bias in Extractive Question Answering	Oct 26, 2022	Extractive Question-AnsweringPosition	—Unverified	0
DyREx: Dynamic Query Representation for Extractive Question Answering	Oct 26, 2022	Extractive Question-AnsweringQuestion Answering	CodeCode Available	0

Show:10 25 50

← PrevPage 101 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified