Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2001–2050 of 10817 papers

Title	Date	Tasks	Status	Hype	Score
Learning Associative Inference Using Fast Weight Memory	Nov 16, 2020	Language ModellingMeta Reinforcement Learning	CodeCode Available	1	5
Towards Vision-Language Mechanistic Interpretability: A Causal Tracing Tool for BLIP	Aug 27, 2023	Question AnsweringText Generation	CodeCode Available	1	5
Consistency-preserving Visual Question Answering in Medical Imaging	Jun 27, 2022	Question AnsweringVisual Question Answering	CodeCode Available	1	5
Learning Contextualized Knowledge Structures for Commonsense Reasoning	Oct 24, 2020	Knowledge GraphsNatural Language Inference	CodeCode Available	1	5
CL-ReLKT: Cross-lingual Language Knowledge Transfer for Multilingual Retrieval Question Answering	Jul 1, 2022	Language ModelingLanguage Modelling	CodeCode Available	1	5
CLTR: An End-to-End, Transformer-Based System for Cell Level Table Retrieval and Table Question Answering	Jun 8, 2021	Question AnsweringRetrieval	CodeCode Available	1	5
Learning Dialogue Representations from Consecutive Utterances	May 26, 2022	Contrastive LearningConversational Question Answering	CodeCode Available	1	5
Learning Event Graph Knowledge for Abductive Reasoning	Aug 1, 2021	Question AnsweringReading Comprehension	CodeCode Available	1	5
AmbigQA: Answering Ambiguous Open-domain Questions	Apr 22, 2020	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	1	5
Training Data is More Valuable than You Think: A Simple and Effective Method by Retrieving from Training Data	Mar 16, 2022	Language ModelingLanguage Modelling	CodeCode Available	1	5
A Simple LLM Framework for Long-Range Video Question-Answering	Dec 28, 2023	EgoSchemaLanguage Modelling	CodeCode Available	1	5
Learning Fine-Grained Visual Understanding for Video Question Answering via Decoupling Spatial-Temporal Modeling	Oct 8, 2022	Language ModelingLanguage Modelling	CodeCode Available	1	5
Conformal Prediction with Large Language Models for Multi-Choice Question Answering	May 28, 2023	Conformal PredictionMultiple-choice	CodeCode Available	1	5
Transferability of Natural Language Inference to Biomedical Question Answering	Jul 1, 2020	Natural Language InferenceQuestion Answering	CodeCode Available	1	5
Connecting the Dots: A Knowledgeable Path Generator for Commonsense Question Answering	May 2, 2020	Knowledge GraphsLanguage Modeling	CodeCode Available	1	5
Learning to Retrieve Reasoning Paths over Wikipedia Graph for Question Answering	Nov 24, 2019	Question AnsweringRetrieval	CodeCode Available	1	5
Transforming Question Answering Datasets Into Natural Language Inference Datasets	Sep 9, 2018	Natural Language InferenceQuestion Answering	CodeCode Available	1	5
TRAR: Routing the Attention Spans in Transformer for Visual Question Answering	Jan 1, 2021	Question AnsweringReferring Expression	CodeCode Available	1	5
Connecting Vision and Language with Video Localized Narratives	Feb 22, 2023	Question AnsweringVideo Narrative Grounding	CodeCode Available	1	5
Tree of Clarifications: Answering Ambiguous Questions with Retrieval-Augmented Large Language Models	Oct 23, 2023	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	1	5
Learning Situation Hyper-Graphs for Video Question Answering	Apr 18, 2023	DecoderQuestion Answering	CodeCode Available	1	5
Tree-of-Traversals: A Zero-Shot Reasoning Algorithm for Augmenting Black-box Language Models with Knowledge Graphs	Jul 31, 2024	Knowledge GraphsQuestion Answering	CodeCode Available	1	5
Conformal Language Modeling	Jun 16, 2023	Conformal PredictionLanguage Modeling	CodeCode Available	1	5
ControlLM: Crafting Diverse Personalities for Language Models	Feb 15, 2024	Question Answering	CodeCode Available	1	5
TroVE: Inducing Verifiable and Efficient Toolboxes for Solving Programmatic Tasks	Jan 23, 2024	MathQuestion Answering	CodeCode Available	1	5
Context Awareness Gate For Retrieval Augmented Generation	Nov 25, 2024	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	1	5
AllenAct: A Framework for Embodied AI Research	Aug 28, 2020	Deep Reinforcement LearningEmbodied Question Answering	CodeCode Available	1	5
CodeQueries: A Dataset of Semantic Queries over Code	Sep 17, 2022	AttributeExtractive Question-Answering	CodeCode Available	1	5
Asking Clarification Questions to Handle Ambiguity in Open-Domain QA	May 23, 2023	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	1	5
Learning to Ask Like a Physician	Jun 6, 2022	Question AnsweringQuestion Generation	CodeCode Available	1	5
ConditionalQA: A Complex Reading Comprehension Dataset with Conditional Answers	Oct 13, 2021	Logical ReasoningQuestion Answering	CodeCode Available	1	5
A Dataset and Baselines for Visual Question Answering on Art	Aug 28, 2020	Question AnsweringQuestion Generation	CodeCode Available	1	5
Asking Effective and Diverse Questions: A Machine Reading Comprehension based Framework for Joint Entity-Relation Extraction	Jul 1, 2020	DiversityMachine Reading Comprehension	CodeCode Available	1	5
Learning to Discretely Compose Reasoning Module Networks for Video Captioning	Jul 17, 2020	DecoderQuestion Answering	CodeCode Available	1	5
Conformal Alignment: Knowing When to Trust Foundation Models with Guarantees	May 16, 2024	Decision MakingInformativeness	CodeCode Available	1	5
Coarse-to-Fine Vision-Language Pre-training with Fusion in the Backbone	Jun 15, 2022	Described Object DetectionImage Captioning	CodeCode Available	1	5
Asking Questions the Human Way: Scalable Question-Answer Generation from Text Corpus	Jan 27, 2020	Answer GenerationChatbot	CodeCode Available	1	5
TurkishMMLU: Measuring Massive Multitask Language Understanding in Turkish	Jul 17, 2024	MathMultiple-choice	CodeCode Available	1	5
CAT-ViL: Co-Attention Gated Vision-Language Embedding for Visual Question Localized-Answering in Robotic Surgery	Jul 11, 2023	Question AnsweringScene Understanding	CodeCode Available	1	5
COBRA: Contrastive Bi-Modal Representation Algorithm	May 7, 2020	Cross-Modal RetrievalImage Captioning	CodeCode Available	1	5
Learning to Perturb Word Embeddings for Out-of-distribution QA	May 6, 2021	Data AugmentationDomain Generalization	CodeCode Available	1	5
TyDi QA: A Benchmark for Information-Seeking Question Answering in Typologically Diverse Languages	Mar 10, 2020	Question AnsweringTranslation	CodeCode Available	1	5
LLaSA: A Multimodal LLM for Human Activity Analysis Through Wearable and Smartphone Sensors	Jun 20, 2024	16kInstruction Following	CodeCode Available	1	5
Learning to Poison Large Language Models for Downstream Manipulation	Feb 21, 2024	Data PoisoningIn-Context Learning	CodeCode Available	1	5
UDA: A Benchmark Suite for Retrieval Augmented Generation in Real-world Document Analysis	Jun 21, 2024	Question AnsweringRAG	CodeCode Available	1	5
CodeQA: A Question Answering Dataset for Source Code Comprehension	Sep 17, 2021	Machine Reading ComprehensionQuestion Answering	CodeCode Available	1	5
LLaVA-SpaceSGG: Visual Instruct Tuning for Open-vocabulary Scene Graph Generation with Enhanced Spatial Relations	Dec 9, 2024	Language ModelingLanguage Modelling	CodeCode Available	1	5
LogEval: A Comprehensive Benchmark Suite for Large Language Models In Log Analysis	Jul 2, 2024	Anomaly DetectionFault Diagnosis	CodeCode Available	1	5
ComQA:Compositional Question Answering via Hierarchical Graph Neural Networks	Jan 16, 2021	Answer SelectionMachine Reading Comprehension	CodeCode Available	1	5
LIQUID: A Framework for List Question Answering Dataset Generation	Feb 3, 2023	Dataset GenerationQuestion Answering	CodeCode Available	1	5

Show:10 25 50

← PrevPage 41 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified