Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10351–10375 of 10817 papers

Title	Date	Tasks	Status
Routing Networks and the Challenges of Modular and Compositional Computation	Apr 29, 2019	Language ModelingLanguage Modelling	CodeCode Available
DLaVA: Document Language and Vision Assistant for Answer Localization with Enhanced Interpretability and Trustworthiness	Nov 29, 2024	Optical Character Recognition (OCR)Question Answering	CodeCode Available
Capturing Humans' Mental Models of AI: An Item Response Theory Approach	May 15, 2023	AI AgentQuestion Answering	CodeCode Available
MELO: Enhancing Model Editing with Neuron-Indexed Dynamic LoRA	Dec 19, 2023	Document ClassificationHallucination	CodeCode Available
DCR: Divide-and-Conquer Reasoning for Multi-choice Question Answering with LLMs	Jan 10, 2024	Question Answering	CodeCode Available
Diversity Enhanced Narrative Question Generation for Storybooks	Oct 25, 2023	DiversityQuestion Answering	CodeCode Available
Answering Complex Questions Using Open Information Extraction	Apr 19, 2017	Open Information ExtractionQuestion Answering	CodeCode Available
PT-MoE: An Efficient Finetuning Framework for Integrating Mixture-of-Experts into Prompt Tuning	May 14, 2025	MathMathematical Problem-Solving	CodeCode Available
OpenAi's GPT4 as coding assistant	Sep 22, 2023	Code GenerationLanguage Modeling	CodeCode Available
Capturing Greater Context for Question Generation	Oct 22, 2019	Question AnsweringQuestion Generation	CodeCode Available
MemexQA: Visual Memex Question Answering	Aug 4, 2017	Memex Question AnsweringQuestion Answering	CodeCode Available
Capturing Global Structural Information in Long Document Question Answering with Compressive Graph Selector Network	Oct 11, 2022	Evidence SelectionGraph Attention	CodeCode Available
Open-Domain Conversational Question Answering with Historical Answers	Nov 17, 2022	Conversational Question AnsweringPassage Retrieval	CodeCode Available
Visuo-Linguistic Question Answering (VLQA) Challenge	May 1, 2020	Question AnsweringReading Comprehension	CodeCode Available
Open-Domain Event Detection using Distant Supervision	Aug 1, 2018	Event DetectionOpen-Domain Question Answering	CodeCode Available
A Study on Large Language Models' Limitations in Multiple-Choice Question Answering	Jan 15, 2024	Multiple-choiceQuestion Answering	CodeCode Available
ACQUIRED: A Dataset for Answering Counterfactual Questions In Real-Life Videos	Nov 2, 2023	counterfactualCounterfactual Reasoning	CodeCode Available
Rescue: Ranking LLM Responses with Partial Ordering to Improve Response Generation	Nov 15, 2023	Natural Language InferenceQuestion Answering	CodeCode Available
RSAdapter: Adapting Multimodal Models for Remote Sensing Visual Question Answering	Oct 19, 2023	Image CaptioningQuestion Answering	CodeCode Available
Open-Domain Question-Answering for COVID-19 and Other Emergent Domains	Oct 13, 2021	DiversityMisinformation	CodeCode Available
Distributed Representations of Sentences and Documents	May 16, 2014	Question AnsweringSentiment Analysis	CodeCode Available
Capturing Conversational Interaction for Question Answering via Global History Reasoning	Jul 1, 2022	Conversational Question AnsweringQuestion Answering	CodeCode Available
Memory-Efficient Fine-Tuning of Transformers via Token Selection	Jan 31, 2025	Few-Shot LearningQuestion Answering	CodeCode Available
Memory-enriched computation and learning in spiking neural networks through Hebbian plasticity	May 23, 2022	One-Shot LearningOut-of-Distribution Generalization	CodeCode Available
ReQA: An Evaluation for End-to-End Answer Retrieval Models	Jul 10, 2019	Information RetrievalQuestion Answering	CodeCode Available

Show:10 25 50

← PrevPage 415 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified