Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2001–2025 of 10817 papers

Title	Date	Tasks	Status	Hype	Score
Lawformer: A Pre-trained Language Model for Chinese Legal Long Documents	May 9, 2021	Language ModelingLanguage Modelling	CodeCode Available	1	5
Layout and Task Aware Instruction Prompt for Zero-shot Document Image Question Answering	Jun 1, 2023	Optical Character Recognition (OCR)Question Answering	CodeCode Available	1	5
Clover: Towards A Unified Video-Language Alignment and Fusion Model	Jul 16, 2022	Language ModelingLanguage Modelling	CodeCode Available	1	5
ConceptBert: Concept-Aware Representation for Visual Question Answering	Nov 1, 2020	Common Sense ReasoningQuestion Answering	CodeCode Available	1	5
CL-ReLKT: Cross-lingual Language Knowledge Transfer for Multilingual Retrieval Question Answering	Jul 1, 2022	Language ModelingLanguage Modelling	CodeCode Available	1	5
CLTR: An End-to-End, Transformer-Based System for Cell Level Table Retrieval and Table Question Answering	Jun 8, 2021	Question AnsweringRetrieval	CodeCode Available	1	5
LIME: Less Is More for MLLM Evaluation	Sep 10, 2024	Image CaptioningQuestion Answering	CodeCode Available	1	5
Towards General Purpose Vision Systems	Apr 1, 2021	Question AnsweringVisual Question Answering	CodeCode Available	1	5
Lila: A Unified Benchmark for Mathematical Reasoning	Oct 31, 2022	DiversityMathematical Reasoning	CodeCode Available	1	5
Towards Improving Faithfulness in Abstractive Summarization	Oct 4, 2022	Abstractive Text SummarizationDecoder	CodeCode Available	1	5
A Simple LLM Framework for Long-Range Video Question-Answering	Dec 28, 2023	EgoSchemaLanguage Modelling	CodeCode Available	1	5
Learning Associative Inference Using Fast Weight Memory	Nov 16, 2020	Language ModellingMeta Reinforcement Learning	CodeCode Available	1	5
MaXM: Towards Multilingual Visual Question Answering	Sep 12, 2022	Question AnsweringTranslation	CodeCode Available	1	5
Towards Question-Answering as an Automatic Metric for Evaluating the Content Quality of a Summary	Oct 1, 2020	Question Answering	CodeCode Available	1	5
Linearly Mapping from Image to Text Space	Sep 30, 2022	Image CaptioningImage to text	CodeCode Available	1	5
LibriSQA: A Novel Dataset and Framework for Spoken Question Answering with Large Language Models	Aug 20, 2023	Multiple-choiceQuestion Answering	CodeCode Available	1	5
LifelongMemory: Leveraging LLMs for Answering Queries in Long-form Egocentric Videos	Dec 7, 2023	EgoSchemaForm	CodeCode Available	1	5
Towards Vision-Language Mechanistic Interpretability: A Causal Tracing Tool for BLIP	Aug 27, 2023	Question AnsweringText Generation	CodeCode Available	1	5
Learning Fine-Grained Visual Understanding for Video Question Answering via Decoupling Spatial-Temporal Modeling	Oct 8, 2022	Language ModelingLanguage Modelling	CodeCode Available	1	5
Compositional Semantic Parsing on Semi-Structured Tables	Aug 3, 2015	Question AnsweringSemantic Parsing	CodeCode Available	1	5
A Dataset and Baselines for Visual Question Answering on Art	Aug 28, 2020	Question AnsweringQuestion Generation	CodeCode Available	1	5
Learning From Failure: Integrating Negative Examples when Fine-tuning Large Language Models as Agents	Feb 18, 2024	Mathematical ReasoningMulti-hop Question Answering	CodeCode Available	1	5
Conceptual 12M: Pushing Web-Scale Image-Text Pre-Training To Recognize Long-Tail Visual Concepts	Feb 17, 2021	Caption GenerationDiversity	CodeCode Available	1	5
LifeQA: A Real-life Dataset for Video Question Answering	May 1, 2020	Multiple-choiceQuestion Answering	CodeCode Available	1	5
Lite Transformer with Long-Short Range Attention	Apr 24, 2020	Abstractive Text SummarizationAutoML	CodeCode Available	1	5

Show:10 25 50

← PrevPage 81 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified