Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8076–8100 of 10817 papers

Title	Date	Tasks	Status
Recurrent and Contextual Models for Visual Question Answering	Mar 23, 2017	DiversityMultiple-choice	—Unverified
From 'F' to 'A' on the N.Y. Regents Science Exams: An Overview of the Aristo Project	Sep 4, 2019	Multiple-choiceQuestion Answering	—Unverified
A Case Study Towards Turkish Paraphrase Alignment	Aug 1, 2013	Machine TranslationNatural Language Inference	—Unverified
Recurrent Neural Network Encoder with Attention for Community Question Answering	Mar 23, 2016	Community Question AnsweringInformation Retrieval	—Unverified
Recurrent One-Hop Predictions for Reasoning over Knowledge Graphs	Jun 12, 2018	Knowledge Base CompletionKnowledge Graphs	—Unverified
From Images to Textual Prompts: Zero-Shot Visual Question Answering With Frozen Large Language Models	Jan 1, 2023	Question AnsweringVisual Question Answering	—Unverified
Recursively Summarizing Books with Human Feedback	Sep 22, 2021	Abstractive Text SummarizationQuestion Answering	—Unverified
Assessing the Robustness of Retrieval-Augmented Generation Systems in K-12 Educational Question Answering with Knowledge Discrepancies	Dec 12, 2024	Question AnsweringRAG	—Unverified
Recursive Tree-Structured Self-Attention for Answer Sentence Selection	Aug 1, 2021	Community Question AnsweringQuestion Answering	—Unverified
From Image to Language: A Critical Analysis of Visual Question Answering (VQA) Approaches, Challenges, and Opportunities	Nov 1, 2023	NavigateQuestion Answering	—Unverified
Global Inference to Chinese Temporal Relation Extraction	Dec 1, 2016	Question AnsweringRelation	—Unverified
Red Dragon AI at TextGraphs 2020 Shared Task: LIT : LSTM-Interleaved Transformer for Multi-Hop Explanation Ranking	Dec 28, 2020	Question AnsweringRe-Ranking	—Unverified
Red Dragon AI at TextGraphs 2020 Shared Task : LIT : LSTM-Interleaved Transformer for Multi-Hop Explanation Ranking	Dec 1, 2020	Question AnsweringRe-Ranking	—Unverified
ReDecode Framework for Iterative Improvement in Paraphrase Generation	Nov 11, 2018	DecoderInformation Retrieval	—Unverified
Redefining Information Retrieval of Structured Database via Large Language Models	May 9, 2024	Information RetrievalQuestion Answering	—Unverified
From Known to the Unknown: Transferring Knowledge to Answer Questions about Novel Visual and Semantic Concepts	Nov 30, 2018	Novel ConceptsQuestion Answering	—Unverified
RedStone: Curating General, Code, Math, and QA Data for Large Language Models	Dec 4, 2024	Domain AdaptationMath	—Unverified
Reliable, Adaptable, and Attributable Language Models with Retrieval	Mar 5, 2024	Question AnsweringRetrieval	—Unverified
Reducing Hallucinations: Enhancing VQA for Flood Disaster Damage Assessment with Visual Contexts	Dec 21, 2023	HallucinationQuestion Answering	—Unverified
Assessing The Potential Of Mid-Sized Language Models For Clinical QA	Apr 24, 2024	MedQAQuestion Answering	—Unverified
GLiNER multi-task: Generalist Lightweight Model for Various Information Extraction Tasks	Jun 14, 2024	named-entity-recognitionNamed Entity Recognition	—Unverified
Comparative Analysis of Retrieval Systems in the Real World	May 3, 2024	Information RetrievalQuestion Answering	—Unverified
Generating Question Relevant Captions to Aid Visual Question Answering	Jun 3, 2019	General KnowledgeImage Captioning	—Unverified
Redundancy Localization for the Conversationalization of Unstructured Responses	Aug 1, 2017	Passage RetrievalQuestion Answering	—Unverified
GLaM: Efficient Scaling of Language Models with Mixture-of-Experts	Dec 13, 2021	Common Sense ReasoningIn-Context Learning	—Unverified

Show:10 25 50

← PrevPage 324 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified