Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7726–7750 of 10817 papers

Title	Date	Tasks	Status
CHOPT : Automated Hyperparameter Optimization Framework for Cloud-Based Machine Learning Platforms	Oct 8, 2018	BIG-bench Machine LearningHyperparameter Optimization	—Unverified
Graph-augmented Learning to Rank for Querying Large-scale Knowledge Graph	Nov 20, 2021	Answer SelectionGraph Question Answering	—Unverified
Graph Attention with Hierarchies for Multi-hop Question Answering	Jan 27, 2023	Graph AttentionGraph Neural Network	—Unverified
QA-TOOLBOX: Conversational Question-Answering for process task guidance in manufacturing	Dec 3, 2024	Conversational Question AnsweringData Augmentation	—Unverified
Filling a Knowledge Graph with a Crowd	Dec 1, 2016	Knowledge GraphsQuestion Answering	—Unverified
QBERT: Generalist Model for Processing Questions	Dec 5, 2022	modelQuestion Answering	—Unverified
QCRI: Answer Selection for Community Question Answering - Experiments for Arabic and English	Jun 1, 2015	Answer SelectionCommunity Question Answering	—Unverified
Fill-in-the-Blank: A Challenging Video Understanding Evaluation Framework	Nov 16, 2021	Multiple-choiceQuestion Answering	—Unverified
Compositional De-Attention Networks	Dec 1, 2019	Machine TranslationNatural Language Inference	—Unverified
GrapeQA: GRaph Augmentation and Pruning to Enhance Question-Answering	Mar 22, 2023	Common Sense ReasoningKnowledge Graphs	—Unverified
Compositional Attention Networks for Interpretability in Natural Language Question Answering	Oct 30, 2018	Logical ReasoningQuestion Answering	—Unverified
AstBERT: Enabling Language Model for Financial Code Understanding with Abstract Syntax Trees	Jan 20, 2022	Clone DetectionCode Search	—Unverified
Grammatical structures for word-level sentiment detection	Jun 1, 2012	Opinion MiningQuestion Answering	—Unverified
QirK: Question Answering via Intermediate Representation on Knowledge Graphs	Aug 14, 2024	Knowledge GraphsQuestion Answering	—Unverified
QIRL: Boosting Visual Question Answering via Optimized Question-Image Relation Learning	Apr 4, 2025	Data AugmentationImage Generation	—Unverified
Grammarless Parsing for Joint Inference	Dec 1, 2012	Coreference ResolutionNamed Entity Recognition (NER)	—Unverified
Grammar Detection for Sentiment Analysis through Improved Viterbi Algorithm	May 26, 2022	named-entity-recognitionNamed Entity Recognition	—Unverified
Compositional and Lexical Semantics in RoBERTa, BERT and DistilBERT: A Case Study on CoQA	Sep 17, 2020	Conversational Question AnsweringNegation	—Unverified
QnAMaker: Data to Bot in 2 Minutes	Mar 19, 2020	Question Answering	—Unverified
A Statistical Framework for Data-dependent Retrieval-Augmented Models	Aug 27, 2024	Open-Domain Question AnsweringQuestion Answering	—Unverified
Q-Pain: A Question Answering Dataset to Measure Social Bias in Pain Management	Aug 3, 2021	Decision MakingExperimental Design	—Unverified
QQATeam at Qur’an QA 2022: Fine-Tunning Arabic QA Models for Qur’an QA Task	Jun 1, 2022	DeblurringQuestion Answering	—Unverified
QRMeM: Unleash the Length Limitation through Question then Reflection Memory Mechanism	Jun 19, 2024	Multiple-choiceQuestion Answering	—Unverified
Q-SFT: Q-Learning for Language Models via Supervised Fine-Tuning	Nov 7, 2024	Offline RLPolicy Gradient Methods	—Unverified
Question Answering over Knowledge Base using Factual Memory Networks	Jun 1, 2016	Information RetrievalKnowledge Base Question Answering	—Unverified

Show:10 25 50

← PrevPage 310 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified