Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3751–3775 of 10817 papers

Title	Date	Tasks	Status
DOMLIN at SemEval-2019 Task 8: Automated Fact Checking exploiting Ratings in Community Question Answering Forums	Jun 1, 2019	Community Question AnsweringFact Checking	—Unverified
FA3L at SemEval-2017 Task 3: A ThRee Embeddings Recurrent Neural Network for Question Answering	Aug 1, 2017	Community Question AnsweringDependency Parsing	—Unverified
FaBERT: Pre-training BERT on Persian Blogs	Feb 9, 2024	named-entity-recognitionNamed Entity Recognition	—Unverified
FabGPT: An Efficient Large Multimodal Model for Complex Wafer Defect Knowledge Queries	Jul 15, 2024	Defect DetectionQuestion Answering	—Unverified
FabKG: A Knowledge graph of Manufacturing Science domain utilizing structured and unconventional unstructured knowledge source	May 24, 2022	Knowledge GraphsNER	—Unverified
Beyond Human Vision: The Role of Large Vision Language Models in Microscope Image Analysis	May 1, 2024	Image CaptioningQuestion Answering	—Unverified
Domain-Transferable Method for Named Entity Recognition Task	Nov 24, 2020	Knowledge Graphsnamed-entity-recognition	—Unverified
Fabula Entropy Indexing: Objective Measures of Story Coherence	Mar 23, 2021	Question AnsweringStory Generation	—Unverified
Beyond Forecasting: Compositional Time Series Reasoning for End-to-End Task Execution	Oct 5, 2024	Anomaly DetectionDecision Making	—Unverified
A Compression-Compilation Framework for On-mobile Real-time BERT Applications	May 30, 2021	Question AnsweringText Generation	—Unverified
Generalizing Question Answering System with Pre-trained Language Model Fine-tuning	Nov 1, 2019	Language ModelingLanguage Modelling	—Unverified
General Table Question Answering via Answer-Formula Joint Generation	Mar 16, 2025	Question Answering	—Unverified
Chart Question Answering: State of the Art and Future Directions	May 8, 2022	Chart Question AnsweringQuestion Answering	—Unverified
FACTIFY3M: A Benchmark for Multimodal Fact Verification with Explainability through 5W Question-Answering	May 22, 2023	Fact VerificationQuestion Answering	—Unverified
FACTIFY-5WQA: 5W Aspect-based Fact Verification through Question Answering	May 7, 2023	Fact CheckingFact Verification	—Unverified
ChartReasoner: Code-Driven Modality Bridging for Long-Chain Reasoning in Chart Question Answering	Jun 11, 2025	Chart Question AnsweringImage to text	—Unverified
Domain-Targeted, High Precision Knowledge Extraction	Jan 1, 2017	Open Information ExtractionQuestion Answering	—Unverified
Facts as Experts: Adaptable and Interpretable Neural Memory over Symbolic Knowledge	Jul 2, 2020	Language ModelingLanguage Modelling	—Unverified
FactTest: Factuality Testing in Large Language Models with Finite-Sample and Distribution-Free Guarantees	Nov 4, 2024	Multiple-choiceQuestion Answering	—Unverified
Fact-Tree Reasoning for N-ary Question Answering over Knowledge Graphs	Aug 17, 2021	Knowledge GraphsQuestion Answering	—Unverified
Domain-Specific Retrieval-Augmented Generation Using Vector Stores, Knowledge Graphs, and Tensor Factorization	Oct 3, 2024	Anomaly DetectionAttribute	—Unverified
Domain-specific Question Answering with Hybrid Search	Dec 4, 2024	Question AnsweringRetrieval	—Unverified
ChatGPT in the Classroom: An Analysis of Its Strengths and Weaknesses for Solving Undergraduate Computer Science Questions	Apr 28, 2023	ChatbotLanguage Modeling	—Unverified
Fair comparison of knowledge graphs for question answering	Nov 16, 2021	Knowledge GraphsQuestion Answering	—Unverified
Beyond English: The Impact of Prompt Translation Strategies across Languages and Tasks in Multilingual LLMs	Feb 13, 2025	Abstractive Text Summarizationnamed-entity-recognition	—Unverified

Show:10 25 50

← PrevPage 151 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified