Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4351–4375 of 10817 papers

Title	Date	Tasks	Status
Improved CCG Parsing with Semi-supervised Supertagging	Jan 1, 2014	CCG SupertaggingDependency Parsing	—Unverified
BAS: An Answer Selection Method Using BERT Language Model	Nov 4, 2019	Answer SelectionLanguage Modeling	—Unverified
Diagnosing and Addressing Pitfalls in KG-RAG Datasets: Toward More Reliable Benchmarking	May 29, 2025	BenchmarkingGraph Question Answering	—Unverified
A Neural Question Answering System for Basic Questions about Subroutines	Jan 11, 2021	DecoderQuestion Answering	—Unverified
DiagGPT: An LLM-based and Multi-agent Dialogue System with Automatic Topic Management for Flexible Task-Oriented Dialogue	Aug 15, 2023	ChatbotDiagnostic	—Unverified
DH-RAG: A Dynamic Historical Context-Powered Retrieval-Augmented Generation Method for Multi-Turn Dialogue	Feb 19, 2025	Question AnsweringRAG	—Unverified
BARTPhoBEiT: Pre-trained Sequence-to-Sequence and Image Transformers Models for Vietnamese Visual Question Answering	Jul 28, 2023	Question AnsweringVietnamese Visual Question Answering	—Unverified
Improved Bilinear Pooling with CNNs	Jul 21, 2017	GPUQuestion Answering	—Unverified
Improve Dense Passage Retrieval with Entailment Tuning	Oct 21, 2024	Open-Domain Question AnsweringPassage Retrieval	—Unverified
DHP Benchmark: Are LLMs Good NLG Evaluators?	Aug 25, 2024	Benchmarkingnlg evaluation	—Unverified
DGRAG: Distributed Graph-based Retrieval-Augmented Generation in Edge-Cloud Systems	May 26, 2025	Answer GenerationKnowledge Graphs	—Unverified
Barriers in Integrating Medical Visual Question Answering into Radiology Workflows: A Scoping Review and Clinicians' Insights	Jul 9, 2025	DiagnosticMedical Visual Question Answering	—Unverified
A Neural Question Answering Model Based on Semi-Structured Tables	Aug 1, 2018	Knowledge GraphsMultiple-choice	—Unverified
Development of Hybrid Algorithm for Automatic Extraction of Multiword Expressions from Monolingual and Parallel Corpus of English and Punjabi	Dec 1, 2020	Information RetrievalMachine Translation	—Unverified
A Neural Network Model for Low-Resource Universal Dependency Parsing	Sep 1, 2015	Dependency ParsingDomain Adaptation	—Unverified
Developing Question-Answering Models in Low-Resource Languages: A Case Study on Turkish Medical Texts Using Transformer-Based Approaches	Oct 16, 2024	Language ModelingLanguage Modelling	—Unverified
Developing ML-based Systems to Extract Medical Information from Japanese Medical History Summaries	Oct 1, 2013	Information RetrievalNamed Entity Recognition (NER)	—Unverified
Barking Up The Syntactic Tree: Enhancing VLM Training with Syntactic Losses	Dec 11, 2024	Image-text RetrievalQuestion Answering	—Unverified
A Competence-aware Curriculum for Visual Concepts Learning via Question Answering	Jul 3, 2020	Question Answering	—Unverified
Improved Baselines for Data-efficient Perceptual Augmentation of LLMs	Mar 20, 2024	Audio captioningImage Captioning	—Unverified
Improved Lexically Constrained Decoding for Translation and Monolingual Rewriting	Jun 1, 2019	Data AugmentationMachine Translation	—Unverified
Improving and Diagnosing Knowledge-Based Visual Question Answering via Entity Enhanced Knowledge Injection	Dec 13, 2021	Common Sense ReasoningKnowledge Graph Embeddings	—Unverified
Developing ChatGPT for Biology and Medicine: A Complete Review of Biomedical Question Answering	Jan 15, 2024	Cross-Modal RetrievalMedical Diagnosis	—Unverified
Developing a How-to Tip Machine Comprehension Dataset and its Evaluation in Machine Comprehension by BERT	Jul 1, 2020	Question AnsweringReading Comprehension	—Unverified
BanglaQuAD: A Bengali Open-domain Question Answering Dataset	Oct 14, 2024	ArticlesOpen-Domain Question Answering	—Unverified

Show:10 25 50

← PrevPage 175 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified