Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10326–10350 of 10817 papers

Title	Date	Tasks	Status
TABi: Type-Aware Bi-encoders for End-to-End Entity Retrieval	Nov 16, 2021	Entity RetrievalFact Checking	—Unverified
TableBench: A Comprehensive and Complex Benchmark for Table Question Answering	Aug 17, 2024	Question Answering	—Unverified
TableGPT: Towards Unifying Tables, Nature Language and Commands into One GPT	Jul 17, 2023	Data VisualizationQuestion Answering	—Unverified
TableQAKit: A Comprehensive and Practical Toolkit for Table-based Question Answering	Oct 23, 2023	Question AnsweringTable-based Question Answering	—Unverified
TableQA: Question Answering on Tabular Data	Aug 30, 2017	Question Answering	—Unverified
Table-R1: Region-based Reinforcement Learning for Table Understanding	May 18, 2025	Question Answeringreinforcement-learning	—Unverified
Table Retrieval Does Not Necessitate Table-specific Model Design	Jan 16, 2022	Natural QuestionsQuestion Answering	—Unverified
Tables as Texts or Images: Evaluating the Table Reasoning Ability of LLMs and MLLMs	Feb 19, 2024	Fact CheckingQuestion Answering	—Unverified
Tables as Semi-structured Knowledge for Question Answering	Aug 1, 2016	Information RetrievalQuestion Answering	—Unverified
TabMCQ: A Dataset of General Knowledge Tables and Multiple-choice Questions	Feb 12, 2016	General KnowledgeMultiple-choice	—Unverified
TabSD: Large Free-Form Table Question Answering with SQL-Based Table Decomposition	Feb 19, 2025	Answer GenerationForm	—Unverified
Tabular-TX: Theme-Explanation Structure-based Table Summarization via In-Context Learning	Jan 17, 2025	In-Context LearningQuestion Answering	—Unverified
Tackling Adversarial Examples in QA via Answer Sentence Selection	Jul 1, 2018	ArticlesQuestion Answering	—Unverified
Tackling Biomedical Text Summarization: OAQA at BioASQ 5B	Aug 1, 2017	Answer GenerationClustering	—Unverified
Tackling Code-Switched NER: Participation of CMU	Jul 1, 2018	named-entity-recognitionNamed Entity Recognition	—Unverified
Tackling VQA with Pretrained Foundation Models without Further Training	Sep 27, 2023	Question AnsweringVisual Question Answering	—Unverified
TACO-RL: Task Aware Prompt Compression Optimization with Reinforcement Learning	Sep 19, 2024	Code SummarizationComputational Efficiency	—Unverified
TACR: A Table-alignment-based Cell-selection and Reasoning Model for Hybrid Question-Answering	May 24, 2023	Question AnsweringRetrieval	—Unverified
Take A Step Back: Rethinking the Two Stages in Visual Reasoning	Jul 29, 2024	Logical ReasoningQuestion Answering	—Unverified
TakeLab-QA at SemEval-2017 Task 3: Classification Experiments for Answer Retrieval in Community QA	Aug 1, 2017	Community Question AnsweringGeneral Classification	—Unverified
Taking a HINT: Leveraging Explanations to Make Vision and Language Models More Grounded	Feb 11, 2019	Image CaptioningQuestion Answering	—Unverified
Taking Notes Brings Focus? Towards Multi-Turn Multimodal Dialogue Learning	Mar 10, 2025	Question Answering	—Unverified
TALE: A Tool-Augmented Framework for Reference-Free Evaluation of Large Language Models	Apr 10, 2025	Question Answering	—Unverified
Talking to GDELT Through Knowledge Graphs	Mar 10, 2025	ArticlesKnowledge Graphs	—Unverified
Talking to the brain: Using Large Language Models as Proxies to Model Brain Semantic Representation	Feb 26, 2025	Question Answeringvalid	—Unverified

Show:10 25 50

← PrevPage 414 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified