Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10301–10350 of 10817 papers

Title	Date	Tasks	Status
Syntactically Aware Neural Architectures for Definition Extraction	Jun 1, 2018	BenchmarkingBinary Classification	—Unverified
Syntactic Dependencies and Distributed Word Representations for Analogy Detection and Mining	Sep 1, 2015	Information RetrievalMachine Translation	—Unverified
Syntactic Parsing of Web Queries with Question Intent	Jun 1, 2016	Community Question AnsweringDomain Adaptation	—Unverified
Syntactic Semantic Correspondence in Dependency Grammar	Jan 1, 2017	Question AnsweringSemantic correspondence	—Unverified
Syntax-based Deep Matching of Short Texts	Mar 9, 2015	Machine TranslationQuestion Answering	—Unverified
Syntax-informed Question Answering with Heterogeneous Graph Transformer	Apr 1, 2022	Language ModelingLanguage Modelling	—Unverified
Syntax Tree Constrained Graph Network for Visual Question Answering	Sep 17, 2023	Question AnsweringVisual Question Answering	—Unverified
Synthesize Step-by-Step: Tools, Templates and LLMs as Data Generators for Reasoning-Based Chart VQA	Mar 25, 2024	Chart Question AnsweringData Augmentation	—Unverified
Synthesize Step-by-Step: Tools Templates and LLMs as Data Generators for Reasoning-Based Chart VQA	Jan 1, 2024	Chart Question AnsweringData Augmentation	—Unverified
Synthesizing Conversations from Unlabeled Documents using Automatic Response Segmentation	Jun 6, 2024	Conversational Question AnsweringQuestion Answering	—Unverified
Synthetic Clarification and Correction Dialogues about Data-Centric Tasks -- A Teacher-Student Approach	Mar 18, 2025	Question AnsweringTable-based Question Answering	—Unverified
Synthetic Data Augmentation for Zero-Shot Cross-Lingual Question Answering	Oct 23, 2020	Cross-Lingual Question AnsweringData Augmentation	—Unverified
Synthetic Data Generation for Multilingual Domain-Adaptable Question Answering Systems	Jun 1, 2022	Question AnsweringSynthetic Data Generation	—Unverified
Synthetic Data Generation & Multi-Step RL for Reasoning & Tool Use	Apr 7, 2025	GSM8KMath	—Unverified
Synthetic Data Generation Using Large Language Models: Advances in Text and Code	Mar 18, 2025	Code TranslationPrompt Engineering	—Unverified
Synthetic Function Demonstrations Improve Generation in Low-Resource Programming Languages	Mar 24, 2025	Question AnsweringRAG	—Unverified
Synthetic Multimodal Question Generation	Jul 2, 2024	Language ModelingLanguage Modelling	—Unverified
Synthetic Question Value Estimation for Domain Adaptation of Question Answering	Nov 16, 2021	Domain AdaptationQuestion Answering	—Unverified
Synthetic Target Domain Supervision for Open Retrieval QA	Apr 20, 2022	Passage RetrievalQuestion Answering	—Unverified
Systematic Assessment of Factual Knowledge in Large Language Models	Oct 18, 2023	Knowledge GraphsQuestion Answering	—Unverified
Systematic Error Analysis of the Stanford Question Answering Dataset	Jul 1, 2018	Common Sense ReasoningMachine Reading Comprehension	—Unverified
Systems' Agreements and Disagreements in Temporal Processing: An Extensive Error Analysis of the TempEval-3 Task	May 1, 2018	Natural Language InferenceQuestion Answering	—Unverified
T2I-FactualBench: Benchmarking the Factuality of Text-to-Image Models with Knowledge-Intensive Concepts	Dec 5, 2024	BenchmarkingImage Generation	—Unverified
T3: A Novel Zero-shot Transfer Learning Framework Iteratively Training on an Assistant Task for a Target Task	Sep 26, 2024	Question AnsweringSemantic Similarity	—Unverified
TABi: Type-Aware Bi-encoders for End-to-End Entity Retrieval	Nov 16, 2021	Entity RetrievalFact Checking	—Unverified
TableBench: A Comprehensive and Complex Benchmark for Table Question Answering	Aug 17, 2024	Question Answering	—Unverified
TableGPT: Towards Unifying Tables, Nature Language and Commands into One GPT	Jul 17, 2023	Data VisualizationQuestion Answering	—Unverified
TableQAKit: A Comprehensive and Practical Toolkit for Table-based Question Answering	Oct 23, 2023	Question AnsweringTable-based Question Answering	—Unverified
TableQA: Question Answering on Tabular Data	Aug 30, 2017	Question Answering	—Unverified
Table-R1: Region-based Reinforcement Learning for Table Understanding	May 18, 2025	Question Answeringreinforcement-learning	—Unverified
Table Retrieval Does Not Necessitate Table-specific Model Design	Jan 16, 2022	Natural QuestionsQuestion Answering	—Unverified
Tables as Texts or Images: Evaluating the Table Reasoning Ability of LLMs and MLLMs	Feb 19, 2024	Fact CheckingQuestion Answering	—Unverified
Tables as Semi-structured Knowledge for Question Answering	Aug 1, 2016	Information RetrievalQuestion Answering	—Unverified
TabMCQ: A Dataset of General Knowledge Tables and Multiple-choice Questions	Feb 12, 2016	General KnowledgeMultiple-choice	—Unverified
TabSD: Large Free-Form Table Question Answering with SQL-Based Table Decomposition	Feb 19, 2025	Answer GenerationForm	—Unverified
Tabular-TX: Theme-Explanation Structure-based Table Summarization via In-Context Learning	Jan 17, 2025	In-Context LearningQuestion Answering	—Unverified
Tackling Adversarial Examples in QA via Answer Sentence Selection	Jul 1, 2018	ArticlesQuestion Answering	—Unverified
Tackling Biomedical Text Summarization: OAQA at BioASQ 5B	Aug 1, 2017	Answer GenerationClustering	—Unverified
Tackling Code-Switched NER: Participation of CMU	Jul 1, 2018	named-entity-recognitionNamed Entity Recognition	—Unverified
Tackling VQA with Pretrained Foundation Models without Further Training	Sep 27, 2023	Question AnsweringVisual Question Answering	—Unverified
TACO-RL: Task Aware Prompt Compression Optimization with Reinforcement Learning	Sep 19, 2024	Code SummarizationComputational Efficiency	—Unverified
TACR: A Table-alignment-based Cell-selection and Reasoning Model for Hybrid Question-Answering	May 24, 2023	Question AnsweringRetrieval	—Unverified
Take A Step Back: Rethinking the Two Stages in Visual Reasoning	Jul 29, 2024	Logical ReasoningQuestion Answering	—Unverified
TakeLab-QA at SemEval-2017 Task 3: Classification Experiments for Answer Retrieval in Community QA	Aug 1, 2017	Community Question AnsweringGeneral Classification	—Unverified
Taking a HINT: Leveraging Explanations to Make Vision and Language Models More Grounded	Feb 11, 2019	Image CaptioningQuestion Answering	—Unverified
Taking Notes Brings Focus? Towards Multi-Turn Multimodal Dialogue Learning	Mar 10, 2025	Question Answering	—Unverified
TALE: A Tool-Augmented Framework for Reference-Free Evaluation of Large Language Models	Apr 10, 2025	Question Answering	—Unverified
Talking to GDELT Through Knowledge Graphs	Mar 10, 2025	ArticlesKnowledge Graphs	—Unverified
Talking to the brain: Using Large Language Models as Proxies to Model Brain Semantic Representation	Feb 26, 2025	Question Answeringvalid	—Unverified
Talk to Papers: Bringing Neural Question Answering to Academic Search	Apr 4, 2020	Natural Language QueriesOpen-Domain Question Answering	—Unverified

Show:10 25 50

← PrevPage 207 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified