Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7276–7300 of 10817 papers

Title	Date	Tasks	Status
Guess Me if You Can: Acronym Disambiguation for Enterprises	Jul 1, 2018	Question Answering	—Unverified
Conditional Generation with a Question-Answering Blueprint	Jul 1, 2022	Question AnsweringQuestion Generation	—Unverified
ParaLaw Nets -- Cross-lingual Sentence-level Pretraining for Legal Text Processing	Jun 25, 2021	Question AnsweringSentence	—Unverified
Concise Thoughts: Impact of Output Length on LLM Reasoning and Cost	Jul 29, 2024	GSM8KPrompt Engineering	—Unverified
GTR-LSTM: A Triple Encoder for Sentence Generation from RDF Data	Jul 1, 2018	Data-to-Text GenerationDecoder	—Unverified
Parallelizing Word2Vec in Shared and Distributed Memory	Apr 15, 2016	CPUMachine Translation	—Unverified
Parallel Key-Value Cache Fusion for Position Invariant RAG	Jan 13, 2025	DecoderOpen-Domain Question Answering	—Unverified
PARAMANU-AYN: Pretrain from scratch or Continual Pretraining of LLMs for Legal Domain Adaptation?	Mar 20, 2024	Abstractive Text SummarizationContinual Pretraining	—Unverified
Parameter-Efficient Abstractive Question Answering over Tables and over Text	Nov 16, 2021	abstractive question answeringDecoder	—Unverified
Exploiting User Search Sessions for the Semantic Categorization of Question-like Informational Search Queries	Oct 1, 2013	Question Answering	—Unverified
CFO: A Framework for Building Production NLP Systems	Aug 16, 2019	Information RetrievalMachine Reading Comprehension	—Unverified
A Study of the Effect of Resolving Negation and Sentiment Analysis in Recognizing Text Entailment for Arabic	Jul 5, 2019	Natural Language InferenceNegation	—Unverified
GTR: Graph-Table-RAG for Cross-Table Question Answering	Apr 2, 2025	Question AnsweringRAG	—Unverified
Parameter-Efficient Neural Question Answering Models via Graph-Enriched Document Representations	Jun 1, 2021	Question Answering	—Unverified
gTBLS: Generating Tables from Text by Conditional Question Answering	Mar 21, 2024	Language ModelingLanguage Modelling	—Unverified
Parameter-free Video Segmentation for Vision and Language Understanding	Mar 3, 2025	Question AnsweringVideo Question Answering	—Unverified
Paraphrase-Driven Learning for Open Question Answering	Aug 1, 2013	Open-Domain Question AnsweringOpen-Ended Question Answering	—Unverified
Paraphrase for Open Question Answering: New Dataset and Methods	Jun 1, 2016	Open-Ended Question AnsweringOpen Information Extraction	—Unverified
Paraphrase Generation from Latent-Variable PCFGs for Semantic Parsing	Jan 22, 2016	Open-Domain Question AnsweringParaphrase Generation	—Unverified
GSQA: An End-to-End Model for Generative Spoken Question Answering	Dec 15, 2023	Question Answering	—Unverified
Paraphrasing in Affirmative Terms Improves Negation Understanding	Jun 11, 2024	Natural Language InferenceNatural Language Understanding	—Unverified
G-SAP: Graph-based Structure-Aware Prompt Learning over Heterogeneous Knowledge for Commonsense Reasoning	May 9, 2024	Graph Neural NetworkKnowledge Graphs	—Unverified
Paraphrasing with Large Language Models	Nov 21, 2019	Language ModelingLanguage Modelling	—Unverified
Paraphrastic Variance between European and Brazilian Portuguese	Aug 1, 2018	Machine TranslationQuestion Answering	—Unverified
AMR Beyond the Sentence: the Multi-sentence AMR corpus	Aug 1, 2018	Question AnsweringSentence	—Unverified

Show:10 25 50

← PrevPage 292 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified