Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7251–7275 of 10817 papers

Title	Date	Tasks	Status
PaLI: A Jointly-Scaled Multilingual Language-Image Model	Sep 14, 2022	DecoderFew-Shot Image Classification	—Unverified
Automatic recognition of habituals: a three-way classification of clausal aspect	Sep 1, 2015	General ClassificationQuestion Answering	—Unverified
An Empirically-grounded tool for Automatic Prompt Linting and Repair: A Case Study on Bias, Vulnerability, and Optimization in Developer Prompts	Jan 21, 2025	Question AnsweringSentiment Analysis	—Unverified
PaLM 2 Technical Report	May 17, 2023	Code GenerationCommon Sense Reasoning	—Unverified
KeyGen2Vec: Learning Document Embedding via Multi-label Keyword Generation in Question-Answering	Oct 30, 2023	Document EmbeddingKeyphrase Generation	—Unverified
KET-QA: A Dataset for Knowledge Enhanced Table Question Answering	May 13, 2024	Question Answering	—Unverified
Automatic Question Generation using Relative Pronouns and Adverbs	Jul 1, 2018	DescriptiveDialogue Generation	—Unverified
PALM: Pre-training an Autoencoding\&Autoregressive Language Model for Context-conditioned Generation	Nov 1, 2020	Abstractive Text SummarizationConversational Response Generation	—Unverified
Kernel Pooling for Convolutional Neural Networks	Jul 1, 2017	Face RecognitionFine-Grained Visual Categorization	—Unverified
PALRACE: Reading Comprehension Dataset with Human Data and Labeled Rationales	Jun 23, 2021	Machine Reading ComprehensionQuestion Answering	—Unverified
PAM: Understanding Product Images in Cross Product Category Attribute Extraction	Jun 8, 2021	AttributeAttribute Extraction	—Unverified
Decision Knowledge Graphs: Construction of and Usage in Question Answering for Clinical Practice Guidelines	Aug 6, 2023	Knowledge GraphsQuestion Answering	—Unverified
Pangloss: Fast Entity Linking in Noisy Text Environments	Jul 16, 2018	ArticlesEntity Disambiguation	—Unverified
KERMIT: Generative Insertion-Based Modeling for Sequences	Jun 4, 2019	Machine TranslationQuestion Answering	—Unverified
Pangu DeepDiver: Adaptive Search Intensity Scaling via Open-Web Reinforcement Learning	May 30, 2025	Question AnsweringReinforcement Learning (RL)	—Unverified
PanGu-Σ: Towards Trillion Parameter Language Model with Sparse Heterogeneous Computing	Mar 20, 2023	Code GenerationLanguage Modeling	—Unverified
keqing: knowledge-based question answering is a nature chain-of-thought mentor of LLM	Dec 31, 2023	Information RetrievalQuestion Answering	—Unverified
Decipherment	Aug 1, 2013	DeciphermentPart-Of-Speech Tagging	—Unverified
Automatic Question-Answering Using A Deep Similarity Neural Network	Aug 5, 2017	Question Answering	—Unverified
An Empirical Evaluation of Visual Question Answering for Novel Objects	Apr 8, 2017	Question AnsweringVisual Question Answering	—Unverified
Advancing Large Language Model Attribution through Self-Improving	Oct 17, 2024	Language ModelingLanguage Modelling	—Unverified
A Comparative Evaluation of Visual and Natural Language Question Answering Over Linked Data	Jul 19, 2019	Natural Language QueriesQuestion Answering	—Unverified
PAQA: Toward ProActive Open-Retrieval Question Answering	Feb 26, 2024	Conversational SearchPassage Retrieval	—Unverified
ParaDi: Dictionary of Paraphrases of Czech Complex Predicates with Light Verbs	Apr 1, 2017	Information RetrievalMachine Translation	—Unverified
2M-NER: Contrastive Learning for Multilingual and Multimodal NER with Language and Modal Fusion	Apr 26, 2024	Contrastive LearningEntity Linking	—Unverified

Show:10 25 50

← PrevPage 291 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified