Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6601–6625 of 10817 papers

Title	Date	Tasks	Status
Language Model-Guided Knowledge Subgraphs for Question Answering	Nov 16, 2021	Knowledge GraphsLanguage Modeling	—Unverified
Despite "super-human" performance, current LLMs are unsuited for decisions about ethics and safety	Dec 13, 2022	Common Sense ReasoningEthics	—Unverified
LEMON: LanguagE ModeL for Negative Sampling of Knowledge Graph Embeddings	Mar 9, 2022	Graph EmbeddingKnowledge Graph Embedding	—Unverified
Language Is Not All You Need: Aligning Perception with Language Models	Feb 27, 2023	AllImage Captioning	—Unverified
Bactrainus: Optimizing Large Language Models for Multi-hop Complex Question Answering Tasks	Jan 10, 2025	Multi-hop Question AnsweringNatural Language Understanding	—Unverified
Multi-Row, Multi-Span Distant Supervision For Table+Text Question	Dec 14, 2021	Question AnsweringReading Comprehension	—Unverified
A Neural Comprehensive Ranker (NCR) for Open-Domain Question Answering	Sep 29, 2017	Open-Domain Question AnsweringPassage Ranking	—Unverified
Multi-Level Alignments As An Extensible Representation Basis for Textual Entailment Algorithms	Jun 1, 2015	Natural Language InferenceQuestion Answering	—Unverified
Multi-Level Attention Networks for Visual Question Answering	Jul 1, 2017	Question AnsweringVisual Question Answering	—Unverified
Multi-Level Explanations for Generative Language Models	Mar 21, 2024	Question Answeringtext-classification	—Unverified
Multi-level Gated Recurrent Neural Network for Dialog Act Classification	Oct 4, 2019	ClassificationDialog Act Classification	—Unverified
Adversarial Attacks Beyond the Image Space	Nov 20, 2017	Question AnsweringVisual Question Answering	—Unverified
Multilingual Aliasing for Auto-Generating Proposition Banks	Dec 1, 2016	Machine TranslationQuestion Answering	—Unverified
Multilingual Answer Sentence Reranking via Automatically Translated Data	Feb 20, 2021	Question AnsweringReranking	—Unverified
Multilingual Augmentation for Robust Visual Question Answering in Remote Sensing Images	Apr 7, 2023	Contrastive LearningQuestion Answering	—Unverified
Multilingual European Language Models: Benchmarking Approaches and Challenges	Feb 18, 2025	BenchmarkingQuestion Answering	—Unverified
Multilingual Image Corpus – Towards a Multimodal and Multilingual Dataset	Jun 1, 2022	Caption Generationimage-classification	—Unverified
Multilingual Medical Question Answering and Information Retrieval for Rural Health Intelligence Access	Jun 2, 2021	Information RetrievalMedical Question Answering	—Unverified
Language Independent Sentence-Level Subjectivity Analysis with Feature Selection	Nov 1, 2012	feature selectionMachine Translation	—Unverified
Designing Templates for Eliciting Commonsense Knowledge from Pretrained Sequence-to-Sequence Models	Dec 1, 2020	Multiple-choiceNatural Language Understanding	—Unverified
Language-Image Models with 3D Understanding	May 6, 2024	Question AnsweringVisual Question Answering	—Unverified
Multilingual Question Answering from Formatted Text applied to Conversational Agents	Oct 10, 2019	Extractive Question-AnsweringMachine Translation	—Unverified
BACON: Improving Clarity of Image Captions via Bag-of-Concept Graphs	Jul 3, 2024	Image CaptioningImage Generation	—Unverified
Multilingual Retrieval-Augmented Generation for Knowledge-Intensive Task	Apr 4, 2025	Open-Domain Question AnsweringQuestion Answering	—Unverified
Language Features Matter: Effective Language Representations for Vision-Language Tasks	Aug 17, 2019	Image CaptioningLanguage Modelling	—Unverified

Show:10 25 50

← PrevPage 265 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified