Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4101–4150 of 10817 papers

Title	Date	Tasks	Status
A Comprehensive Survey on Relation Extraction: Recent Advances and New Frontiers	Jun 3, 2023	Information RetrievalKnowledge Graph Completion	—Unverified
HITSZ-ICRC: An Integration Approach for QA TempEval Challenge	Jun 1, 2015	Information RetrievalQuestion Answering	—Unverified
Does my multimodal model learn cross-modal interactions? It's harder to tell than you might think!	Oct 13, 2020	DiagnosticImage-text Classification	—Unverified
Does Entity Abstraction Help Generative Transformers Reason?	Jan 5, 2022	Conversational Question AnsweringLogical Reasoning	—Unverified
Best-Answer Prediction in Q&A Sites Using User Information	Dec 15, 2022	Community Question AnsweringQuestion Answering	—Unverified
Does Circuit Analysis Interpretability Scale? Evidence from Multiple Choice Capabilities in Chinchilla	Jul 18, 2023	Multiple-choiceQuestion Answering	—Unverified
ANNA”:" Enhanced Language Representation for Question Answering	May 1, 2022	Language ModelingLanguage Modelling	—Unverified
3D Question Answering	Dec 15, 2021	3D geometryQuestion Answering	—Unverified
BERT vs GPT for financial engineering	Apr 24, 2024	Machine TranslationQuestion Answering	—Unverified
DocVideoQA: Towards Comprehensive Understanding of Document-Centric Videos through Question Answering	Mar 20, 2025	Contrastive LearningQuestion Answering	—Unverified
ANNA: Enhanced Language Representation for Question Answering	Mar 28, 2022	Language ModelingLanguage Modelling	—Unverified
HIT&QMUL at SemEval-2022 Task 9: Label-Enclosed Generative Question Answering (LEG-QA)	Jul 1, 2022	Generative Question AnsweringQuestion Answering	—Unverified
HITSZ-ICRC: Exploiting Classification Approach for Answer Selection in Community Question Answering	Jun 1, 2015	Answer SelectionCommunity Question Answering	—Unverified
HOLMES: Hyper-Relational Knowledge Graphs for Multi-hop Question Answering using LLMs	Jun 10, 2024	Knowledge GraphsMulti-hop Question Answering	—Unverified
Document Visual Question Answering Challenge 2020	Aug 20, 2020	Question AnsweringRetrieval	—Unverified
Document Structure aware Relational Graph Convolutional Networks for Ontology Population	Apr 27, 2021	Hypernym DiscoveryQuestion Answering	—Unverified
Document retrieval and question answering in medical documents. A large-scale corpus challenge.	Sep 1, 2017	Document ClassificationGeneral Classification	—Unverified
Document-level Causal Relation Extraction with Knowledge-guided Binary Question Answering	Oct 7, 2024	Question AnsweringRelation	—Unverified
ANNA: Enhanced Language Representation for Question Answering	Nov 16, 2021	Language ModelingLanguage Modelling	—Unverified
A Fast, Reliable, and Secure Programming Language for LLM Agents with Code Actions	Jun 13, 2025	Conformal PredictionQuestion Answering	—Unverified
BERT-PersNER: A New Model for Persian Named Entity Recognition	Sep 1, 2021	Active LearningMachine Translation	—Unverified
Document Collection Visual Question Answering	Apr 27, 2021	document understandingQuestion Answering	—Unverified
Document Attribution: Examining Citation Relationships using Large Language Models	May 9, 2025	Document SummarizationNatural Language Inference	—Unverified
History Semantic Graph Enhanced Conversational KBQA with Temporal Information Modeling	Jun 12, 2023	Question Answering	—Unverified
Document AI: Benchmarks, Models and Applications	Nov 16, 2021	Deep LearningDocument AI	—Unverified
BERTologyNavigator: Advanced Question Answering with BERT-based Semantics	Jan 17, 2024	Knowledge GraphsNavigate	—Unverified
DocPrompt: Large-scale continue pretrain for zero-shot and few-shot document question answering	Aug 21, 2023	Question Answering	—Unverified
HiQA: A Hierarchical Contextual Augmentation RAG for Multi-Documents QA	Feb 1, 2024	HallucinationLanguage Modeling	—Unverified
HIS-GPT: Towards 3D Human-In-Scene Multimodal Understanding	Mar 17, 2025	Question AnsweringScene Understanding	—Unverified
An Investigation of Machine Translation Evaluation Metrics in Cross-lingual Question Answering	Sep 1, 2015	Cross-Lingual Question AnsweringMachine Translation	—Unverified
Out of Sight But Not Out of Mind: An Answer Set Programming Based Online Abduction Framework for Visual Sensemaking in Autonomous Driving	May 31, 2019	Autonomous DrivingQuestion Answering	—Unverified
DOCMASTER: A Unified Platform for Annotation, Training, & Inference in Document Question-Answering	Mar 30, 2024	Privacy PreservingQuestion Answering	—Unverified
DocGraphLM: Documental Graph Language Model for Information Extraction	Jan 5, 2024	document understandingLanguage Modeling	—Unverified
History-Aware Question Answering in a Blocks World Dialogue System	May 26, 2020	Natural Language UnderstandingQuestion Answering	—Unverified
HiTab: A Hierarchical Table Dataset for Question Answering and Natural Language Generation	Oct 16, 2021	Entity AlignmentQuestion Answering	—Unverified
Docforia: A Multilayer Document Model	May 1, 2017	Coreference ResolutionDependency Parsing	—Unverified
DOCENT: Learning Self-Supervised Entity Representations from Large Document Collections	Feb 26, 2021	Knowledge Base CompletionNatural Language Queries	—Unverified
DocChat: An Information Retrieval Approach for Chatbot Engines Using Unstructured Documents	Aug 1, 2016	ChatbotCommunity Question Answering	—Unverified
Hint-enhanced In-Context Learning wakes Large Language Models up for knowledge-intensive tasks	Nov 3, 2023	In-Context LearningOpen-Domain Question Answering	—Unverified
A Training-free Sub-quadratic Cost Transformer Model Serving Framework With Hierarchically Pruned Attention	Jun 14, 2024	GPUQuestion Answering	—Unverified
DLS@CU: Sentence Similarity from Word Alignment	Aug 1, 2014	Information RetrievalMachine Translation	—Unverified
DLS@CU: Sentence Similarity from Word Alignment and Semantic Vector Composition	Jun 1, 2015	Information RetrievalMachine Translation	—Unverified
An Introductory Survey on Attention Mechanisms in NLP Problems	Nov 12, 2018	Dependency ParsingGeneral Classification	—Unverified
DLS@CU-CORE: A Simple Machine Learning Model of Semantic Textual Similarity	Jun 1, 2013	BIG-bench Machine LearningInformation Retrieval	—Unverified
DLS@CU at SemEval-2016 Task 1: Supervised Models of Sentence Similarity	Jun 1, 2016	Machine TranslationNatural Language Inference	—Unverified
BERT for Question Generation	Oct 1, 2019	Language ModelingLanguage Modelling	—Unverified
A Factoid Question Answering System Using Answer Pattern Matching	Oct 1, 2013	Question Answering	—Unverified
HiPerRAG: High-Performance Retrieval Augmented Generation for Scientific Insights	May 7, 2025	ArticlesContrastive Learning	—Unverified
BERTERS: Multimodal Representation Learning for Expert Recommendation System with Transformer	Jun 30, 2020	ArticlesCommunity Question Answering	—Unverified
DLIP: Distilling Language-Image Pre-training	Aug 24, 2023	Image CaptioningImage-text Retrieval	—Unverified

Show:10 25 50

← PrevPage 83 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified