Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4051–4100 of 10817 papers

Title	Date	Tasks	Status	Score
AmazonQA: A Review-Based Question Answering Task	Aug 12, 2019	Answer GenerationInformation Retrieval	CodeCode Available	5
From Philosophy to Interfaces: an Explanatory Method and a Tool Inspired by Achinstein's Theory of Explanation	Sep 9, 2021	Explainable Artificial Intelligence (XAI)Knowledge Graphs	CodeCode Available	5
HALLUCINOGEN: A Benchmark for Evaluating Object Hallucination in Large Visual-Language Models	Dec 29, 2024	HallucinationObject	CodeCode Available	5
Weakly Supervised Relative Spatial Reasoning for Visual Question Answering	Sep 4, 2021	Question AnsweringSpatial Reasoning	CodeCode Available	5
Comparative Study of Machine Learning Models and BERT on SQuAD	May 22, 2020	BIG-bench Machine LearningQuestion Answering	CodeCode Available	5
Guiding Vision-Language Model Selection for Visual Question-Answering Across Tasks, Domains, and Knowledge Types	Sep 14, 2024	Language ModelingLanguage Modelling	CodeCode Available	5
GW-MoE: Resolving Uncertainty in MoE Router with Global Workspace Theory	Jun 18, 2024	Code GenerationMathematical Problem-Solving	CodeCode Available	5
GUIDEQ: Framework for Guided Questioning for progressive informational collection and classification	Nov 8, 2024	Question Answeringtext-classification	CodeCode Available	5
A mathematical model for universal semantics	Jul 29, 2019	modelQuestion Answering	CodeCode Available	5
Guiding Extractive Summarization with Question-Answering Rewards	Apr 4, 2019	Extractive SummarizationQuestion Answering	CodeCode Available	5
GYM at Qur’an QA 2023 Shared Task: Multi-Task Transfer Learning for Quranic Passage Retrieval and Question Answering with Large Language Models	Dec 7, 2023	Multi-Task LearningPassage Retrieval	CodeCode Available	5
A Mathematical Framework, a Taxonomy of Modeling Paradigms, and a Suite of Learning Techniques for Neural-Symbolic Systems	Jul 12, 2024	image-classificationImage Classification	CodeCode Available	5
Faithful Embeddings for Knowledge Base Queries	Apr 7, 2020	Question Answering	CodeCode Available	5
Compact Trilinear Interaction for Visual Question Answering	Sep 26, 2019	BenchmarkingKnowledge Distillation	CodeCode Available	5
HALO: Hallucination Analysis and Learning Optimization to Empower LLMs with Retrieval-Augmented Context for Guided Clinical Decision Making	Sep 16, 2024	Answer GenerationDecision Making	CodeCode Available	5
HeySQuAD: A Spoken Question Answering Dataset	Apr 26, 2023	Question Answering	CodeCode Available	5
CommVQA: Situating Visual Question Answering in Communicative Contexts	Feb 22, 2024	Question AnsweringVisual Question Answering	CodeCode Available	5
Community Question Answering Entity Linking via Leveraging Auxiliary Data	May 24, 2022	Community Question AnsweringEntity Linking	CodeCode Available	5
Commonsense Properties from Query Logs and Question Answering Forums	May 27, 2019	Question Answering	CodeCode Available	5
Commonsense Knowledge Mining from Term Definitions	Feb 1, 2021	Knowledge GraphsNatural Language Understanding	CodeCode Available	5
A Dataset for Spatiotemporal-Sensitive POI Question Answering	May 16, 2025	Question AnsweringRAG	CodeCode Available	5
GraphextQA: A Benchmark for Evaluating Graph-Enhanced Large Language Models	Oct 12, 2023	Answer GenerationHallucination	CodeCode Available	5
Commonsense for Generative Multi-Hop Question Answering Tasks	Sep 17, 2018	DecoderImplicit Relations	CodeCode Available	5
Common-Knowledge Concept Recognition for SEVA	Mar 26, 2020	Entity Extraction using GANgraph construction	CodeCode Available	5
CommonGen: A Constrained Text Generation Challenge for Generative Commonsense Reasoning	Nov 9, 2019	Common Sense ReasoningQuestion Answering	CodeCode Available	5
Graph-Based Reasoning over Heterogeneous External Knowledge for Commonsense Question Answering	Sep 9, 2019	Common Sense ReasoningGraph Attention	CodeCode Available	5
Graph Learning in the Era of LLMs: A Survey from the Perspective of Data, Models, and Tasks	Dec 17, 2024	Domain GeneralizationGraph Learning	CodeCode Available	5
Grounded Graph Decoding Improves Compositional Generalization in Question Answering	Nov 5, 2021	Question Answering	CodeCode Available	5
ASQA: Factoid Questions Meet Long-Form Answers	Apr 12, 2022	FormQuestion Answering	CodeCode Available	5
Alloprof: a new French question-answer education dataset and its use in an information retrieval case study	Feb 10, 2023	Information RetrievalQuestion Answering	CodeCode Available	5
Combining Word Embeddings and Feature Embeddings for Fine-grained Relation Extraction	May 1, 2015	Machine TranslationNER	CodeCode Available	5
Few-shot Transfer Learning for Knowledge Base Question Answering: Fusing Supervised Models with In-Context Learning	Nov 15, 2023	In-Context LearningKnowledge Base Question Answering	CodeCode Available	5
Gold: A Global and Local-aware Denoising Framework for Commonsense Knowledge Graph Noise Detection	Oct 18, 2023	DenoisingKnowledge Graphs	CodeCode Available	5
Gotta: Generative Few-shot Question Answering by Prompt-based Cloze Data Augmentation	Jun 7, 2023	Data AugmentationQuestion Answering	CodeCode Available	5
GradBias: Unveiling Word Influence on Bias in Text-to-Image Generative Models	Aug 29, 2024	Bias DetectionFairness	CodeCode Available	5
Fully Automated Fact Checking Using External Sources	Oct 1, 2017	Community Question AnsweringFact Checking	CodeCode Available	5
GloVe: Global Vectors for Word Representation	Oct 1, 2014	Document ClassificationInformation Retrieval	CodeCode Available	5
GLoMo: Unsupervisedly Learned Relational Graphs as Transferable Representations	Jun 14, 2018	image-classificationImage Classification	CodeCode Available	5
A Case Study of Cross-Lingual Zero-Shot Generalization for Classical Languages in LLMs	May 19, 2025	Machine Translationnamed-entity-recognition	CodeCode Available	5
CODAH: An Adversarially-Authored Question Answering Dataset for Common Sense	Jun 1, 2019	Common Sense ReasoningQuestion Answering	CodeCode Available	5
Ask Me Anything: Dynamic Memory Networks for Natural Language Processing	Jun 24, 2015	General ClassificationPart-Of-Speech Tagging	CodeCode Available	5
Why do These Match? Explaining the Behavior of Image Similarity Models	May 26, 2019	AttributeGeneral Classification	CodeCode Available	5
GlossGPT: GPT for Word Sense Disambiguation using Few-shot Chain-of-Thought Prompting	Mar 1, 2025	Question AnsweringWord Sense Disambiguation	CodeCode Available	5
Give me Some Hard Questions: Synthetic Data Generation for Clinical QA	Dec 5, 2024	Question AnsweringQuestion Generation	CodeCode Available	5
Globally Normalized Reader	Sep 8, 2017	Data AugmentationQuestion Answering	CodeCode Available	5
GNN2R: Weakly-Supervised Rationale-Providing Question Answering over Knowledge Graphs	Dec 4, 2023	Explanation GenerationGraph Neural Network	CodeCode Available	5
Aspect-based Sentiment Analysis in Question Answering Forums	Nov 1, 2021	Aspect-Based Sentiment AnalysisAspect-Based Sentiment Analysis (ABSA)	CodeCode Available	5
GenKI: Enhancing Open-Domain Question Answering with Knowledge Integration and Controllable Generation in Large Language Models	May 26, 2025	Open-Domain Question AnsweringPassage Retrieval	CodeCode Available	5
Ask Your Neurons: A Deep Learning Approach to Visual Question Answering	May 9, 2016	Question AnsweringVisual Question Answering	CodeCode Available	5
COLUMBUS: Evaluating COgnitive Lateral Understanding through Multiple-choice reBUSes	Sep 6, 2024	Multiple-choiceQuestion Answering	CodeCode Available	5

Show:10 25 50

← PrevPage 82 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified