Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9751–9800 of 10817 papers

Title	Date	Tasks	Status
Analysing the Robustness of Dual Encoders for Dense Retrieval Against Misspellings	May 4, 2022	Contrastive LearningData Augmentation	CodeCode Available
Nash CoT: Multi-Path Inference with Preference Equilibrium	Jun 18, 2024	DiversityQuestion Answering	CodeCode Available
A Video Is Worth 4096 Tokens: Verbalize Videos To Understand Them In Zero Shot	May 16, 2023	Emotion ClassificationQuestion Answering	CodeCode Available
Automatic Spanish Translation of the SQuAD Dataset for Multilingual Question Answering	Dec 11, 2019	Question AnsweringTAR	CodeCode Available
Learning to Compose Neural Networks for Question Answering	Jan 7, 2016	Question Answeringreinforcement-learning	CodeCode Available
Analysing Mathematical Reasoning Abilities of Neural Models	Apr 2, 2019	Mathematical Question AnsweringMathematical Reasoning	CodeCode Available
A Distributional and Orthographic Aggregation Model for English Derivational Morphology	Jul 1, 2018	abstractive question answeringMachine Translation	CodeCode Available
Factor Graph Attention	Apr 11, 2019	Graph AttentionQuestion Answering	CodeCode Available
Combining Lexical and Dense Retrieval for Computationally Efficient Multi-hop Question Answering	Jun 15, 2021	Multi-hop Question AnsweringOpen-Domain Question Answering	CodeCode Available
Learning to Deceive Knowledge Graph Augmented Models via Targeted Perturbation	Oct 24, 2020	Knowledge GraphsQuestion Answering	CodeCode Available
CommonGen: A Constrained Text Generation Challenge for Generative Commonsense Reasoning	Nov 9, 2019	Common Sense ReasoningQuestion Answering	CodeCode Available
RefuteBench: Evaluating Refuting Instruction-Following for Large Language Models	Feb 21, 2024	Instruction FollowingMachine Translation	CodeCode Available
Automatic Opinion Question Generation	Nov 1, 2018	Community Question AnsweringQuestion Answering	CodeCode Available
Fact Checking in Community Forums	Mar 8, 2018	Community Question AnsweringFact Checking	CodeCode Available
Fact-and-Reflection (FaR) Improves Confidence Calibration of Large Language Models	Feb 27, 2024	Common Sense ReasoningQuestion Answering	CodeCode Available
Learning to Exploit Structured Resources for Lexical Inference	Jul 1, 2015	Question Answering	CodeCode Available
Combining Word Embeddings and Feature Embeddings for Fine-grained Relation Extraction	May 1, 2015	Machine TranslationNER	CodeCode Available
F1 is Not Enough! Models and Evaluation Towards User-Centered Explainable Question Answering	Oct 13, 2020	Model SelectionQuestion Answering	CodeCode Available
Porting an Open Information Extraction System from English to German	Nov 1, 2016	Open Information ExtractionQuestion Answering	CodeCode Available
Learning to Follow Object-Centric Image Editing Instructions Faithfully	Oct 29, 2023	ObjectQuestion Answering	CodeCode Available
Learning to Generalize for Cross-domain QA	May 14, 2023	Data AugmentationDomain Generalization	CodeCode Available
Eyes on the Road: State-of-the-Art Video Question Answering Models Assessment for Traffic Monitoring Tasks	Dec 2, 2024	Multi-Object TrackingObject Tracking	CodeCode Available
Natural Language Generation Using Link Grammar for General Conversational Intelligence	Apr 19, 2021	Question AnsweringText Generation	CodeCode Available
Analogical Math Word Problems Solving with Enhanced Problem-Solution Association	Dec 1, 2022	MathQuestion Answering	CodeCode Available
Natural Language Processing for Information Extraction	Jul 6, 2018	Articlescoreference-resolution	CodeCode Available
Regularization of Distinct Strategies for Unsupervised Question Generation	Nov 1, 2020	Few-Shot LearningQuestion Answering	CodeCode Available
Question Condensing Networks for Answer Selection in Community Question Answering	Jul 1, 2018	Answer SelectionCommunity Question Answering	CodeCode Available
Portuguese Named Entity Recognition using BERT-CRF	Sep 23, 2019	named-entity-recognitionNamed Entity Recognition	CodeCode Available
Automatic Generation of Contrast Sets from Scene Graphs: Probing the Compositional Consistency of GQA	Mar 17, 2021	Question AnsweringRelational Reasoning	CodeCode Available
Automatic Extraction of Disease Risk Factors from Medical Publications	Jul 10, 2024	ArticlesQuestion Answering	CodeCode Available
Natural Language Processing: State of The Art, Current Trends and Challenges	Aug 17, 2017	Machine TranslationQuestion Answering	CodeCode Available
POSQA: Probe the World Models of LLMs with Size Comparisons	Oct 20, 2023	Question Answering	CodeCode Available
Learning to Localize Objects Improves Spatial Reasoning in Visual-LLMs	Apr 11, 2024	DescriptiveHallucination	CodeCode Available
Retrieve, Read, Rerank: Towards End-to-End Multi-Document Reading Comprehension	Jun 11, 2019	Question AnsweringReading Comprehension	CodeCode Available
Powering Comparative Classification with Sentiment Analysis via Domain Adaptive Knowledge Transfer	Sep 7, 2021	Graph Neural NetworkQuestion Answering	CodeCode Available
Learning to Model and Ignore Dataset Bias with Mixed Capacity Ensembles	Nov 7, 2020	Natural Language InferenceQuestion Answering	CodeCode Available
Few-shot Transfer Learning for Knowledge Base Question Answering: Fusing Supervised Models with In-Context Learning	Nov 15, 2023	In-Context LearningKnowledge Base Question Answering	CodeCode Available
A Discrete Hard EM Approach for Weakly Supervised Question Answering	Sep 11, 2019	Question AnsweringTriviaQA	CodeCode Available
Are Large Language Models Good at Utility Judgments?	Mar 28, 2024	Answer GenerationBenchmarking	CodeCode Available
A Recurrent BERT-based Model for Question Generation	Nov 1, 2019	Language ModelingLanguage Modelling	CodeCode Available
A Question-Focused Multi-Factor Attention Network for Question Answering	Jan 25, 2018	Open-Domain Question AnsweringQuestion Answering	CodeCode Available
PQA: Perceptual Question Answering	Apr 8, 2021	Question Answering	CodeCode Available
PQA: Zero-shot Protein Question Answering for Free-form Scientific Enquiry with Large Language Models	Feb 21, 2024	BenchmarkingForm	CodeCode Available
Extrinsic Evaluation of Cultural Competence in Large Language Models	Jun 17, 2024	Open-Ended Question AnsweringQuestion Answering	CodeCode Available
Question Dependent Recurrent Entity Network for Question Answering	Jul 25, 2017	FormMemorization	CodeCode Available
Extractive Summarization with SWAP-NET: Sentences and Words from Alternating Pointer Networks	Jul 1, 2018	Abstractive Text SummarizationDocument Summarization	CodeCode Available
Extracting Victim Counts from Text	Feb 23, 2023	Dependency ParsingHumanitarian	CodeCode Available
COLUMBUS: Evaluating COgnitive Lateral Understanding through Multiple-choice reBUSes	Sep 6, 2024	Multiple-choiceQuestion Answering	CodeCode Available
A Deep Relevance Matching Model for Ad-hoc Retrieval	Nov 23, 2017	Ad-Hoc Information RetrievalParaphrase Identification	CodeCode Available
Learning to Rank Query Graphs for Complex Question Answering over Knowledge Graphs	Nov 2, 2018	Graph RankingKnowledge Graphs	CodeCode Available

Show:10 25 50

← PrevPage 196 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified