Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5601–5625 of 10817 papers

Title	Date	Tasks	Status
Semantic-aware Dynamic Retrospective-Prospective Reasoning for Event-level Video Question Answering	May 14, 2023	Question AnsweringSemantic Role Labeling	—Unverified
Learning to Generalize for Cross-domain QA	May 14, 2023	Data AugmentationDomain Generalization	CodeCode Available
Distinguish Before Answer: Generating Contrastive Explanation as Knowledge for Commonsense Question Answering	May 14, 2023	Explanation GenerationQuestion Answering	—Unverified
SCENE: Self-Labeled Counterfactuals for Extrapolating to Negative Examples	May 13, 2023	Data AugmentationNatural Language Inference	CodeCode Available
HPE:Answering Complex Questions over Text by Hybrid Question Parsing and Execution	May 12, 2023	Knowledge GraphsQuestion Answering	—Unverified
Improving Small Language Models on PubMedQA via Generative Data Augmentation	May 12, 2023	Data AugmentationQuestion Answering	—Unverified
Implications of Deep Circuits in Improving Quality of Quantum Question Answering	May 12, 2023	Quantum Machine LearningQuestion Answering	—Unverified
A Memory Model for Question Answering from Streaming Data Supported by Rehearsal and Anticipation of Coreference Information	May 12, 2023	MemorizationQuestion Answering	—Unverified
When Giant Language Brains Just Aren't Enough! Domain Pizzazz with Knowledge Sparkle Dust	May 12, 2023	Domain AdaptationQuestion Answering	—Unverified
Overinformative Question Answering by Humans and Machines	May 11, 2023	Question Answering	—Unverified
Think Twice: Measuring the Efficiency of Eliminating Prediction Shortcuts of Question Answering Models	May 11, 2023	Question Answering	CodeCode Available
Long-Tailed Question Answering in an Open World	May 11, 2023	Knowledge DistillationLanguage Modelling	—Unverified
Multi-hop Commonsense Knowledge Injection Framework for Zero-Shot Commonsense Question Answering	May 10, 2023	Contrastive LearningKnowledge Graphs	—Unverified
Are ChatGPT and GPT-4 General-Purpose Solvers for Financial Text Analytics? A Study on Several Typical Tasks	May 10, 2023	Binary Classificationnamed-entity-recognition	—Unverified
A Glimpse in ChatGPT Capabilities and its impact for AI research	May 10, 2023	Question AnsweringText Generation	—Unverified
Unsupervised Dense Retrieval Training with Web Anchors	May 10, 2023	Contrastive LearningQuestion Answering	CodeCode Available
Say What You Mean! Large Language Models Speak Too Positively about Negative Commonsense Knowledge	May 10, 2023	Language ModelingLanguage Modelling	CodeCode Available
MAUPQA: Massive Automatically-created Polish Question Answering Dataset	May 9, 2023	Open-Domain Question AnsweringPassage Retrieval	—Unverified
Large Language Models Need Holistically Thought in Medical Conversational QA	May 9, 2023	Conversational Question AnsweringQuestion Answering	CodeCode Available
Large Language Model Programs	May 9, 2023	Language ModelingLanguage Modelling	—Unverified
Event Knowledge Incorporation with Posterior Regularization for Event-Centric Question Answering	May 8, 2023	Language ModellingQuestion Answering	CodeCode Available
SkillQG: Learning to Generate Question for Reading Comprehension Assessment	May 8, 2023	Machine Reading ComprehensionQuestion Answering	—Unverified
A Frustratingly Easy Improvement for Position Embeddings via Random Padding	May 8, 2023	Extractive Question-AnsweringPosition	—Unverified
Knowledge-enhanced Agents for Interactive Text Games	May 8, 2023	Instruction FollowingKnowledge Graphs	—Unverified
FACTIFY-5WQA: 5W Aspect-based Fact Verification through Question Answering	May 7, 2023	Fact CheckingFact Verification	—Unverified

Show:10 25 50

← PrevPage 225 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified