Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4726–4750 of 10817 papers

Title	Date	Tasks	Status	Hype
LLaMA: Open and Efficient Foundation Language Models	Feb 27, 2023	Arithmetic ReasoningCode Generation	CodeCode Available	7
Contrastive Video Question Answering via Video Graph Transformer	Feb 27, 2023	Contrastive LearningQuestion Answering	CodeCode Available	1
CLICKER: Attention-Based Cross-Lingual Commonsense Knowledge Transfer	Feb 26, 2023	Question AnsweringTransfer Learning	—Unverified	0
Cross-Lingual Question Answering over Knowledge Base as Reading Comprehension	Feb 26, 2023	Cross-Lingual Question AnsweringMachine Reading Comprehension	CodeCode Available	0
Bayesian Networks for Named Entity Prediction in Programming Community Question Answering	Feb 26, 2023	Community Question AnsweringQuestion Answering	—Unverified	0
Navigating the Grey Area: How Expressions of Uncertainty and Overconfidence Affect Language Models	Feb 26, 2023	Decision MakingQuestion Answering	—Unverified	0
Choice Fusion as Knowledge for Zero-Shot Dialogue State Tracking	Feb 25, 2023	DecoderDialogue State Tracking	CodeCode Available	0
Medical visual question answering using joint self-supervised learning	Feb 25, 2023	DecoderDiversity	—Unverified	0
Check Your Facts and Try Again: Improving Large Language Models with External Knowledge and Automated Feedback	Feb 24, 2023	InformativenessOpen-Domain Question Answering	—Unverified	0
CARE: Collaborative AI-Assisted Reading Environment	Feb 24, 2023	Question Answeringtext-classification	CodeCode Available	1
Time-aware Multiway Adaptive Fusion Network for Temporal Knowledge Graph Question Answering	Feb 24, 2023	Graph Question AnsweringKnowledge Graphs	—Unverified	0
Extracting Victim Counts from Text	Feb 23, 2023	Dependency ParsingHumanitarian	CodeCode Available	0
Dr ChatGPT, tell me what I want to hear: How prompt knowledge impacts health answer correctness	Feb 23, 2023	Question Answering	—Unverified	0
Testing AI on language comprehension tasks reveals insensitivity to underlying meaning	Feb 23, 2023	Question Answering	—Unverified	0
FiTs: Fine-grained Two-stage Training for Knowledge-aware Question Answering	Feb 23, 2023	Knowledge GraphsMedical Question Answering	CodeCode Available	1
Can Pre-trained Vision and Language Models Answer Visual Information-Seeking Questions?	Feb 23, 2023	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	1
EVJVQA Challenge: Multilingual Visual Question Answering	Feb 23, 2023	Language ModelingLanguage Modelling	—Unverified	0
MFBE: Leveraging Multi-Field Information of FAQs for Efficient Dense Retrieval	Feb 23, 2023	Question AnsweringRetrieval	CodeCode Available	0
VinVL+L: Enriching Visual Representation with Location Context in VQA	Feb 22, 2023	Question AnsweringTAG	CodeCode Available	0
Construction of Knowledge Graphs: State and Challenges	Feb 22, 2023	Knowledge GraphsManagement	—Unverified	0
Connecting Vision and Language with Video Localized Narratives	Feb 22, 2023	Question AnsweringVideo Narrative Grounding	CodeCode Available	1
ChatGPT: Jack of all trades, master of none	Feb 21, 2023	AllChatbot	CodeCode Available	1
Real-World Deployment and Evaluation of Kwame for Science, An AI Teaching Assistant for Science Education in West Africa	Feb 21, 2023	Question Answering	—Unverified	0
Hyena Hierarchy: Towards Larger Convolutional Language Models	Feb 21, 2023	2k8k	CodeCode Available	2
Reusable Slotwise Mechanisms	Feb 21, 2023	Future predictionObject	—Unverified	0

Show:10 25 50

← PrevPage 190 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified