Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4251–4275 of 10817 papers

Title	Date	Tasks	Status	Hype
COSA: Concatenated Sample Pretrained Vision-Language Foundation Model	Jun 15, 2023	Formmodel	CodeCode Available	1
Neural models for Factual Inconsistency Classification with Explanations	Jun 15, 2023	8kClassification	CodeCode Available	0
Towards Benchmarking and Improving the Temporal Reasoning Capability of Large Language Models	Jun 15, 2023	BenchmarkingQuestion Answering	CodeCode Available	1
Improving Selective Visual Question Answering by Learning from Your Peers	Jun 14, 2023	Question AnsweringVisual Question Answering	CodeCode Available	1
Scalable Neural-Probabilistic Answer Set Programming	Jun 14, 2023	Probabilistic ProgrammingQuestion Answering	CodeCode Available	1
Unifying Large Language Models and Knowledge Graphs: A Roadmap	Jun 14, 2023	Knowledge GraphsQuestion Answering	—Unverified	0
Visual Question Answering (VQA) on Images with Superimposed Text	Jun 13, 2023	Question AnsweringVisual Question Answering	—Unverified	0
AVIS: Autonomous Visual Information Seeking with Large Language Model Agent	Jun 13, 2023	Decision MakingLanguage Modeling	—Unverified	0
Safeguarding Data in Multimodal AI: A Differentially Private Approach to CLIP Training	Jun 13, 2023	image-classificationImage Classification	CodeCode Available	0
Soft Language Clustering for Multilingual Model Pre-training	Jun 13, 2023	ClusteringCross-Lingual Transfer	—Unverified	0
Question Decomposition Tree for Answering Complex Questions over Knowledge Bases	Jun 13, 2023	Knowledge Base Question AnsweringQuestion Answering	CodeCode Available	1
Improving Opinion-based Question Answering Systems Through Label Error Detection and Overwrite	Jun 13, 2023	Label Error DetectionMachine Reading Comprehension	—Unverified	0
WebGLM: Towards An Efficient Web-Enhanced Question Answering System with Human Preferences	Jun 13, 2023	Language ModelingLanguage Modelling	CodeCode Available	3
h2oGPT: Democratizing Large Language Models	Jun 13, 2023	ChatbotFairness	CodeCode Available	6
A Practical Entity Linking System for Tables in Scientific Literature	Jun 12, 2023	Entity LinkingKnowledge Graphs	—Unverified	0
History Semantic Graph Enhanced Conversational KBQA with Temporal Information Modeling	Jun 12, 2023	Question Answering	—Unverified	0
The Effect of Masking Strategies on Knowledge Retention by Language Models	Jun 12, 2023	Information RetrievalQuestion Answering	CodeCode Available	0
A Survey of Vision-Language Pre-training from the Lens of Multimodal Machine Translation	Jun 12, 2023	Image CaptioningMachine Translation	—Unverified	0
When Do Annotator Demographics Matter? Measuring the Influence of Annotator Demographics with the POPQUORN Dataset	Jun 12, 2023	Question Answering	CodeCode Available	1
Global and Local Semantic Completion Learning for Vision-Language Pre-training	Jun 12, 2023	cross-modal alignmentImage-text Retrieval	CodeCode Available	1
Multi-Source Test-Time Adaptation as Dueling Bandits for Extractive Question Answering	Jun 11, 2023	Decision MakingExtractive Question-Answering	CodeCode Available	0
Multi-modal Pre-training for Medical Vision-language Understanding and Generation: An Empirical Study with A New Benchmark	Jun 10, 2023	Image-text RetrievalMedical Report Generation	CodeCode Available	1
Towards the Exploitation of LLM-based Chatbot for Providing Legal Support to Palestinian Cooperatives	Jun 9, 2023	ChatbotQuestion Answering	—Unverified	0
Leveraging Large Language Models for Scalable Vector Graphics-Driven Image Understanding	Jun 9, 2023	Few-Shot Learningimage-classification	CodeCode Available	0
Privacy Aware Question-Answering System for Online Mental Health Risk Assessment	Jun 9, 2023	DiagnosticQuestion Answering	—Unverified	0

Show:10 25 50

← PrevPage 171 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified