Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5426–5450 of 10817 papers

Title	Date	Tasks	Status
Image Semantic Relation Generation	Oct 19, 2022	Image RetrievalImage Segmentation	—Unverified
Cooperative Self-training of Machine Reading Comprehension	Jan 16, 2022	Extractive Question-AnsweringMachine Reading Comprehension	—Unverified
Large Language Models are Null-Shot Learners	Jan 16, 2024	Arithmetic ReasoningBenchmarking	—Unverified
Cooperative Reasoning on Knowledge Graph and Corpus: A Multi-agentReinforcement Learning Approach	Dec 4, 2019	Question Answering	—Unverified
Image Position Prediction in Multimodal Documents	May 1, 2020	ArticlesCaption Generation	—Unverified
A topic-aware graph neural network model for knowledge base updating	Aug 31, 2022	AttributeGraph Neural Network	—Unverified
Detours for Navigating Instructional Videos	Jan 3, 2024	16kQuestion Answering	—Unverified
Analysis of the Reasoning with Redundant Information Provided Ability of Large Language Models	Oct 6, 2023	8kMath	—Unverified
Large Language Models Can Self-Correct with Key Condition Verification	May 23, 2024	Arithmetic ReasoningMath	—Unverified
Large Language Models Can Self-Improve	Oct 20, 2022	Arithmetic ReasoningCommon Sense Reasoning	—Unverified
Learning What Makes a Difference from Counterfactual Examples and Gradient Supervision	Apr 20, 2020	counterfactualimage-classification	—Unverified
Image Manipulation via Multi-Hop Instructions -- A New Dataset and Weakly-Supervised Neuro-Symbolic Approach	May 23, 2023	Image ManipulationQuestion Answering	—Unverified
Large Language Models for Judicial Entity Extraction: A Comparative Study	Jul 8, 2024	Information RetrievalLanguage Modeling	—Unverified
A Deep Learning Approach for Expert Identification in Question Answering Communities	Nov 14, 2017	Deep LearningQuestion Answering	—Unverified
Image Captioning with Compositional Neural Module Networks	Jul 10, 2020	Image CaptioningQuestion Answering	—Unverified
Large Language Models for Social Networks: Applications, Challenges, and Solutions	Jan 4, 2024	Question Answering	—Unverified
Cooperative Denoising for Distantly Supervised Relation Extraction	Aug 1, 2018	DenoisingInformation Retrieval	—Unverified
A tool suite for creating question answering benchmarks	May 1, 2014	Question AnsweringRetrieval	—Unverified
Image Captioning and Visual Question Answering Based on Attributes and External Knowledge	Mar 9, 2016	General KnowledgeImage Captioning	—Unverified
Image as a Foreign Language: BEiT Pretraining for Vision and Vision-Language Tasks	Jan 1, 2023	Cross-Modal RetrievalImage Captioning	—Unverified
Development of Hybrid Algorithm for Automatic Extraction of Multiword Expressions from Monolingual and Parallel Corpus of English and Punjabi	Dec 1, 2020	Information RetrievalMachine Translation	—Unverified
COOL, a Context Outlooker, and its Application to Question Answering and other Natural Language Processing Tasks	Apr 1, 2022	Question Answering	—Unverified
CLIPPO: Image-and-Language Understanding from Pixels Only	Dec 15, 2022	Contrastive Learningimage-classification	—Unverified
Cooking with Semantics	Jun 1, 2014	Question AnsweringSemantic Parsing	—Unverified
Analysis of Temporal Expressions Annotated in Clinical Notes	Apr 1, 2015	Information RetrievalKnowledge Base Population	—Unverified

Show:10 25 50

← PrevPage 218 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified