Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5701–5750 of 10817 papers

Title	Date	Tasks	Status
MaMMUT: A Simple Architecture for Joint Learning for MultiModal Tasks	Mar 29, 2023	Cross-Modal RetrievalDecoder	CodeCode Available
Structured Video-Language Modeling with Temporal Grouping and Spatial Grounding	Mar 28, 2023	Action LocalizationAction Recognition	—Unverified
Comparative Analysis of CHATGPT and the evolution of language models	Mar 28, 2023	Machine TranslationQuestion Answering	—Unverified
ChatGPT as a Factual Inconsistency Evaluator for Text Summarization	Mar 27, 2023	Abstractive Text SummarizationNatural Language Inference	—Unverified
Curriculum Learning for Compositional Visual Reasoning	Mar 27, 2023	Question AnsweringVisual Question Answering	—Unverified
DBLP-QuAD: A Question Answering Dataset over the DBLP Scholarly Knowledge Graph	Mar 23, 2023	Question Answering	CodeCode Available
GETT-QA: Graph Embedding based T2T Transformer for Knowledge Graph Question Answering	Mar 23, 2023	Graph EmbeddingGraph Question Answering	CodeCode Available
Explainable Semantic Communication for Text Tasks	Mar 22, 2023	Question AnsweringSemantic Communication	—Unverified
Integrating Image Features with Convolutional Sequence-to-sequence Network for Multilingual Visual Question Answering	Mar 22, 2023	Question AnsweringVisual Question Answering	CodeCode Available
Salient Span Masking for Temporal Understanding	Mar 22, 2023	AvgLanguage Modeling	—Unverified
GrapeQA: GRaph Augmentation and Pruning to Enhance Question-Answering	Mar 22, 2023	Common Sense ReasoningKnowledge Graphs	—Unverified
PanGu-Σ: Towards Trillion Parameter Language Model with Sparse Heterogeneous Computing	Mar 20, 2023	Code GenerationLanguage Modeling	—Unverified
On-the-fly Text Retrieval for End-to-End ASR Adaptation	Mar 20, 2023	Language ModelingLanguage Modelling	—Unverified
3D Concept Learning and Reasoning from Multi-View Images	Mar 20, 2023	Question AnsweringVisual Question Answering	—Unverified
FVQA 2.0: Introducing Adversarial Samples into Fact-based Visual Question Answering	Mar 19, 2023	Common Sense ReasoningInformation Retrieval	—Unverified
A Graph-Guided Reasoning Approach for Open-ended Commonsense Question Answering	Mar 18, 2023	Multiple-choiceQuestion Answering	—Unverified
An Empirical Study of Pre-trained Language Models in Simple Knowledge Graph Question Answering	Mar 18, 2023	Graph Question AnsweringKnowledge Distillation	CodeCode Available
Generate, Transform, Answer: Question Specific Tool Synthesis for Tabular Data	Mar 17, 2023	Question Answering	—Unverified
Logical Implications for Visual Question Answering Consistency	Mar 16, 2023	Language ModelingLanguage Modelling	CodeCode Available
Secret-Keeping in Question Answering	Mar 16, 2023	Question Answering	—Unverified
Vision-Language Models as Success Detectors	Mar 13, 2023	Question AnsweringVisual Question Answering	—Unverified
Breaking Common Sense: WHOOPS! A Vision-and-Language Benchmark of Synthetic and Compositional Images	Mar 13, 2023	Common Sense ReasoningExplanation Generation	—Unverified
Polar-VQA: Visual Question Answering on Remote Sensed Ice sheet Imagery from Polar Region	Mar 13, 2023	Question AnsweringVisual Question Answering	—Unverified
Generating multiple-choice questions for medical question answering with distractors and cue-masking	Mar 13, 2023	Language ModelingLanguage Modelling	—Unverified
LUKE-Graph: A Transformer-based Approach with Gated Relational Graph Attention for Cloze-style Reading Comprehension	Mar 12, 2023	Common Sense ReasoningGraph Attention	—Unverified
MuLTI: Efficient Video-and-Language Understanding with Text-Guided MultiWay-Sampler and Multiple Choice Modeling	Mar 10, 2023	Multi-Label ClassificationMUlTI-LABEL-ClASSIFICATION	—Unverified
Understanding and Constructing Latent Modality Structures in Multi-modal Representation Learning	Mar 10, 2023	Few-Shot Image Classificationimage-classification	—Unverified
Can a Frozen Pretrained Language Model be used for Zero-shot Neural Retrieval on Entity-centric Questions?	Mar 9, 2023	Domain GeneralizationLanguage Modeling	—Unverified
Toward Unsupervised Realistic Visual Question Answering	Mar 9, 2023	Question AnsweringVisual Question Answering	—Unverified
Does Synthetic Data Generation of LLMs Help Clinical Text Mining?	Mar 8, 2023	Code Generationnamed-entity-recognition	—Unverified
Interpretable Visual Question Answering Referring to Outside Knowledge	Mar 8, 2023	DiversityImage Captioning	—Unverified
Comprehensive Event Representations using Event Knowledge Graphs and Natural Language Processing	Mar 8, 2023	Event ExtractionKnowledge Graph Completion	—Unverified
Exploring the Feasibility of ChatGPT for Event Extraction	Mar 7, 2023	Event ExtractionMachine Translation	—Unverified
Graph Neural Networks in Vision-Language Image Understanding: A Survey	Mar 7, 2023	Image CaptioningImage Retrieval	—Unverified
Video Question Answering Using CLIP-Guided Visual-Text Attention	Mar 6, 2023	General KnowledgeQuestion Answering	—Unverified
AmQA: Amharic Question Answering Dataset	Mar 6, 2023	ArticlesQuestion Answering	—Unverified
Knowledge-Based Counterfactual Queries for Visual Question Answering	Mar 5, 2023	counterfactualDecision Making	—Unverified
VTQA: Visual Text Question Answering via Entity Alignment and Cross-Media Reasoning	Mar 5, 2023	Answer GenerationEntity Alignment	CodeCode Available
Discovery and Recognition of Formula Concepts using Machine Learning	Mar 3, 2023	Information RetrievalQuestion Answering	CodeCode Available
Can BERT Refrain from Forgetting on Sequential Tasks? A Probing Study	Mar 2, 2023	Extractive Question-AnsweringIncremental Learning	CodeCode Available
QAID: Question Answering Inspired Few-shot Intent Detection	Mar 2, 2023	Intent DetectionQuestion Answering	—Unverified
Almanac: Retrieval-Augmented Language Models for Clinical Medicine	Mar 1, 2023	Decision MakingDialogue Generation	—Unverified
OEKG: The Open Event Knowledge Graph	Feb 28, 2023	ArticlesImage Retrieval	—Unverified
VQA with Cascade of Self- and Co-Attention Blocks	Feb 28, 2023	Question AnsweringVisual Question Answering	—Unverified
Make Every Example Count: On the Stability and Utility of Self-Influence for Learning from Noisy NLP Datasets	Feb 27, 2023	DiversityMachine Translation	—Unverified
Language Is Not All You Need: Aligning Perception with Language Models	Feb 27, 2023	AllImage Captioning	—Unverified
CLICKER: Attention-Based Cross-Lingual Commonsense Knowledge Transfer	Feb 26, 2023	Question AnsweringTransfer Learning	—Unverified
Navigating the Grey Area: How Expressions of Uncertainty and Overconfidence Affect Language Models	Feb 26, 2023	Decision MakingQuestion Answering	—Unverified
Bayesian Networks for Named Entity Prediction in Programming Community Question Answering	Feb 26, 2023	Community Question AnsweringQuestion Answering	—Unverified
Cross-Lingual Question Answering over Knowledge Base as Reading Comprehension	Feb 26, 2023	Cross-Lingual Question AnsweringMachine Reading Comprehension	CodeCode Available

Show:10 25 50

← PrevPage 115 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified