Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5151–5200 of 10817 papers

Title	Date	Tasks	Status	Hype
Towards Robust Visual Question Answering: Making the Most of Biased Samples via Contrastive Learning	Oct 10, 2022	Contrastive LearningQuestion Answering	CodeCode Available	1
Multi-Modal Fusion Transformer for Visual Question Answering in Remote Sensing	Oct 10, 2022	Question AnsweringRepresentation Learning	—Unverified	0
MAMO: Masked Multimodal Modeling for Fine-Grained Vision-Language Representation Learning	Oct 9, 2022	Image-text Retrievalmultimodal interaction	—Unverified	0
Understanding and Improving Zero-shot Multi-hop Reasoning in Generative Question Answering	Oct 9, 2022	Generative Question AnsweringQuestion Answering	—Unverified	0
Contrastive Representation Learning for Conversational Question Answering over Knowledge Graphs	Oct 9, 2022	Conversational Question AnsweringInformation Retrieval	CodeCode Available	0
Enhanced vectors for top-k document retrieval in Question Answering	Oct 8, 2022	Information RetrievalQuestion Answering	—Unverified	0
Generative Language Models for Paragraph-Level Question Generation	Oct 8, 2022	Question AnsweringQuestion Generation	—Unverified	0
Learning Fine-Grained Visual Understanding for Video Question Answering via Decoupling Spatial-Temporal Modeling	Oct 8, 2022	Language ModelingLanguage Modelling	CodeCode Available	1
EgoTaskQA: Understanding Human Tasks in Egocentric Videos	Oct 8, 2022	Action Localizationcounterfactual	CodeCode Available	1
KG-MTT-BERT: Knowledge Graph Enhanced BERT for Multi-Type Medical Text Classification	Oct 8, 2022	ClassificationQuestion Answering	—Unverified	0
Retrieval Augmented Visual Question Answering with Outside Knowledge	Oct 7, 2022	Answer GenerationDiagnostic	CodeCode Available	2
ConvFinQA: Exploring the Chain of Numerical Reasoning in Conversational Finance Question Answering	Oct 7, 2022	Conversational Question AnsweringQuestion Answering	CodeCode Available	1
Calibrating Factual Knowledge in Pretrained Language Models	Oct 7, 2022	Knowledge ProbingQuestion Answering	CodeCode Available	1
Measuring and Narrowing the Compositionality Gap in Language Models	Oct 7, 2022	Question Answering	CodeCode Available	2
Automatic Chain of Thought Prompting in Large Language Models	Oct 7, 2022	DiversityQuestion Answering	CodeCode Available	6
A Unified Encoder-Decoder Framework with Entity Memory	Oct 7, 2022	DecoderQuestion Answering	CodeCode Available	1
ReAct: Synergizing Reasoning and Acting in Language Models	Oct 6, 2022	Decision MakingFact Verification	CodeCode Available	4
Just ClozE! A Novel Framework for Evaluating the Factual Consistency Faster in Abstractive Summarization	Oct 6, 2022	Abstractive Text SummarizationLanguage Modelling	CodeCode Available	0
Rainier: Reinforced Knowledge Introspector for Commonsense Question Answering	Oct 6, 2022	Question AnsweringReinforcement Learning (RL)	CodeCode Available	1
MuRAG: Multimodal Retrieval-Augmented Generator for Open Question Answering over Images and Text	Oct 6, 2022	Open-Ended Question AnsweringQuestion Answering	—Unverified	0
Improving the Domain Adaptation of Retrieval Augmented Generation (RAG) Models for Open Domain Question Answering	Oct 6, 2022	Domain AdaptationInformation Retrieval	—Unverified	0
Guess the Instruction! Flipped Learning Makes Language Models Stronger Zero-Shot Learners	Oct 6, 2022	Common Sense ReasoningCoreference Resolution	CodeCode Available	1
Grape: Knowledge Graph Enhanced Passage Reader for Open-domain Question Answering	Oct 6, 2022	Entity EmbeddingsGraph Neural Network	CodeCode Available	1
APGKT: Exploiting Associative Path on Skills Graph for Knowledge Tracing	Oct 5, 2022	Knowledge TracingQuestion Answering	—Unverified	0
Ask Me Anything: A simple strategy for prompting language models	Oct 5, 2022	Coreference ResolutionNatural Language Inference	CodeCode Available	2
Emotion Twenty Questions Dialog System for Lexical Emotional Intelligence	Oct 5, 2022	Emotional IntelligenceQuestion Answering	CodeCode Available	0
Honest Students from Untrusted Teachers: Learning an Interpretable Question-Answering Pipeline from a Pretrained Language Model	Oct 5, 2022	In-Context LearningLanguage Modeling	—Unverified	0
Locate before Answering: Answer Guided Question Localization for Video Question Answering	Oct 5, 2022	Question AnsweringVideo Question Answering	—Unverified	0
Large Language Models are Pretty Good Zero-Shot Video Game Bug Detectors	Oct 5, 2022	Common Sense ReasoningLanguage Modelling	CodeCode Available	1
Towards Improving Faithfulness in Abstractive Summarization	Oct 4, 2022	Abstractive Text SummarizationDecoder	CodeCode Available	1
Detect, Retrieve, Comprehend: A Flexible Framework for Zero-Shot Document-Level Question Answering	Oct 4, 2022	Question AnsweringRetrieval	—Unverified	0
Mintaka: A Complex, Natural, and Multilingual Dataset for End-to-End Question Answering	Oct 4, 2022	Question Answering	CodeCode Available	1
Mining Duplicate Questions of Stack Overflow	Oct 4, 2022	Community Question AnsweringQuestion Answering	—Unverified	0
Recitation-Augmented Language Models	Oct 4, 2022	Natural QuestionsQuestion Answering	CodeCode Available	1
Transformer-based Subject Entity Detection in Wikipedia Listings	Oct 4, 2022	Knowledge GraphsQuestion Answering	—Unverified	0
When to Make Exceptions: Exploring Language Models as Accounts of Human Moral Judgment	Oct 4, 2022	Language ModellingLarge Language Model	CodeCode Available	1
Russian Web Tables: A Public Corpus of Web Tables for Russian Language Based on Wikipedia	Oct 3, 2022	Knowledge Base ConstructionManagement	CodeCode Available	0
Extending Compositional Attention Networks for Social Reasoning in Videos	Oct 3, 2022	Question AnsweringVideo Question Answering	CodeCode Available	0
Understanding Prior Bias and Choice Paralysis in Transformer-based Language Representation Models through Four Experimental Probes	Oct 3, 2022	Decision MakingMultiple-choice	—Unverified	0
Language Models Are Greedy Reasoners: A Systematic Formal Analysis of Chain-of-Thought	Oct 3, 2022	Mathematical ReasoningQuestion Answering	CodeCode Available	3
How Relevant is Selective Memory Population in Lifelong Language Learning?	Oct 3, 2022	Lifelong learningQuestion Answering	—Unverified	0
Findings of the VarDial Evaluation Campaign 2022	Oct 1, 2022	Dialect IdentificationExtractive Question-Answering	CodeCode Available	0
On the Effects of Video Grounding on Language Models	Oct 1, 2022	Image CaptioningQuestion Answering	—Unverified	0
Evaluating Coreference Resolvers on Community-based Question Answering: From Rule-based to State of the Art	Oct 1, 2022	Answer Selectioncoreference-resolution	CodeCode Available	0
HaleLab_NITK@SMM4H’22: Adaptive Learning Model for Effective Detection, Extraction and Normalization of Adverse Drug Events from Social Media Data	Oct 1, 2022	Question Answering	CodeCode Available	0
CMQA: A Dataset of Conditional Question Answering with Multiple-Span Answers	Oct 1, 2022	Question Answering	CodeCode Available	0
Focus on FoCus: Is FoCus focused on Context, Knowledge and Persona?	Oct 1, 2022	Dialogue GenerationQuestion Answering	—Unverified	0
ArT: All-round Thinker for Unsupervised Commonsense Question Answering	Oct 1, 2022	AllQuestion Answering	CodeCode Available	0
Aligning Multilingual Embeddings for Improved Code-switched Natural Language Understanding	Oct 1, 2022	named-entity-recognitionNamed Entity Recognition	CodeCode Available	0
Are Visual-Linguistic Models Commonsense Knowledge Bases?	Oct 1, 2022	Natural Language UnderstandingQuestion Answering	CodeCode Available	0

Show:10 25 50

← PrevPage 104 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified