Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4701–4750 of 10817 papers

Title	Date	Tasks	Status	Hype
Does Synthetic Data Generation of LLMs Help Clinical Text Mining?	Mar 8, 2023	Code Generationnamed-entity-recognition	—Unverified	0
Exploring the Feasibility of ChatGPT for Event Extraction	Mar 7, 2023	Event ExtractionMachine Translation	—Unverified	0
Graph Neural Networks in Vision-Language Image Understanding: A Survey	Mar 7, 2023	Image CaptioningImage Retrieval	—Unverified	0
PaLM-E: An Embodied Multimodal Language Model	Mar 6, 2023	Language ModelingLanguage Modelling	CodeCode Available	2
Video Question Answering Using CLIP-Guided Visual-Text Attention	Mar 6, 2023	General KnowledgeQuestion Answering	—Unverified	0
AmQA: Amharic Question Answering Dataset	Mar 6, 2023	ArticlesQuestion Answering	—Unverified	0
Knowledge-Based Counterfactual Queries for Visual Question Answering	Mar 5, 2023	counterfactualDecision Making	—Unverified	0
VTQA: Visual Text Question Answering via Entity Alignment and Cross-Media Reasoning	Mar 5, 2023	Answer GenerationEntity Alignment	CodeCode Available	0
Structure Pretraining and Prompt Tuning for Knowledge Graph Transfer	Mar 3, 2023	image-classificationImage Classification	CodeCode Available	1
Domain Specific Question Answering Over Knowledge Graphs Using Logical Programming and Large Language Models	Mar 3, 2023	Knowledge GraphsLogical Reasoning	CodeCode Available	1
Discovery and Recognition of Formula Concepts using Machine Learning	Mar 3, 2023	Information RetrievalQuestion Answering	CodeCode Available	0
Prophet: Prompting Large Language Models with Complementary Answer Heuristics for Knowledge-based Visual Question Answering	Mar 3, 2023	Language ModellingLarge Language Model	CodeCode Available	2
QAID: Question Answering Inspired Few-shot Intent Detection	Mar 2, 2023	Intent DetectionQuestion Answering	—Unverified	0
ConTEXTual Net: A Multimodal Vision-Language Model for Segmentation of Pneumothorax	Mar 2, 2023	DescriptiveImage Captioning	CodeCode Available	1
WiCE: Real-World Entailment for Claims in Wikipedia	Mar 2, 2023	Fact CheckingNatural Language Inference	CodeCode Available	1
Can BERT Refrain from Forgetting on Sequential Tasks? A Probing Study	Mar 2, 2023	Extractive Question-AnsweringIncremental Learning	CodeCode Available	0
MixPHM: Redundancy-Aware Parameter-Efficient Tuning for Low-Resource Visual Question Answering	Mar 2, 2023	Mixture-of-ExpertsQuestion Answering	CodeCode Available	1
BiomedCLIP: a multimodal biomedical foundation model pretrained from fifteen million scientific image-text pairs	Mar 2, 2023	ArticlesMedical Visual Question Answering	CodeCode Available	1
RAMM: Retrieval-augmented Biomedical Visual Question Answering with Multi-modal Pre-training	Mar 1, 2023	Question AnsweringRetrieval	CodeCode Available	1
Almanac: Retrieval-Augmented Language Models for Clinical Medicine	Mar 1, 2023	Decision MakingDialogue Generation	—Unverified	0
A Universal Question-Answering Platform for Knowledge Graphs	Mar 1, 2023	Knowledge Base Question AnsweringKnowledge Graphs	CodeCode Available	1
VQA with Cascade of Self- and Co-Attention Blocks	Feb 28, 2023	Question AnsweringVisual Question Answering	—Unverified	0
OEKG: The Open Event Knowledge Graph	Feb 28, 2023	ArticlesImage Retrieval	—Unverified	0
Language Is Not All You Need: Aligning Perception with Language Models	Feb 27, 2023	AllImage Captioning	—Unverified	0
Make Every Example Count: On the Stability and Utility of Self-Influence for Learning from Noisy NLP Datasets	Feb 27, 2023	DiversityMachine Translation	—Unverified	0
LLaMA: Open and Efficient Foundation Language Models	Feb 27, 2023	Arithmetic ReasoningCode Generation	CodeCode Available	7
Contrastive Video Question Answering via Video Graph Transformer	Feb 27, 2023	Contrastive LearningQuestion Answering	CodeCode Available	1
CLICKER: Attention-Based Cross-Lingual Commonsense Knowledge Transfer	Feb 26, 2023	Question AnsweringTransfer Learning	—Unverified	0
Cross-Lingual Question Answering over Knowledge Base as Reading Comprehension	Feb 26, 2023	Cross-Lingual Question AnsweringMachine Reading Comprehension	CodeCode Available	0
Bayesian Networks for Named Entity Prediction in Programming Community Question Answering	Feb 26, 2023	Community Question AnsweringQuestion Answering	—Unverified	0
Navigating the Grey Area: How Expressions of Uncertainty and Overconfidence Affect Language Models	Feb 26, 2023	Decision MakingQuestion Answering	—Unverified	0
Choice Fusion as Knowledge for Zero-Shot Dialogue State Tracking	Feb 25, 2023	DecoderDialogue State Tracking	CodeCode Available	0
Medical visual question answering using joint self-supervised learning	Feb 25, 2023	DecoderDiversity	—Unverified	0
Check Your Facts and Try Again: Improving Large Language Models with External Knowledge and Automated Feedback	Feb 24, 2023	InformativenessOpen-Domain Question Answering	—Unverified	0
CARE: Collaborative AI-Assisted Reading Environment	Feb 24, 2023	Question Answeringtext-classification	CodeCode Available	1
Time-aware Multiway Adaptive Fusion Network for Temporal Knowledge Graph Question Answering	Feb 24, 2023	Graph Question AnsweringKnowledge Graphs	—Unverified	0
Extracting Victim Counts from Text	Feb 23, 2023	Dependency ParsingHumanitarian	CodeCode Available	0
Dr ChatGPT, tell me what I want to hear: How prompt knowledge impacts health answer correctness	Feb 23, 2023	Question Answering	—Unverified	0
Testing AI on language comprehension tasks reveals insensitivity to underlying meaning	Feb 23, 2023	Question Answering	—Unverified	0
FiTs: Fine-grained Two-stage Training for Knowledge-aware Question Answering	Feb 23, 2023	Knowledge GraphsMedical Question Answering	CodeCode Available	1
Can Pre-trained Vision and Language Models Answer Visual Information-Seeking Questions?	Feb 23, 2023	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	1
EVJVQA Challenge: Multilingual Visual Question Answering	Feb 23, 2023	Language ModelingLanguage Modelling	—Unverified	0
MFBE: Leveraging Multi-Field Information of FAQs for Efficient Dense Retrieval	Feb 23, 2023	Question AnsweringRetrieval	CodeCode Available	0
VinVL+L: Enriching Visual Representation with Location Context in VQA	Feb 22, 2023	Question AnsweringTAG	CodeCode Available	0
Construction of Knowledge Graphs: State and Challenges	Feb 22, 2023	Knowledge GraphsManagement	—Unverified	0
Connecting Vision and Language with Video Localized Narratives	Feb 22, 2023	Question AnsweringVideo Narrative Grounding	CodeCode Available	1
ChatGPT: Jack of all trades, master of none	Feb 21, 2023	AllChatbot	CodeCode Available	1
Real-World Deployment and Evaluation of Kwame for Science, An AI Teaching Assistant for Science Education in West Africa	Feb 21, 2023	Question Answering	—Unverified	0
Hyena Hierarchy: Towards Larger Convolutional Language Models	Feb 21, 2023	2k8k	CodeCode Available	2
Reusable Slotwise Mechanisms	Feb 21, 2023	Future predictionObject	—Unverified	0

Show:10 25 50

← PrevPage 95 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified