Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4651–4700 of 10817 papers

Title	Date	Tasks	Status	Hype
DERA: Enhancing Large Language Model Completions with Dialog-Enabled Resolving Agents	Mar 30, 2023	Conversation SummarizationLanguage Modeling	—Unverified	0
A Study of Autoregressive Decoders for Multi-Tasking in Computer Vision	Mar 30, 2023	DecoderMulti-Task Learning	—Unverified	0
MaMMUT: A Simple Architecture for Joint Learning for MultiModal Tasks	Mar 29, 2023	Cross-Modal RetrievalDecoder	CodeCode Available	0
Comparative Analysis of CHATGPT and the evolution of language models	Mar 28, 2023	Machine TranslationQuestion Answering	—Unverified	0
Structured Video-Language Modeling with Temporal Grouping and Spatial Grounding	Mar 28, 2023	Action LocalizationAction Recognition	—Unverified	0
Explicit Planning Helps Language Models in Logical Reasoning	Mar 28, 2023	Logical ReasoningMultiple-choice	CodeCode Available	1
ChatGPT as a Factual Inconsistency Evaluator for Text Summarization	Mar 27, 2023	Abstractive Text SummarizationNatural Language Inference	—Unverified	0
Curriculum Learning for Compositional Visual Reasoning	Mar 27, 2023	Question AnsweringVisual Question Answering	—Unverified	0
MGTBench: Benchmarking Machine-Generated Text Detection	Mar 26, 2023	BenchmarkingQuestion Answering	CodeCode Available	1
Natural Language Reasoning, A Survey	Mar 26, 2023	Logical ReasoningMathematical Reasoning	CodeCode Available	1
Video-Text as Game Players: Hierarchical Banzhaf Interaction for Cross-Modal Representation Learning	Mar 25, 2023	Contrastive LearningQuestion Answering	CodeCode Available	1
Error Analysis Prompting Enables Human-Like Translation Evaluation in Large Language Models	Mar 24, 2023	Machine TranslationNatural Language Understanding	CodeCode Available	1
Mordecai 3: A Neural Geoparser and Event Geocoder	Mar 23, 2023	Question AnsweringToponym Resolution	CodeCode Available	1
MELTR: Meta Loss Transformer for Learning to Fine-tune Video Foundation Models	Mar 23, 2023	Auxiliary LearningMultimodal Sentiment Analysis	CodeCode Available	1
DBLP-QuAD: A Question Answering Dataset over the DBLP Scholarly Knowledge Graph	Mar 23, 2023	Question Answering	CodeCode Available	0
NS3D: Neuro-Symbolic Grounding of 3D Objects and Relations	Mar 23, 2023	Question AnsweringReferring Expression	CodeCode Available	1
GETT-QA: Graph Embedding based T2T Transformer for Knowledge Graph Question Answering	Mar 23, 2023	Graph EmbeddingGraph Question Answering	CodeCode Available	0
Salient Span Masking for Temporal Understanding	Mar 22, 2023	AvgLanguage Modeling	—Unverified	0
Integrating Image Features with Convolutional Sequence-to-sequence Network for Multilingual Visual Question Answering	Mar 22, 2023	Question AnsweringVisual Question Answering	CodeCode Available	0
GrapeQA: GRaph Augmentation and Pruning to Enhance Question-Answering	Mar 22, 2023	Common Sense ReasoningKnowledge Graphs	—Unverified	0
Explainable Semantic Communication for Text Tasks	Mar 22, 2023	Question AnsweringSemantic Communication	—Unverified	0
TIFA: Accurate and Interpretable Text-to-Image Faithfulness Evaluation with Question Answering	Mar 21, 2023	4kImage Generation	CodeCode Available	1
On-the-fly Text Retrieval for End-to-End ASR Adaptation	Mar 20, 2023	Language ModelingLanguage Modelling	—Unverified	0
PanGu-Σ: Towards Trillion Parameter Language Model with Sparse Heterogeneous Computing	Mar 20, 2023	Code GenerationLanguage Modeling	—Unverified	0
3D Concept Learning and Reasoning from Multi-View Images	Mar 20, 2023	Question AnsweringVisual Question Answering	—Unverified	0
Location-Free Scene Graph Generation	Mar 20, 2023	Graph GenerationImage Retrieval	CodeCode Available	1
COVID-19 event extraction from Twitter via extractive question answering with continuous prompts	Mar 19, 2023	BenchmarkingEvent Extraction	CodeCode Available	1
FVQA 2.0: Introducing Adversarial Samples into Fact-based Visual Question Answering	Mar 19, 2023	Common Sense ReasoningInformation Retrieval	—Unverified	0
An Empirical Study of Pre-trained Language Models in Simple Knowledge Graph Question Answering	Mar 18, 2023	Graph Question AnsweringKnowledge Distillation	CodeCode Available	0
AdaLoRA: Adaptive Budget Allocation for Parameter-Efficient Fine-Tuning	Mar 18, 2023	parameter-efficient fine-tuningQuestion Answering	CodeCode Available	1
A Graph-Guided Reasoning Approach for Open-ended Commonsense Question Answering	Mar 18, 2023	Multiple-choiceQuestion Answering	—Unverified	0
Can AI-Generated Text be Reliably Detected?	Mar 17, 2023	Language ModellingLarge Language Model	CodeCode Available	1
Generate, Transform, Answer: Question Specific Tool Synthesis for Tabular Data	Mar 17, 2023	Question Answering	—Unverified	0
Secret-Keeping in Question Answering	Mar 16, 2023	Question Answering	—Unverified	0
Logical Implications for Visual Question Answering Consistency	Mar 16, 2023	Language ModelingLanguage Modelling	CodeCode Available	0
GPT-4 Technical Report	Mar 15, 2023	answerability predictionArithmetic Reasoning	CodeCode Available	6
Can ChatGPT Replace Traditional KBQA Models? An In-depth Analysis of the Question Answering Performance of the GPT LLM Family	Mar 14, 2023	Knowledge Base Question AnsweringLanguage Modeling	CodeCode Available	1
Polar-VQA: Visual Question Answering on Remote Sensed Ice sheet Imagery from Polar Region	Mar 13, 2023	Question AnsweringVisual Question Answering	—Unverified	0
Breaking Common Sense: WHOOPS! A Vision-and-Language Benchmark of Synthetic and Compositional Images	Mar 13, 2023	Common Sense ReasoningExplanation Generation	—Unverified	0
Generating multiple-choice questions for medical question answering with distractors and cue-masking	Mar 13, 2023	Language ModelingLanguage Modelling	—Unverified	0
Vision-Language Models as Success Detectors	Mar 13, 2023	Question AnsweringVisual Question Answering	—Unverified	0
ChatGPT Asks, BLIP-2 Answers: Automatic Questioning Towards Enriched Visual Descriptions	Mar 12, 2023	Image CaptioningQuestion Answering	CodeCode Available	2
LUKE-Graph: A Transformer-based Approach with Gated Relational Graph Attention for Cloze-style Reading Comprehension	Mar 12, 2023	Common Sense ReasoningGraph Attention	—Unverified	0
MuLTI: Efficient Video-and-Language Understanding with Text-Guided MultiWay-Sampler and Multiple Choice Modeling	Mar 10, 2023	Multi-Label ClassificationMUlTI-LABEL-ClASSIFICATION	—Unverified	0
Open-Ended Medical Visual Question Answering Through Prefix Tuning of Language Models	Mar 10, 2023	Language ModelingLanguage Modelling	CodeCode Available	1
Understanding and Constructing Latent Modality Structures in Multi-modal Representation Learning	Mar 10, 2023	Few-Shot Image Classificationimage-classification	—Unverified	0
Toward Unsupervised Realistic Visual Question Answering	Mar 9, 2023	Question AnsweringVisual Question Answering	—Unverified	0
Can a Frozen Pretrained Language Model be used for Zero-shot Neural Retrieval on Entity-centric Questions?	Mar 9, 2023	Domain GeneralizationLanguage Modeling	—Unverified	0
Comprehensive Event Representations using Event Knowledge Graphs and Natural Language Processing	Mar 8, 2023	Event ExtractionKnowledge Graph Completion	—Unverified	0
Does Synthetic Data Generation of LLMs Help Clinical Text Mining?	Mar 8, 2023	Code Generationnamed-entity-recognition	—Unverified	0

Show:10 25 50

← PrevPage 94 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified