Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5651–5700 of 10817 papers

Title	Date	Tasks	Status
Atomic Fact Decomposition Helps Attributed Question Answering	Oct 22, 2024	Knowledge GraphsQuestion Answering	—Unverified
Analysis of Drug repurposing Knowledge graphs for Covid-19	Dec 7, 2022	Graph EmbeddingKnowledge Graph Embedding	—Unverified
Convolutional Neural Networks vs. Convolution Kernels: Feature Engineering for Answer Sentence Reranking	Jun 1, 2016	Feature EngineeringLearning-To-Rank	—Unverified
Logically Consistent Loss for Visual Question Answering	Nov 19, 2020	Multi-Task LearningQuestion Answering	—Unverified
IITP: Multiobjective Differential Evolution based Twitter Named Entity Recognition	Jul 1, 2015	Machine Translationnamed-entity-recognition	—Unverified
Learning to Rank Answer Candidates for Automatic Resolution of Crossword Puzzles	Jun 1, 2014	Learning-To-RankQuestion Answering	—Unverified
Distributed Deep Learning for Question Answering	Nov 3, 2015	Answer SelectionDeep Learning	—Unverified
IITP at MEDIQA 2019: Systems Report for Natural Language Inference, Question Entailment and Question Answering	Jun 14, 2019	Medical Question AnsweringNatural Language Inference	—Unverified
Convolutional Neural Networks for Aerial Multi-Label Pedestrian Detection	Jul 16, 2018	Action DetectionObject	—Unverified
Learning to Reason Over Time: Timeline Self-Reflection for Improved Temporal Reasoning in Language Models	Apr 7, 2025	Question AnsweringScheduling	—Unverified
Neural Reasoning, Fast and Slow, for Video Question Answering	Jul 10, 2019	Natural QuestionsQuestion Answering	—Unverified
Learning to Recognize the Unseen Visual Predicates	Sep 25, 2019	Question AnsweringVisual Question Answering	—Unverified
Logical Parsing from Natural Language Based on a Neural Translation Model	May 9, 2017	Question AnsweringSemantic Parsing	—Unverified
Learning to Rehearse in Long Sequence Memorization	Jun 2, 2021	MemorizationQuestion Answering	—Unverified
Ditch the Gold Standard: Re-evaluating Conversational Question Answering	Oct 16, 2021	Conversational Question AnsweringQuestion Answering	—Unverified
IIT-KGP at MEDIQA 2019: Recognizing Question Entailment using Sci-BERT stacked with a Gradient Boosting Classifier	Aug 1, 2019	Question AnsweringRetrieval	—Unverified
IISCNLP at SemEval-2016 Task 2: Interpretable STS with ILP based Multiple Chunk Aligner	Jun 1, 2016	Information RetrievalQuestion Answering	—Unverified
ATM: Action Temporality Modeling for Video Question Answering	Sep 5, 2023	Contrastive LearningOptical Flow Estimation	—Unverified
Diverse and Non-redundant Answer Set Extraction on Community QA based on DPPs	Nov 18, 2020	Point ProcessesQuestion Answering	—Unverified
Learning to Selectively Transfer: Reinforced Transfer Learning for Deep Text Matching	Dec 30, 2018	Information RetrievalNatural Language Inference	—Unverified
Learning to Select Question-Relevant Relations for Visual Question Answering	Jun 1, 2021	Graph AttentionQuestion Answering	—Unverified
Learning to Select the Relevant History Turns in Conversational Question Answering	Aug 4, 2023	Binary ClassificationConversational Question Answering	—Unverified
Benchmarks for Pirá 2.0, a Reading Comprehension Dataset about the Ocean, the Brazilian Coast, and Climate Change	Sep 19, 2023	Generative Question AnsweringInformation Retrieval	—Unverified
Learning to Solve Geometry Problems from Natural Language Demonstrations in Textbooks	Aug 1, 2017	Question Answering	—Unverified
Learning to Specialize with Knowledge Distillation for Visual Question Answering	Dec 1, 2018	General ClassificationGeneral Knowledge	—Unverified
Learning to Summarise Related Sentences	Aug 1, 2014	Question AnsweringSentence Compression	—Unverified
Learning to Summarize and Answer Questions about a Virtual Robot's Past Actions	Jun 16, 2023	Language ModelingLanguage Modelling	—Unverified
Learning to Temporally Order Medical Events in Clinical Text	Jul 1, 2012	Document SummarizationInformation Retrieval	—Unverified
Convolutional Interaction Network for Natural Language Inference	Oct 1, 2018	Information RetrievalNatural Language Inference	—Unverified
Learning to Transpile AMR into SPARQL	Dec 15, 2021	Abstract Meaning RepresentationKnowledge Base Question Answering	—Unverified
Learning to Transpile AMR into SPARQL	Jan 16, 2022	Abstract Meaning RepresentationKnowledge Base Question Answering	—Unverified
Learning Trajectory-Word Alignments for Video-Language Tasks	Jan 5, 2023	Question AnsweringRetrieval	—Unverified
IIE-NLP-NUT at SemEval-2020 Task 4: Guiding PLM with Prompt Template Reconstruction Strategy for ComVE	Jul 2, 2020	Multiple-choiceQuestion Answering	—Unverified
Logical Consistency of Large Language Models in Fact-checking	Dec 20, 2024	Fact CheckingHallucination	—Unverified
Learning Verb Inference Rules from Linguistically-Motivated Evidence	Jul 1, 2012	Natural Language InferenceQuestion Answering	—Unverified
Learning Visual Knowledge Memory Networks for Visual Question Answering	Jun 13, 2018	Question AnsweringVisual Question Answering	—Unverified
IIE-NLP-Eyas at SemEval-2021 Task 4: Enhancing PLM for ReCAM with Special Tokens, Re-Ranking, Siamese Encoders and Back Translation	Feb 25, 2021	Multiple-choiceQuestion Answering	—Unverified
3DLLM-Mem: Long-Term Spatial-Temporal Memory for Embodied 3D Large Language Model	May 28, 2025	Language ModelingLanguage Modelling	—Unverified
Learning What Makes a Difference from Counterfactual Examples and Gradient Supervision	Apr 20, 2020	counterfactualimage-classification	—Unverified
Learning What to Remember: Long-term Episodic Memory Networks for Learning from Streaming Data	Dec 11, 2018	Lifelong learningQuestion Answering	—Unverified
Learning When to Retrieve, What to Rewrite, and How to Respond in Conversational QA	Sep 23, 2024	Conversational Question AnsweringInformation Retrieval	—Unverified
Learning with Limited Data for Multilingual Reading Comprehension	Nov 1, 2019	Question AnsweringReading Comprehension	—Unverified
Learning Word Embeddings for Low-Resource Languages by PU Learning	Jun 1, 2018	Document RankingImage Captioning	—Unverified
Learning Word Representations by Jointly Modeling Syntagmatic and Paradigmatic Relations	Jul 1, 2015	Information RetrievalNamed Entity Recognition (NER)	—Unverified
IICONGRAPH: improved Iconographic and Iconological Statements in Knowledge Graphs	Jan 24, 2024	Knowledge GraphsQuestion Answering	—Unverified
ConvKN at SemEval-2016 Task 3: Answer and Question Selection for Question Answering on Arabic and English Fora	Jun 1, 2016	Community Question AnsweringFeature Engineering	—Unverified
IHS-RD-Belarus at SemEval-2016 Task 1: Multistage Approach for Measuring Semantic Similarity	Jun 1, 2016	Information RetrievalMachine Translation	—Unverified
I Have Seen Enough: A Teacher Student Network for Video Classification Using Fewer Frames	May 12, 2018	ClassificationGeneral Classification	—Unverified
Logical Inference on Dependency-based Compositional Semantics	Jun 1, 2014	Question Answering	—Unverified
Logic-in-Frames: Dynamic Keyframe Search via Visual Semantic-Logical Verification for Long Video Understanding	Mar 17, 2025	AttributeMME	—Unverified

Show:10 25 50

← PrevPage 114 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified