Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5801–5850 of 10817 papers

Title	Date	Tasks	Status
Divide & Conquer for Entailment-aware Multi-hop Evidence Retrieval	Nov 5, 2023	Information RetrievalMulti-hop Question Answering	—Unverified
Linguistic Resources for Entity Linking Evaluation: from Monolingual to Cross-lingual	May 1, 2012	Cross-Lingual Entity LinkingEntity Linking	—Unverified
Learn to Unlearn: Meta-Learning-Based Knowledge Graph Embedding Unlearning	Dec 1, 2024	Graph EmbeddingKnowledge Graph Embedding	—Unverified
Learn to Refuse: Making Large Language Models More Controllable and Reliable through Knowledge Scope Limitation and Refusal Mechanism	Nov 2, 2023	HallucinationMisinformation	—Unverified
LINKAGE: Listwise Ranking among Varied-Quality References for Non-Factoid QA Evaluation via LLMs	Sep 23, 2024	Learning-To-RankQuestion Answering	—Unverified
Divide and Conquer: Text Semantic Matching with Disentangled Keywords and Intents	Jan 16, 2022	Community Question AnsweringInformation Retrieval	—Unverified
LinkedHealthAnswers: Towards Linked Data-driven Question Answering for the Health Care Domain	May 1, 2014	Predicate DetectionQuestion Answering	—Unverified
Linking, Searching, and Visualizing Entities in Wikipedia	May 1, 2018	Entity Extraction using GANNamed Entity Recognition (NER)	—Unverified
BERT Based Clinical Knowledge Extraction for Biomedical Knowledge Graph Construction and Analysis	Apr 21, 2023	Clinical Knowledgegraph construction	—Unverified
LIORI at SemEval-2021 Task 2: Span Prediction and Binary Classification approaches to Word-in-Context Disambiguation	Aug 1, 2021	Binary ClassificationData Augmentation	—Unverified
A Factoid Question Answering System for Vietnamese	Mar 2, 2018	General KnowledgeQuestion Answering	—Unverified
LIPN-CORE: Semantic Text Similarity using n-grams, WordNet, Syntactic Analysis, ESA and Information Retrieval based Features	Jun 1, 2013	Information RetrievalNatural Language Inference	—Unverified
A Comprehensive Survey of Retrieval-Augmented Generation (RAG): Evolution, Current Landscape and Future Directions	Oct 3, 2024	Question AnsweringRAG	—Unverified
3D-MoE: A Mixture-of-Experts Multi-modal LLM for 3D Vision and Pose Diffusion via Rectified Flow	Jan 28, 2025	Instruction FollowingMixture-of-Experts	—Unverified
Learning Word Representations by Jointly Modeling Syntagmatic and Paradigmatic Relations	Jul 1, 2015	Information RetrievalNamed Entity Recognition (NER)	—Unverified
Listening to the Wise Few: Select-and-Copy Attention Heads for Multiple-Choice QA	Oct 3, 2024	Multiple-choiceQuestion Answering	—Unverified
Learning Word Embeddings for Low-Resource Languages by PU Learning	Jun 1, 2018	Document RankingImage Captioning	—Unverified
LIST-LUX: Disorder Identification from Clinical Texts	Jun 1, 2015	Information RetrievalQuestion Answering	—Unverified
Learning with Limited Data for Multilingual Reading Comprehension	Nov 1, 2019	Question AnsweringReading Comprehension	—Unverified
LiT-4-RSVQA: Lightweight Transformer-based Visual Question Answering in Remote Sensing	Jun 1, 2023	Question AnsweringVisual Question Answering	—Unverified
Learning When to Retrieve, What to Rewrite, and How to Respond in Conversational QA	Sep 23, 2024	Conversational Question AnsweringInformation Retrieval	—Unverified
Diversity Enhances an LLM's Performance in RAG and Long-context Task	Feb 13, 2025	DiversityQuestion Answering	—Unverified
Learning What to Remember: Long-term Episodic Memory Networks for Learning from Streaming Data	Dec 11, 2018	Lifelong learningQuestion Answering	—Unverified
Learning What Makes a Difference from Counterfactual Examples and Gradient Supervision	Apr 20, 2020	counterfactualimage-classification	—Unverified
Diversity and Consistency: Exploring Visual Question-Answer Pair Generation	Nov 1, 2021	DiversityQuestion Answering	—Unverified
BenLLMEval: A Comprehensive Evaluation into the Potentials and Pitfalls of Large Language Models on Bengali NLP	Sep 22, 2023	Abstractive Text SummarizationNatural Language Inference	—Unverified
An Interactive Web-Interface for Visualizing the Inner Workings of the Question Answering LSTM	Nov 1, 2018	Feature EngineeringMachine Translation	—Unverified
LiveVLM: Efficient Online Video Understanding via Streaming-Oriented KV Cache and Retrieval	May 21, 2025	Autonomous DrivingQuestion Answering	—Unverified
Learning Visual Knowledge Memory Networks for Visual Question Answering	Jun 13, 2018	Question AnsweringVisual Question Answering	—Unverified
LiVLR: A Lightweight Visual-Linguistic Reasoning Framework for Video Question Answering	Nov 29, 2021	DiversityQuestion Answering	—Unverified
Learning Verb Inference Rules from Linguistically-Motivated Evidence	Jul 1, 2012	Natural Language InferenceQuestion Answering	—Unverified
LK2022 at Qur’an QA 2022: Simple Transformers Model for Finding Answers to Questions from Qur’an	Jun 1, 2022	Question AnsweringReading Comprehension	—Unverified
Diversify-verify-adapt: Efficient and Robust Retrieval-Augmented Ambiguous Question Answering	Sep 4, 2024	Question AnsweringRAG	—Unverified
Learning Transferable Representation for Bilingual Relation Extraction via Convolutional Neural Networks	Nov 1, 2017	Knowledge Base PopulationQuestion Answering	—Unverified
Bengali Question Classification: Towards Developing QA System	Dec 1, 2012	ClassificationGeneral Classification	—Unverified
Learning Trajectory-Word Alignments for Video-Language Tasks	Jan 5, 2023	Question AnsweringRetrieval	—Unverified
Learning to Transpile AMR into SPARQL	Jan 16, 2022	Abstract Meaning RepresentationKnowledge Base Question Answering	—Unverified
Diversifying the Mixture-of-Experts Representation for Language Models with Orthogonal Optimizer	Oct 15, 2023	DiversityMixture-of-Experts	—Unverified
Llamas Know What GPTs Don't Show: Surrogate Models for Confidence Estimation	Nov 15, 2023	Question Answering	—Unverified
Learning to Transpile AMR into SPARQL	Dec 15, 2021	Abstract Meaning RepresentationKnowledge Base Question Answering	—Unverified
Learning to Translate for Multilingual Question Answering	Sep 26, 2016	Question AnsweringTranslation	—Unverified
LLARVA: Vision-Action Instruction Tuning Enhances Robot Learning	Jun 17, 2024	Image CaptioningQuestion Answering	—Unverified
Diversifying Question Generation over Knowledge Base via External Natural Questions	Sep 23, 2023	DiversityNatural Questions	—Unverified
An Interactive System for Exploring Community Question Answering Forums	Dec 1, 2016	Community Question AnsweringQuestion Answering	—Unverified
A Fact Checking and Verification System for FEVEROUS Using a Zero-Shot Learning Approach	Nov 1, 2021	Fact CheckingNatural Language Inference	—Unverified
Learning to Temporally Order Medical Events in Clinical Text	Jul 1, 2012	Document SummarizationInformation Retrieval	—Unverified
Learning to Summarize and Answer Questions about a Virtual Robot's Past Actions	Jun 16, 2023	Language ModelingLanguage Modelling	—Unverified
Diversifying Knowledge Enhancement of Biomedical Language Models using Adapter Modules and Knowledge Graphs	Dec 21, 2023	Document ClassificationKnowledge Graphs	—Unverified
Learning to Summarise Related Sentences	Aug 1, 2014	Question AnsweringSentence Compression	—Unverified
Learning to Specialize with Knowledge Distillation for Visual Question Answering	Dec 1, 2018	General ClassificationGeneral Knowledge	—Unverified

Show:10 25 50

← PrevPage 117 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified