Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8776–8800 of 10817 papers

Title	Date	Tasks	Status
Learning to Solve Geometry Problems from Natural Language Demonstrations in Textbooks	Aug 1, 2017	Question Answering	—Unverified
Learning to Specialize with Knowledge Distillation for Visual Question Answering	Dec 1, 2018	General ClassificationGeneral Knowledge	—Unverified
Learning to Summarise Related Sentences	Aug 1, 2014	Question AnsweringSentence Compression	—Unverified
Learning to Summarize and Answer Questions about a Virtual Robot's Past Actions	Jun 16, 2023	Language ModelingLanguage Modelling	—Unverified
Learning to Temporally Order Medical Events in Clinical Text	Jul 1, 2012	Document SummarizationInformation Retrieval	—Unverified
Learning to Translate for Multilingual Question Answering	Sep 26, 2016	Question AnsweringTranslation	—Unverified
Learning to Transpile AMR into SPARQL	Dec 15, 2021	Abstract Meaning RepresentationKnowledge Base Question Answering	—Unverified
Learning to Transpile AMR into SPARQL	Jan 16, 2022	Abstract Meaning RepresentationKnowledge Base Question Answering	—Unverified
Learning Trajectory-Word Alignments for Video-Language Tasks	Jan 5, 2023	Question AnsweringRetrieval	—Unverified
Learning Transferable Representation for Bilingual Relation Extraction via Convolutional Neural Networks	Nov 1, 2017	Knowledge Base PopulationQuestion Answering	—Unverified
Learning Verb Inference Rules from Linguistically-Motivated Evidence	Jul 1, 2012	Natural Language InferenceQuestion Answering	—Unverified
Learning Visual Knowledge Memory Networks for Visual Question Answering	Jun 13, 2018	Question AnsweringVisual Question Answering	—Unverified
Learning What Makes a Difference from Counterfactual Examples and Gradient Supervision	Apr 20, 2020	counterfactualimage-classification	—Unverified
Learning What to Remember: Long-term Episodic Memory Networks for Learning from Streaming Data	Dec 11, 2018	Lifelong learningQuestion Answering	—Unverified
Learning When to Retrieve, What to Rewrite, and How to Respond in Conversational QA	Sep 23, 2024	Conversational Question AnsweringInformation Retrieval	—Unverified
Learning with Limited Data for Multilingual Reading Comprehension	Nov 1, 2019	Question AnsweringReading Comprehension	—Unverified
Learning Word Embeddings for Low-Resource Languages by PU Learning	Jun 1, 2018	Document RankingImage Captioning	—Unverified
Learning Word Representations by Jointly Modeling Syntagmatic and Paradigmatic Relations	Jul 1, 2015	Information RetrievalNamed Entity Recognition (NER)	—Unverified
Learn to Refuse: Making Large Language Models More Controllable and Reliable through Knowledge Scope Limitation and Refusal Mechanism	Nov 2, 2023	HallucinationMisinformation	—Unverified
Learn to Unlearn: Meta-Learning-Based Knowledge Graph Embedding Unlearning	Dec 1, 2024	Graph EmbeddingKnowledge Graph Embedding	—Unverified
Least-to-Most Prompting Enables Complex Reasoning in Large Language Models	May 21, 2022	Arithmetic ReasoningMath	—Unverified
Legal Question Answering using Ranking SVM and Deep Convolutional Neural Network	Mar 16, 2017	Information RetrievalQuestion Answering	—Unverified
LegalRAG: A Hybrid RAG System for Multilingual Legal Information Retrieval	Apr 19, 2025	Information RetrievalQuestion Answering	—Unverified
Lego: Learning to Disentangle and Invert Personalized Concepts Beyond Object Appearance in Text-to-Image Diffusion Models	Nov 23, 2023	Language ModellingLarge Language Model	—Unverified
LEGO-Puzzles: How Good Are MLLMs at Multi-Step Spatial Reasoning?	Mar 25, 2025	Autonomous NavigationQuestion Answering	—Unverified

Show:10 25 50

← PrevPage 352 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified