Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5751–5800 of 10817 papers

Title	Date	Tasks	Status
DocChat: An Information Retrieval Approach for Chatbot Engines Using Unstructured Documents	Aug 1, 2016	ChatbotCommunity Question Answering	—Unverified
Leveraging Term Banks for Answering Complex Questions: A Case for Sparse Vectors	Apr 11, 2017	Open-Domain Question AnsweringQuestion Answering	—Unverified
Let Me Know What to Ask: Interrogative-Word-Aware Question Generation	Oct 30, 2019	Question AnsweringQuestion Generation	—Unverified
Leveraging the Domain Adaptation of Retrieval Augmented Generation Models for Question Answering and Reducing Hallucination	Oct 23, 2024	Domain AdaptationHallucination	—Unverified
DLS@CU: Sentence Similarity from Word Alignment	Aug 1, 2014	Information RetrievalMachine Translation	—Unverified
DLS@CU: Sentence Similarity from Word Alignment and Semantic Vector Composition	Jun 1, 2015	Information RetrievalMachine Translation	—Unverified
Leveraging Video Descriptions to Learn Video Question Answering	Nov 12, 2016	Question AnsweringVideo Question Answering	—Unverified
Leveraging Visual Question Answering for Image-Caption Ranking	May 4, 2016	Image RetrievalQuestion Answering	—Unverified
Less Is More: Linear Layers on CLIP Features as Powerful VizWiz Model	Jun 10, 2022	Question AnsweringTask 2	—Unverified
Lexical Disambiguation in Natural Language Questions (NLQs)	Sep 26, 2017	Question Answering	—Unverified
DLS@CU-CORE: A Simple Machine Learning Model of Semantic Textual Similarity	Jun 1, 2013	BIG-bench Machine LearningInformation Retrieval	—Unverified
DLS@CU at SemEval-2016 Task 1: Supervised Models of Sentence Similarity	Jun 1, 2016	Machine TranslationNatural Language Inference	—Unverified
BERT for Question Generation	Oct 1, 2019	Language ModelingLanguage Modelling	—Unverified
An Introductory Survey on Attention Mechanisms in NLP Problems	Nov 12, 2018	Dependency ParsingGeneral Classification	—Unverified
A Factoid Question Answering System Using Answer Pattern Matching	Oct 1, 2013	Question Answering	—Unverified
DLIP: Distilling Language-Image Pre-training	Aug 24, 2023	Image CaptioningImage-text Retrieval	—Unverified
BERTERS: Multimodal Representation Learning for Expert Recommendation System with Transformer	Jun 30, 2020	ArticlesCommunity Question Answering	—Unverified
LEGO-Puzzles: How Good Are MLLMs at Multi-Step Spatial Reasoning?	Mar 25, 2025	Autonomous NavigationQuestion Answering	—Unverified
Lego: Learning to Disentangle and Invert Personalized Concepts Beyond Object Appearance in Text-to-Image Diffusion Models	Nov 23, 2023	Language ModellingLarge Language Model	—Unverified
LegalRAG: A Hybrid RAG System for Multilingual Legal Information Retrieval	Apr 19, 2025	Information RetrievalQuestion Answering	—Unverified
LiDAR-LLM: Exploring the Potential of Large Language Models for 3D LiDAR Understanding	Dec 21, 2023	Instruction FollowingLanguage Modeling	—Unverified
Continuous QA Learning with Structured Prompts	Aug 31, 2022	Language ModelingLanguage Modelling	—Unverified
DKPro Keyphrases: Flexible and Reusable Keyphrase Extraction Experiments	Jun 1, 2014	Information RetrievalKeyphrase Extraction	—Unverified
BERT-CoQAC: BERT-based Conversational Question Answering in Context	Apr 23, 2021	Conversational Question AnsweringLanguage Modelling	—Unverified
An Introduction to Natural Language Processing Techniques and Framework for Clinical Implementation in Radiation Oncology	Nov 3, 2023	DiagnosticQuestion Answering	—Unverified
Lifting the Curse of Multilinguality by Pre-training Modular Transformers	May 12, 2022	named-entity-recognitionNamed Entity Recognition	—Unverified
Light as Deception: GPT-driven Natural Relighting Against Vision-Language Pre-training Models	May 30, 2025	Image CaptioningQuestion Answering	—Unverified
Lighter And Better: Towards Flexible Context Adaptation For Retrieval Augmented Generation	Sep 24, 2024	Question AnsweringRAG	—Unverified
Legal Question Answering using Ranking SVM and Deep Convolutional Neural Network	Mar 16, 2017	Information RetrievalQuestion Answering	—Unverified
Lightweight Convolutional Approaches to Reading Comprehension on SQuAD	Oct 19, 2018	Question AnsweringReading Comprehension	—Unverified
Lightweight In-Context Tuning for Multimodal Unified Models	Oct 8, 2023	Image CaptioningIn-Context Learning	—Unverified
DIVKNOWQA: Assessing the Reasoning Ability of LLMs via Open-Domain Question Answering over Knowledge Base and Text	Oct 31, 2023	Information RetrievalKnowledge Graphs	—Unverified
Least-to-Most Prompting Enables Complex Reasoning in Large Language Models	May 21, 2022	Arithmetic ReasoningMath	—Unverified
Divide & Conquer for Entailment-aware Multi-hop Evidence Retrieval	Nov 5, 2023	Information RetrievalMulti-hop Question Answering	—Unverified
Learn to Unlearn: Meta-Learning-Based Knowledge Graph Embedding Unlearning	Dec 1, 2024	Graph EmbeddingKnowledge Graph Embedding	—Unverified
Learn to Refuse: Making Large Language Models More Controllable and Reliable through Knowledge Scope Limitation and Refusal Mechanism	Nov 2, 2023	HallucinationMisinformation	—Unverified
L’importance des entités pour la tâche de détection d’événements en tant que système de question-réponse (Exploring Entities in Event Detection as Question Answering)	Jun 1, 2022	Event DetectionQuestion Answering	—Unverified
LIMSIILES: Basic English Substitution for Student Answer Assessment at SemEval 2013	Jun 1, 2013	Language ModellingMachine Translation	—Unverified
Divide and Conquer: Text Semantic Matching with Disentangled Keywords and Intents	Jan 16, 2022	Community Question AnsweringInformation Retrieval	—Unverified
Lingke: A Fine-grained Multi-turn Chatbot for Customer Service	Aug 10, 2018	BIG-bench Machine LearningChatbot	—Unverified
BERT Based Clinical Knowledge Extraction for Biomedical Knowledge Graph Construction and Analysis	Apr 21, 2023	Clinical Knowledgegraph construction	—Unverified
A Factoid Question Answering System for Vietnamese	Mar 2, 2018	General KnowledgeQuestion Answering	—Unverified
A Comprehensive Survey of Retrieval-Augmented Generation (RAG): Evolution, Current Landscape and Future Directions	Oct 3, 2024	Question AnsweringRAG	—Unverified
LinguaMark: Do Multimodal Models Speak Fairly? A Benchmark-Based Evaluation	Jul 9, 2025	Question AnsweringVisual Question Answering	—Unverified
3D-MoE: A Mixture-of-Experts Multi-modal LLM for 3D Vision and Pose Diffusion via Rectified Flow	Jan 28, 2025	Instruction FollowingMixture-of-Experts	—Unverified
Linguistically Driven Graph Capsule Network for Visual Question Reasoning	Mar 23, 2020	Question AnsweringVisual Question Answering	—Unverified
Linguistically-Informed Neural Architectures for Lexical, Syntactic and Semantic Tasks in Sanskrit	Aug 17, 2023	Dependency ParsingMachine Translation	—Unverified
Linguistically Motivated Question Classification	May 1, 2015	ClassificationGeneral Classification	—Unverified
Learning Word Representations by Jointly Modeling Syntagmatic and Paradigmatic Relations	Jul 1, 2015	Information RetrievalNamed Entity Recognition (NER)	—Unverified
Learning Word Embeddings for Low-Resource Languages by PU Learning	Jun 1, 2018	Document RankingImage Captioning	—Unverified

Show:10 25 50

← PrevPage 116 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified