Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3051–3100 of 10817 papers

Title	Date	Tasks	Status
Dynamic-TinyBERT: Boost TinyBERT's Inference Efficiency by Dynamic Sequence Length	Nov 18, 2021	Computational EfficiencyHyperparameter Optimization	—Unverified
Biomedical Entity Linking with Triple-aware Pre-Training	Aug 28, 2023	Entity LinkingQuestion Answering	—Unverified
DynRsl-VLM: Enhancing Autonomous Driving Perception with Dynamic Resolution Vision-Language Models	Mar 14, 2025	Autonomous DrivingComputational Efficiency	—Unverified
Biomedical Large Languages Models Seem not to be Superior to Generalist Models on Unseen Medical Data	Aug 25, 2024	Document SummarizationGeneral Knowledge	—Unverified
E3D-GPT: Enhanced 3D Visual Foundation for Medical Vision-Language Model	Oct 18, 2024	Language ModelingLanguage Modelling	—Unverified
A General and Flexible Multi-concept Parsing Framework for Multilingual Semantic Matching	Mar 5, 2024	ChatbotCommunity Question Answering	—Unverified
Evaluation of Review Summaries via Question-Answering	Dec 1, 2021	Question Answering	—Unverified
EACO: Enhancing Alignment in Multimodal LLMs via Critical Observation	Dec 6, 2024	MMEQuestion Answering	—Unverified
Answerability Fields: Answerable Location Estimation via Diffusion Models	Jul 26, 2024	Question AnsweringScene Understanding	—Unverified
Biomedical Question Answering: A Survey of Approaches and Challenges	Feb 10, 2021	Information RetrievalMachine Reading Comprehension	—Unverified
EarthDial: Turning Multi-sensory Earth Observations to Interactive Dialogues	Dec 19, 2024	Change DetectionDisaster Response	—Unverified
EarthSE: A Benchmark Evaluating Earth Scientific Exploration Capability for Large Language Models	May 22, 2025	Question AnsweringSpecificity	—Unverified
Dynamic Strategy Planning for Efficient Question Answering with Large Language Models	Oct 30, 2024	Multi-hop Question AnsweringQuestion Answering	—Unverified
Biomedical Question Answering via Weighted Neural Network Passage Retrieval	Jan 9, 2018	Passage RetrievalQuestion Answering	—Unverified
Easy Questions First? A Case Study on Curriculum Learning for Question Answering	Aug 1, 2016	Active LearningQuestion Answering	—Unverified
An Overview Of Temporal Commonsense Reasoning and Acquisition	Jul 28, 2023	Common Sense ReasoningLanguage Modelling	—Unverified
Dynamic Stochastic Decoding Strategy for Open-Domain Dialogue Generation	Jun 12, 2024	Dialogue GenerationDiversity	—Unverified
Biomedical Document Retrieval for Clinical Decision Support System	Jul 1, 2018	Information RetrievalLearning-To-Rank	—Unverified
A Gaze-grounded Visual Question Answering Dataset for Clarifying Ambiguous Japanese Questions	Mar 26, 2024	Gaze Target EstimationQuestion Answering	—Unverified
EBMs vs. CL: Exploring Self-Supervised Visual Pretraining for Visual Question Answering	Jun 29, 2022	Contrastive LearningOut of Distribution (OOD) Detection	—Unverified
Dynamic Relevance Graph Network for Knowledge-Aware Question Answering	Jan 16, 2022	Graph Neural NetworkQuestion Answering	—Unverified
Biomedical/Clinical NLP	Aug 1, 2014	Coreference ResolutionPart-Of-Speech Tagging	—Unverified
Dynamic Q&A of Clinical Documents with Large Language Models	Jan 19, 2024	ChatbotDecision Making	—Unverified
Dynamic Neural Turing Machine with Soft and Hard Addressing Schemes	Jun 30, 2016	Natural Language InferenceQuestion Answering	—Unverified
BioMedGPT: Open Multimodal Generative Pre-trained Transformer for BioMedicine	Aug 18, 2023	Few-Shot LearningLanguage Modeling	—Unverified
EchoQA: A Large Collection of Instruction Tuning Data for Echocardiogram Reports	Mar 4, 2025	FairnessQuestion Answering	—Unverified
EchoSight: Advancing Visual-Language Models with Wiki Knowledge	Jul 17, 2024	ArticlesQuestion Answering	—Unverified
ECKGBench: Benchmarking Large Language Models in E-commerce Leveraging Knowledge Graph	Mar 20, 2025	BenchmarkingHallucination	—Unverified
Evaluation of medium-large Language Models at zero-shot closed book generative question answering	May 19, 2023	Generative Question AnsweringQuestion Answering	—Unverified
ECNU at SemEval-2016 Task 1: Leveraging Word Embedding From Macro and Micro Views to Boost Performance for Semantic Textual Similarity	Jun 1, 2016	Feature EngineeringMachine Translation	—Unverified
Evaluation of Table Representations to Answer Questions from Tables in Documents : A Case Study using 3GPP Specifications	Aug 30, 2024	Question AnsweringRetrieval	—Unverified
ECNU at SemEval-2017 Task 3: Using Traditional and Deep Learning Methods to Address Community Question Answering Task	Aug 1, 2017	Community Question AnsweringQuestion Answering	—Unverified
ECNUCS: Measuring Short Text Semantic Equivalence Using Multiple Similarity Measurements	Jun 1, 2013	Information RetrievalMachine Translation	—Unverified
ECNUCS: Recognizing Cross-lingual Textual Entailment Using Multiple Text Similarity and Text Difference Measures	Jun 1, 2013	Machine TranslationNatural Language Inference	—Unverified
ECNU: Leveraging Word Embeddings to Boost Performance for Paraphrase in Twitter	Jun 1, 2015	Machine TranslationNatural Language Inference	—Unverified
ECNU: Using Multiple Sources of CQA-based Information for Answers Selection and YES/NO Response Inference	Jun 1, 2015	Answer SelectionCommunity Question Answering	—Unverified
ECNU: Using Traditional Similarity Measurements and Word Embedding for Semantic Textual Similarity Estimation	Jun 1, 2015	Multi-Task LearningNatural Language Inference	—Unverified
BioTABQA: Instruction Learning for Biomedical Table Question Answering	Jul 6, 2022	Question Answering	—Unverified
Evaluation Paradigms in Question Answering	Nov 1, 2021	PositionQuestion Answering	—Unverified
EDG-Based Question Decomposition for Complex Question Answering over Knowledge Bases	Oct 24, 2021	Knowledge Base Question AnsweringQuestion Answering	—Unverified
Dynamic Multistep Reasoning based on Video Scene Graph for Video Question Answering	Jul 1, 2022	Question AnsweringVideo Question Answering	—Unverified
DynamicMind: A Tri-Mode Thinking System for Large Language Models	Jun 6, 2025	Computational EfficiencyPrompt Engineering	—Unverified
BioMedBERT: A Pre-trained Biomedical Language Model for QA and IR	Dec 10, 2020	ArticlesInformation Retrieval	—Unverified
An Overview of Distant Supervision for Relation Extraction with a Focus on Denoising and Pre-training Methods	Jul 17, 2022	DenoisingKnowledge Graph Completion	—Unverified
Evaluation of Dataset Selection for Pre-Training and Fine-Tuning Transformer Language Models for Clinical Question Answering	May 1, 2020	Machine Reading ComprehensionQuestion Answering	—Unverified
Dynamic Knowledge Integration for Enhanced Vision-Language Reasoning	Jan 15, 2025	Question AnsweringVisual Question Answering	—Unverified
BIT at SemEval-2016 Task 1: Sentence Similarity Based on Alignments and Vector with the Weight of Information Content	Jun 1, 2016	Information RetrievalMachine Translation	—Unverified
Answer Generation for Retrieval-based Question Answering Systems	Jun 2, 2021	Answer GenerationQuestion Answering	—Unverified
A Novel Word Sense Disambiguation Approach Using WordNet Knowledge Graph	Jan 8, 2021	ClusteringInformation Retrieval	—Unverified
Dynamic Neuro-Symbolic Knowledge Graph Construction for Zero-shot Commonsense Question Answering	Nov 10, 2019	graph constructionKnowledge Graphs	—Unverified

Show:10 25 50

← PrevPage 62 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified