Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9501–9525 of 10817 papers

Title	Date	Tasks	Status
UofR at SemEval-2016 Task 8: Learning Synchronous Hyperedge Replacement Grammar for AMR Parsing	Jun 1, 2016	AMR ParsingMachine Translation	—Unverified
UoR at SemEval-2021 Task 4: Using Pre-trained BERT Token Embeddings for Question Answering of Abstract Meaning	Aug 1, 2021	Question AnsweringReading Comprehension	—Unverified
UOUO: Uncontextualized Uncommon Objects for Measuring Knowledge Horizons of Vision Language Models	Jul 25, 2024	Computational EfficiencyQuestion Answering	—Unverified
UoW: Multi-task Learning Gaussian Process for Semantic Textual Similarity	Aug 1, 2014	Domain AdaptationInformation Retrieval	—Unverified
UParse: the Edinburgh system for the CoNLL 2017 UD shared task	Aug 1, 2017	Dependency ParsingMachine Translation	—Unverified
UPB at SemEval-2021 Task 8: Extracting Semantic Information on Measurements as Multi-Turn Question Answering	Apr 9, 2021	Question AnsweringRelation Extraction	—Unverified
UPC-USMBA at SemEval-2017 Task 3: Combining multiple approaches for CQA for Arabic	Aug 1, 2017	Question Answering	—Unverified
UPME: An Unsupervised Peer Review Framework for Multimodal Large Language Model Evaluation	Mar 19, 2025	Language Model EvaluationLanguage Modeling	—Unverified
UQuAD1.0: Development of an Urdu Question Answering Training Data for Machine Reading Comprehension	Nov 2, 2021	ArticlesMachine Reading Comprehension	—Unverified
URAG: Implementing a Unified Hybrid RAG for Precise Answers in University Admission Chatbots -- A Case Study at HCMUT	Jan 27, 2025	MisinformationQuestion Answering	—Unverified
User-Controlled, Robust Natural Language Generation from an Evolving Knowledge Base	Aug 1, 2013	Question AnsweringText Generation	—Unverified
User evaluation of a multiple answer extraction system on the Web (\'Evaluation d'un syst\`eme d'extraction de r\'eponses multiples sur le Web par comparaison \`a des humains) [in French]	Jul 1, 2014	Question Answering	—Unverified
User-Inspired Posterior Network for Recommendation Reason Generation	Feb 16, 2021	Question Answering	—Unverified
User Name Disambiguation in Community Question Answering	Sep 1, 2015	Community Question AnsweringQuestion Answering	—Unverified
User Personalized Satisfaction Prediction via Multiple Instance Deep Learning	Nov 24, 2016	Deep Learningfeature selection	—Unverified
Using a Random Forest Classifier to recognise translations of biomedical terms across languages	Aug 1, 2013	Information RetrievalMachine Translation	—Unverified
Using Artificial Intelligence to aid Scientific Discovery of Climate Tipping Points	Feb 14, 2023	Question Answeringscientific discovery	—Unverified
Using a Weighted Semantic Network for Lexical Semantic Relatedness	Sep 1, 2013	Information RetrievalNatural Language Inference	—Unverified
Using BERT Encoding and Sentence-Level Language Model for Sentence Ordering	Aug 24, 2021	Document SummarizationLanguage Modeling	—Unverified
Using Centroids of Word Embeddings and Word Mover's Distance for Biomedical Document Retrieval in Question Answering	Aug 12, 2016	Question AnsweringRetrieval	—Unverified
Using Confusion Graphs to Understand Classifier Error	Jun 1, 2016	Question Answering	—Unverified
Using contradictions improves question answering systems	Sep 28, 2022	Multiple-choiceNatural Language Inference	—Unverified
Using Explicit Discourse Connectives in Translation for Implicit Discourse Relation Classification	Nov 1, 2017	General ClassificationImplicit Discourse Relation Classification	—Unverified
Using Holographically Compressed Embeddings in Question Answering	Jul 14, 2020	Question Answering	—Unverified
Using Integrated Gradients and Constituency Parse Trees to explain Linguistic Acceptability learnt by BERT	Jun 1, 2021	CoLADecision Making	—Unverified

Show:10 25 50

← PrevPage 381 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified