Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9526–9550 of 10817 papers

Title	Date	Tasks	Status
An Empirical Evaluation of Visual Question Answering for Novel Objects	Apr 8, 2017	Question AnsweringVisual Question Answering	—Unverified
Combining Lexical and Syntactic Features for Detecting Content-dense Texts in News	Apr 3, 2017	ArticlesQuestion Answering	—Unverified
It Takes Two to Tango: Towards Theory of AI's Mind	Apr 3, 2017	AttributeQuestion Answering	—Unverified
Aligned Image-Word Representations Improve Inductive Transfer Across Vision-Language Tasks	Apr 2, 2017	Multi-Task LearningQuestion Answering	—Unverified
If You Can't Beat Them Join Them: Handcrafted Features Complement Neural Nets for Non-Factoid Answer Reranking	Apr 1, 2017	Answer SelectionCommunity Question Answering	—Unverified
ICE: Idiom and Collocation Extractor for Research and Education	Apr 1, 2017	POSQuestion Answering	—Unverified
Learning and Knowledge Transfer with Memory Networks for Machine Comprehension	Apr 1, 2017	Question AnsweringReading Comprehension	—Unverified
Inducing Script Structure from Crowdsourced Event Descriptions via Semi-Supervised Clustering	Apr 1, 2017	ClusteringQuestion Answering	—Unverified
On-demand Injection of Lexical Knowledge for Recognising Textual Entailment	Apr 1, 2017	Automated Theorem ProvingInformation Retrieval	—Unverified
Arabic Textual Entailment with Word Embeddings	Apr 1, 2017	Machine TranslationNatural Language Inference	—Unverified
Paraphrasing Revisited with Neural Machine Translation	Apr 1, 2017	Machine TranslationQuestion Answering	—Unverified
Integer Linear Programming formulations in Natural Language Processing	Apr 1, 2017	Dependency ParsingNatural Language Inference	—Unverified
Event-Related Features in Feedforward Neural Networks Contribute to Identifying Causal Relations in Discourse	Apr 1, 2017	PositionQuestion Answering	—Unverified
Improving Chinese Semantic Role Labeling using High-quality Surface and Deep Case Frames	Apr 1, 2017	Chinese Semantic Role LabelingDependency Parsing	—Unverified
Metaheuristic Approaches to Lexical Substitution and Simplification	Apr 1, 2017	Lexical SimplificationMachine Translation	—Unverified
Improving Clinical Diagnosis Inference through Integration of Structured and Unstructured Knowledge	Apr 1, 2017	Information RetrievalQuestion Answering	—Unverified
MT/IE: Cross-lingual Open Information Extraction with Neural Sequence-to-Sequence Models	Apr 1, 2017	Machine TranslationOpen Information Extraction	—Unverified
CASSANDRA: A multipurpose configurable voice-enabled human-computer-interface	Apr 1, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
ParaDi: Dictionary of Paraphrases of Czech Complex Predicates with Light Verbs	Apr 1, 2017	Information RetrievalMachine Translation	—Unverified
Generating Natural Language Question-Answer Pairs from a Knowledge Graph Using a RNN Based Question Generation Model	Apr 1, 2017	Knowledge GraphsQuestion Answering	—Unverified
Integrating Semantic Knowledge into Lexical Embeddings Based on Information Content Measurement	Apr 1, 2017	Document ClassificationInformation Retrieval	CodeCode Available
Discriminative Information Retrieval for Question Answering Sentence Selection	Apr 1, 2017	Information RetrievalPassage Retrieval	CodeCode Available
If No Media Were Allowed inside the Venue, Was Anybody Allowed?	Apr 1, 2017	NegationQuestion Answering	—Unverified
Probabilistic Inference for Cold Start Knowledge Base Population with Prior World Knowledge	Apr 1, 2017	Common Sense ReasoningEntity Linking	—Unverified
Assessing SRL Frameworks with Automatic Training Data Expansion	Apr 1, 2017	Question AnsweringSemantic Role Labeling	—Unverified

Show:10 25 50

← PrevPage 382 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified