Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9301–9325 of 10817 papers

Title	Date	Tasks	Status
Data Augmentation for Visual Question Answering	Sep 1, 2017	Data AugmentationGeneral Classification	—Unverified
Recognizing Textual Entailment in Twitter Using Word Embeddings	Sep 1, 2017	Information RetrievalMachine Translation	—Unverified
deepCybErNet at EmoInt-2017: Deep Emotion Intensities in Tweets	Sep 1, 2017	Emotion ClassificationNatural Language Inference	—Unverified
Constructing an Alias List for Named Entities during an Event	Sep 1, 2017	Community Question AnsweringQuestion Answering	—Unverified
Multimedia Summary Generation from Online Conversations: Current Approaches and Future Directions	Sep 1, 2017	Community Question AnsweringQuestion Answering	—Unverified
Deception Detection in News Reports in the Russian Language: Lexics and Discourse	Sep 1, 2017	Deception DetectionFact Checking	—Unverified
Generating titles for millions of browse pages on an e-Commerce site	Sep 1, 2017	Automatic Post-EditingMachine Translation	—Unverified
Spatial Language Understanding with Multimodal Graphs using Declarative Learning based Programming	Sep 1, 2017	Image CaptioningImage Retrieval	—Unverified
Sheffield MultiMT: Using Object Posterior Predictions for Multimodal Machine Translation	Sep 1, 2017	Image CaptioningImage Classification	—Unverified
Using Question-Answering Techniques to Implement a Knowledge-Driven Argument Mining Approach	Sep 1, 2017	Argument MiningQuestion Answering	—Unverified
Rhetorical relations markers in Russian RST Treebank	Sep 1, 2017	Coreference ResolutionQuestion Answering	—Unverified
Sparsity and Noise: Where Knowledge Graph Embeddings Fall Short	Sep 1, 2017	Knowledge Graph EmbeddingsKnowledge Graphs	CodeCode Available
Story Comprehension for Predicting What Happens Next	Sep 1, 2017	Common Sense ReasoningNatural Language Understanding	—Unverified
Latent Space Embedding for Retrieval in Question-Answer Archives	Sep 1, 2017	Question AnsweringRetrieval	—Unverified
From Textbooks to Knowledge: A Case Study in Harvesting Axiomatic Knowledge from Textbooks to Solve Geometry Problems	Sep 1, 2017	MathQuestion Answering	—Unverified
No Need to Pay Attention: Simple Recurrent Neural Networks Work!	Sep 1, 2017	Question Answering	—Unverified
Neural Semantic Parsing with Type Constraints for Semi-Structured Tables	Sep 1, 2017	DecoderEntity Linking	CodeCode Available
Neural Net Models of Open-domain Discourse Coherence	Sep 1, 2017	Abstractive Text SummarizationQuestion Answering	—Unverified
A Joint Sequential and Relational Model for Frame-Semantic Parsing	Sep 1, 2017	Knowledge DistillationMachine Translation	—Unverified
A Question Answering Approach for Emotion Cause Extraction	Sep 1, 2017	Emotion Cause ExtractionEmotion Classification	—Unverified
Learning Contextually Informed Representations for Linear-Time Discourse Parsing	Sep 1, 2017	Discourse ParsingFeature Engineering	—Unverified
CROWD-IN-THE-LOOP: A Hybrid Approach for Annotating Semantic Roles	Sep 1, 2017	Machine TranslationQuestion Answering	—Unverified
Exploiting Morphological Regularities in Distributional Word Representations	Sep 1, 2017	ChunkingDocument Classification	—Unverified
Importance sampling for unbiased on-demand evaluation of knowledge base population	Sep 1, 2017	Information RetrievalKnowledge Base Population	—Unverified
Classification of telicity using cross-linguistic annotation projection	Sep 1, 2017	ClassificationGeneral Classification	CodeCode Available

Show:10 25 50

← PrevPage 373 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified