Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10751–10775 of 10817 papers

Title	Date	Tasks	Status
Taxonomy Induction Using Hierarchical Random Graphs	Jun 1, 2012	Document ClassificationNatural Language Inference	—Unverified
Using paraphrases for improving first story detection in news and Twitter	Jun 1, 2012	Information RetrievalMachine Translation	—Unverified
The FLaReNet Strategic Language Resource Agenda	May 1, 2012	Information RetrievalMachine Translation	—Unverified
Turkish Paraphrase Corpus	May 1, 2012	Machine TranslationQuestion Answering	—Unverified
Tools for plWordNet Development. Presentation and Perspectives	May 1, 2012	Machine TranslationQuestion Answering	—Unverified
Romanian TimeBank: An Annotated Parallel Corpus for Temporal Information	May 1, 2012	Information RetrievalMachine Translation	—Unverified
Constructing a Question Corpus for Textual Semantic Relations	May 1, 2012	Community Question AnsweringInformation Retrieval	—Unverified
Constraint Based Description of Polish Multiword Expressions	May 1, 2012	Machine TranslationMorphological Analysis	—Unverified
Learning Sentiment Lexicons in Spanish	May 1, 2012	Opinion MiningQuestion Answering	—Unverified
Chinese Whispers: Cooperative Paraphrase Acquisition	May 1, 2012	Machine TranslationNatural Language Inference	—Unverified
Linguagrid: a network of Linguistic and Semantic Services for the Italian Language.	May 1, 2012	ClusteringDependency Parsing	—Unverified
Parsing Any Domain English text to CoNLL dependencies	May 1, 2012	BenchmarkingDependency Parsing	—Unverified
Collecting humorous expressions from a community-based question-answering-service corpus	May 1, 2012	Question Answering	—Unverified
Evaluation of the KomParse Conversational Non-Player Characters in a Commercial Virtual World	May 1, 2012	Natural Language UnderstandingQuestion Answering	—Unverified
Clause-based Discourse Segmentation of Arabic Texts	May 1, 2012	ArticlesDiscourse Segmentation	—Unverified
Evaluating Multi-focus Natural Language Queries over Data Services	May 1, 2012	Natural Language QueriesQuestion Answering	—Unverified
Kitten: a tool for normalizing HTML and extracting its textual content	May 1, 2012	Language ModellingQuestion Answering	—Unverified
Annotating Opinions in German Political News	May 1, 2012	BIG-bench Machine LearningOpinion Mining	—Unverified
An English-Portuguese parallel corpus of questions: translation guidelines and application in SMT	May 1, 2012	Machine TranslationQuestion Answering	—Unverified
Identifying Nuggets of Information in GALE Distillation Evaluation	May 1, 2012	Machine TranslationQuestion Answering	—Unverified
Polaris: Lymba's Semantic Parser	May 1, 2012	Question AnsweringRelation Extraction	—Unverified
Linguistic Resources for Entity Linking Evaluation: from Monolingual to Cross-lingual	May 1, 2012	Cross-Lingual Entity LinkingEntity Linking	—Unverified
Evaluating Machine Reading Systems through Comprehension Tests	May 1, 2012	Answer SelectionMultiple-choice	—Unverified
P\'agico: Evaluating Wikipedia-based information retrieval in Portuguese	May 1, 2012	Cultural Vocal Bursts Intensity PredictionInformation Retrieval	—Unverified
Applying Random Indexing to Structured Data to Find Contextually Similar Words	May 1, 2012	Question Answering	—Unverified

Show:10 25 50

← PrevPage 431 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified