Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10751–10800 of 10817 papers

Title	Date	Tasks	Status
Structured Event Retrieval over Microblog Archives	Jun 1, 2012	Question AnsweringRetrieval	—Unverified
Topical Segmentation: a Study of Human Performance and a New Measure of Quality.	Jun 1, 2012	Information RetrievalQuestion Answering	—Unverified
Tools for plWordNet Development. Presentation and Perspectives	May 1, 2012	Machine TranslationQuestion Answering	—Unverified
Romanian TimeBank: An Annotated Parallel Corpus for Temporal Information	May 1, 2012	Information RetrievalMachine Translation	—Unverified
The FLaReNet Strategic Language Resource Agenda	May 1, 2012	Information RetrievalMachine Translation	—Unverified
Turkish Paraphrase Corpus	May 1, 2012	Machine TranslationQuestion Answering	—Unverified
Evaluation of the KomParse Conversational Non-Player Characters in a Commercial Virtual World	May 1, 2012	Natural Language UnderstandingQuestion Answering	—Unverified
Clause-based Discourse Segmentation of Arabic Texts	May 1, 2012	ArticlesDiscourse Segmentation	—Unverified
Learning Sentiment Lexicons in Spanish	May 1, 2012	Opinion MiningQuestion Answering	—Unverified
Constructing a Question Corpus for Textual Semantic Relations	May 1, 2012	Community Question AnsweringInformation Retrieval	—Unverified
Linguagrid: a network of Linguistic and Semantic Services for the Italian Language.	May 1, 2012	ClusteringDependency Parsing	—Unverified
Parsing Any Domain English text to CoNLL dependencies	May 1, 2012	BenchmarkingDependency Parsing	—Unverified
Chinese Whispers: Cooperative Paraphrase Acquisition	May 1, 2012	Machine TranslationNatural Language Inference	—Unverified
Constraint Based Description of Polish Multiword Expressions	May 1, 2012	Machine TranslationMorphological Analysis	—Unverified
Evaluating Multi-focus Natural Language Queries over Data Services	May 1, 2012	Natural Language QueriesQuestion Answering	—Unverified
Collecting humorous expressions from a community-based question-answering-service corpus	May 1, 2012	Question Answering	—Unverified
P\'agico: Evaluating Wikipedia-based information retrieval in Portuguese	May 1, 2012	Cultural Vocal Bursts Intensity PredictionInformation Retrieval	—Unverified
Linguistic Resources for Entity Linking Evaluation: from Monolingual to Cross-lingual	May 1, 2012	Cross-Lingual Entity LinkingEntity Linking	—Unverified
Kitten: a tool for normalizing HTML and extracting its textual content	May 1, 2012	Language ModellingQuestion Answering	—Unverified
Applying Random Indexing to Structured Data to Find Contextually Similar Words	May 1, 2012	Question Answering	—Unverified
A corpus of general and specific sentences from news	May 1, 2012	ArticlesGeneral Classification	—Unverified
Evaluating Machine Reading Systems through Comprehension Tests	May 1, 2012	Answer SelectionMultiple-choice	—Unverified
Creation and use of Language Resources in a Question-Answering eHealth System	May 1, 2012	Document SummarizationEpidemiology	—Unverified
Automatically Extracting Procedural Knowledge from Instructional Texts using Natural Language Processing	May 1, 2012	Question Answering	—Unverified
Building and Exploring Semantic Equivalences Resources	May 1, 2012	Information RetrievalOpinion Mining	—Unverified
Constructing Large Proposition Databases	May 1, 2012	Dependency ParsingMachine Translation	—Unverified
Adding Morpho-semantic Relations to the Romanian Wordnet	May 1, 2012	Information RetrievalQuestion Answering	—Unverified
Polaris: Lymba's Semantic Parser	May 1, 2012	Question AnsweringRelation Extraction	—Unverified
Annotating Opinions in German Political News	May 1, 2012	BIG-bench Machine LearningOpinion Mining	—Unverified
Identifying Nuggets of Information in GALE Distillation Evaluation	May 1, 2012	Machine TranslationQuestion Answering	—Unverified
Propbank-Br: a Brazilian Treebank annotated with semantic role labels	May 1, 2012	Machine TranslationQuestion Answering	—Unverified
Assessing Crowdsourcing Quality through Objective Tasks	May 1, 2012	Entity ResolutionQuestion Answering	—Unverified
DBpedia: A Multilingual Cross-domain Knowledge Base	May 1, 2012	Entity LinkingQuestion Answering	—Unverified
Automatic lexical semantic classification of nouns	May 1, 2012	ClassificationEntity Typing	—Unverified
MLSA --- A Multi-layered Reference Corpus for German Sentiment Analysis	May 1, 2012	Opinion MiningQuestion Answering	—Unverified
An English-Portuguese parallel corpus of questions: translation guidelines and application in SMT	May 1, 2012	Machine TranslationQuestion Answering	—Unverified
DISLOG: A logic-based language for processing discourse structures	May 1, 2012	Machine TranslationQuestion Answering	—Unverified
QurAna: Corpus of the Quran annotated with Pronominal Anaphora	May 1, 2012	Coreference ResolutionInformation Retrieval	—Unverified
Treebanking by Sentence and Tree Transformation: Building a Treebank to support Question Answering in Portuguese	May 1, 2012	Question AnsweringSentence	—Unverified
SUTime: A library for recognizing and normalizing time expressions	May 1, 2012	Question AnsweringRelation Extraction	—Unverified
Visualizing Sentiment Analysis on a User Forum	May 1, 2012	Opinion MiningQuestion Answering	—Unverified
The TARSQI Toolkit	May 1, 2012	Question Answering	—Unverified
Turk Bootstrap Word Sense Inventory 2.0: A Large-Scale Resource for Lexical Substitution	May 1, 2012	Machine TranslationQuestion Answering	—Unverified
TIMEN: An Open Temporal Expression Normalisation Resource	May 1, 2012	Information RetrievalKnowledge Base Population	CodeCode Available
KBGen -- Text Generation from Knowledge Bases as a New Shared Task	May 1, 2012	Question AnsweringText Generation	—Unverified
Interactive Natural Language Query Construction for Report Generation	May 1, 2012	Question AnsweringText Generation	—Unverified
Methods Combination and ML-based Re-ranking of Multiple Hypothesis for Question-Answering Systems	Apr 1, 2012	Information RetrievalQuestion Answering	—Unverified
Experiments on Hybrid Corpus-Based Sentiment Lexicon Acquisition	Apr 1, 2012	Document ClassificationQuestion Answering	—Unverified
Looking at word meaning. An interactive visualization of Semantic Vector Spaces for Dutch synsets	Apr 1, 2012	Question AnsweringWord Sense Disambiguation	—Unverified
Coupling Knowledge-Based and Data-Driven Systems for Named Entity Recognition	Apr 1, 2012	Information Retrievalnamed-entity-recognition	—Unverified

Show:10 25 50

← PrevPage 216 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified