Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9876–9900 of 10817 papers

Title	Date	Tasks	Status
NUIG-UNLP at SemEval-2016 Task 13: A Simple Word Embedding-based Approach for Taxonomy Extraction	Jun 1, 2016	Natural Language InferenceQuestion Answering	—Unverified
Overfitting at SemEval-2016 Task 3: Detecting Semantically Similar Questions in Community Question Answering Forums with Word Embeddings	Jun 1, 2016	Community Question AnsweringQuestion Answering	—Unverified
MTE-NN at SemEval-2016 Task 3: Can Machine Translation Evaluation Help Community Question Answering?	Jun 1, 2016	Community Question AnsweringLearning-To-Rank	—Unverified
ICL00 at SemEval-2016 Task 3: Translation-Based Method for CQA System	Jun 1, 2016	Community Question AnsweringQuestion Answering	—Unverified
IISCNLP at SemEval-2016 Task 2: Interpretable STS with ILP based Multiple Chunk Aligner	Jun 1, 2016	Information RetrievalQuestion Answering	—Unverified
Amrita\_CEN at SemEval-2016 Task 1: Semantic Relation from Word Embeddings in Higher Dimension	Jun 1, 2016	Information RetrievalMachine Translation	—Unverified
KeLP at SemEval-2016 Task 3: Learning Semantic Relations between Questions and Answers	Jun 1, 2016	Community Question AnsweringQuestion Answering	—Unverified
QU-IR at SemEval 2016 Task 3: Learning to Rank on Arabic Community Question Answering Forums with Word Embedding	Jun 1, 2016	Community Question AnsweringLearning-To-Rank	—Unverified
ConvKN at SemEval-2016 Task 3: Answer and Question Selection for Question Answering on Arabic and English Fora	Jun 1, 2016	Community Question AnsweringFeature Engineering	—Unverified
BIT at SemEval-2016 Task 1: Sentence Similarity Based on Alignments and Vector with the Weight of Information Content	Jun 1, 2016	Information RetrievalMachine Translation	—Unverified
IHS-RD-Belarus at SemEval-2016 Task 1: Multistage Approach for Measuring Semantic Similarity	Jun 1, 2016	Information RetrievalMachine Translation	—Unverified
ITNLP-AiKF at SemEval-2016 Task 3 a quesiton answering system using community QA repository	Jun 1, 2016	Answer SelectionCommunity Question Answering	—Unverified
ECNU at SemEval-2016 Task 3: Exploring Traditional Method and Deep Learning Method for Question Retrieval and Answer Ranking in Community Question Answering	Jun 1, 2016	Community Question AnsweringQuestion Answering	—Unverified
PMI-cool at SemEval-2016 Task 3: Experiments with PMI and Goodness Polarity Lexicons for Community Question Answering	Jun 1, 2016	Community Question AnsweringQuestion Answering	—Unverified
ISCAS\_NLP at SemEval-2016 Task 1: Sentence Similarity Based on Support Vector Regression using Multiple Features	Jun 1, 2016	Information RetrievalMachine Translation	—Unverified
ECNU at SemEval-2016 Task 1: Leveraging Word Embedding From Macro and Micro Views to Boost Performance for Semantic Textual Similarity	Jun 1, 2016	Feature EngineeringMachine Translation	—Unverified
DLS@CU at SemEval-2016 Task 1: Supervised Models of Sentence Similarity	Jun 1, 2016	Machine TranslationNatural Language Inference	—Unverified
UMD-TTIC-UW at SemEval-2016 Task 1: Attention-Based Multi-Perspective Convolutional Neural Networks for Textual Similarity Measurement	Jun 1, 2016	Feature EngineeringQuestion Answering	—Unverified
SemEval-2016 Task 1: Semantic Textual Similarity, Monolingual and Cross-Lingual Evaluation	Jun 1, 2016	Machine TranslationNatural Language Inference	—Unverified
Samsung Poland NLP Team at SemEval-2016 Task 1: Necessity for diversity; combining recursive autoencoders, WordNet and ensemble methods to measure semantic similarity.	Jun 1, 2016	DiversityMachine Translation	—Unverified
SemEval-2016 Task 13: Taxonomy Extraction Evaluation (TExEval-2)	Jun 1, 2016	Natural Language InferenceQuestion Answering	—Unverified
UNIMELB at SemEval-2016 Tasks 4A and 4B: An Ensemble of Neural Networks and a Word2Vec Based Model for Sentiment Classification	Jun 1, 2016	Document ClassificationLanguage Modeling	CodeCode Available
UniMelb at SemEval-2016 Task 3: Identifying Similar Questions by combining a CNN with String Similarity Measures	Jun 1, 2016	Community Question AnsweringMachine Translation	—Unverified
SLS at SemEval-2016 Task 3: Neural-based Approaches for Ranking in Community Question Answering	Jun 1, 2016	Answer SelectionCommunity Question Answering	—Unverified
This is how we do it: Answer Reranking for Open-domain How Questions with Paragraph Vectors and Minimal Feature Engineering	Jun 1, 2016	Feature EngineeringQuestion Answering	—Unverified

Show:10 25 50

← PrevPage 396 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified