Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1801–1825 of 10817 papers

Title	Date	Tasks	Status	Hype	Score
AdaCAD: Adaptively Decoding to Balance Conflicts between Contextual and Parametric Knowledge	Sep 11, 2024	Language ModellingLarge Language Model	CodeCode Available	1	5
Large Language Models are Temporal and Causal Reasoners for Video Question Answering	Oct 24, 2023	Natural Language UnderstandingQuestion Answering	CodeCode Available	1	5
Large Language Models Reflect the Ideology of their Creators	Oct 24, 2024	Question AnsweringText Summarization	CodeCode Available	1	5
Language Models are Unsupervised Multitask Learners	Feb 14, 2019	Common Sense ReasoningCoreference Resolution	CodeCode Available	1	5
Language Models as Science Tutors	Feb 16, 2024	GSM8KMath	CodeCode Available	1	5
CBench: Towards Better Evaluation of Question Answering Over Knowledge Graphs	Apr 5, 2021	BenchmarkingKnowledge Graphs	CodeCode Available	1	5
Language-Informed Visual Concept Learning	Dec 6, 2023	DisentanglementNovel Concepts	CodeCode Available	1	5
CBR-RAG: Case-Based Reasoning for Retrieval Augmented Generation in LLMs for Legal Question Answering	Apr 4, 2024	Language ModelingLanguage Modelling	CodeCode Available	1	5
Hyperlink-induced Pre-training for Passage Retrieval in Open-domain Question Answering	Mar 14, 2022	Open-Domain Question AnsweringPassage Retrieval	CodeCode Available	1	5
I2I: Initializing Adapters with Improvised Knowledge	Apr 4, 2023	Continual LearningQuestion Answering	CodeCode Available	1	5
CCQA: A New Web-Scale Question Answering Dataset for Model Pre-Training	Oct 14, 2021	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	1	5
Callee: Recovering Call Graphs for Binaries with Transfer and Contrastive Learning	Nov 2, 2021	Contrastive LearningQuestion Answering	CodeCode Available	1	5
CommonsenseQA: A Question Answering Challenge Targeting Commonsense Knowledge	Nov 2, 2018	Common Sense ReasoningMultiple-choice	CodeCode Available	1	5
Lever LM: Configuring In-Context Sequence to Lever Large Vision Language Models	Dec 15, 2023	Image CaptioningIn-Context Learning	CodeCode Available	1	5
IDA-VLM: Towards Movie Understanding via ID-Aware Large Vision-Language Model	Jul 10, 2024	Language ModelingLanguage Modelling	CodeCode Available	1	5
Cerbero-7B: A Leap Forward in Language-Specific LLMs Through Enhanced Chat Corpus Generation and Evaluation	Nov 27, 2023	DiversityLanguage Modelling	CodeCode Available	1	5
RUArt: A Novel Text-Centered Solution for Text-Based Visual Question Answering	Oct 24, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	1	5
RuBioRoBERTa: a pre-trained biomedical language model for Russian language biomedical text mining	Apr 8, 2022	Language ModelingLanguage Modelling	CodeCode Available	1	5
IGLUE: A Benchmark for Transfer Learning across Modalities, Tasks, and Languages	Jan 27, 2022	Cross-Modal RetrievalFew-Shot Learning	CodeCode Available	1	5
RuMedBench: A Russian Medical Language Understanding Benchmark	Jan 17, 2022	Medical Diagnosisnamed-entity-recognition	CodeCode Available	1	5
Are Deep Neural Networks SMARTer than Second Graders?	Dec 20, 2022	Language ModellingMeta-Learning	CodeCode Available	1	5
R-VQA: Learning Visual Relation Facts with Semantic Attention for Visual Question Answering	May 24, 2018	Question AnsweringRelation	CodeCode Available	1	5
Language Models Learn to Mislead Humans via RLHF	Sep 19, 2024	Question Answering	CodeCode Available	1	5
LaMPP: Language Models as Probabilistic Priors for Perception and Action	Feb 3, 2023	Activity RecognitionDecision Making	CodeCode Available	1	5
Combo of Thinking and Observing for Outside-Knowledge VQA	May 10, 2023	DecoderQuestion Answering	CodeCode Available	1	5

Show:10 25 50

← PrevPage 73 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified