Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4151–4200 of 10817 papers

Title	Date	Tasks	Status	Hype
Prompting Large Language Models with Speech Recognition Abilities	Jul 21, 2023	Abstractive Text SummarizationAutomatic Speech Recognition	—Unverified	0
MythQA: Query-Based Large-Scale Check-Worthy Claim Detection through Multi-Answer Open-Domain Question Answering	Jul 21, 2023	Fact CheckingMisinformation	CodeCode Available	0
Robust Visual Question Answering: Datasets, Methods, and Future Challenges	Jul 21, 2023	Question AnsweringVisual Question Answering	—Unverified	0
Generator-Retriever-Generator Approach for Open-Domain Question Answering	Jul 21, 2023	Language ModelingLanguage Modelling	CodeCode Available	1
UMLS-KGI-BERT: Data-Centric Knowledge Integration in Transformers for Biomedical Entity Recognition	Jul 20, 2023	Document Classificationnamed-entity-recognition	—Unverified	0
Investigating the Factual Knowledge Boundary of Large Language Models with Retrieval Augmentation	Jul 20, 2023	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	1
Towards Ontologically Grounded and Language-Agnostic Knowledge Graphs	Jul 20, 2023	Knowledge GraphsQuestion Answering	—Unverified	0
A reinforcement learning approach for VQA validation: an application to diabetic macular edema grading	Jul 19, 2023	Medical Image AnalysisQuestion Answering	—Unverified	0
Explaining Autonomous Driving Actions with Visual Question Answering	Jul 19, 2023	Autonomous DrivingAutonomous Vehicles	CodeCode Available	1
Traffic-Domain Video Question Answering with Automatic Captioning	Jul 18, 2023	Question AnsweringVideo Question Answering	—Unverified	0
Llama 2: Open Foundation and Fine-Tuned Chat Models	Jul 18, 2023	Arithmetic Reasoning	CodeCode Available	8
Does Circuit Analysis Interpretability Scale? Evidence from Multiple Choice Capabilities in Chinchilla	Jul 18, 2023	Multiple-choiceQuestion Answering	—Unverified	0
Generative Visual Question Answering	Jul 18, 2023	Generative Visual Question AnsweringQuestion Answering	—Unverified	0
Let's ViCE! Mimicking Human Cognitive Behavior in Image Generation Evaluation	Jul 18, 2023	Image GenerationQuestion Answering	—Unverified	0
Towards a performance analysis on pre-trained Visual Question Answering models for autonomous driving	Jul 18, 2023	Autonomous DrivingModel Selection	CodeCode Available	0
Question Decomposition Improves the Faithfulness of Model-Generated Reasoning	Jul 17, 2023	Question Answering	CodeCode Available	1
Extending the Frontier of ChatGPT: Code Generation and Debugging	Jul 17, 2023	Code GenerationQuestion Answering	—Unverified	0
PAT: Parallel Attention Transformer for Visual Question Answering in Vietnamese	Jul 17, 2023	Question AnsweringVietnamese Visual Question Answering	—Unverified	0
TableGPT: Towards Unifying Tables, Nature Language and Commands into One GPT	Jul 17, 2023	Data VisualizationQuestion Answering	—Unverified	0
Fast Quantum Algorithm for Attention Computation	Jul 16, 2023	Language ModelingLanguage Modelling	—Unverified	0
A Neural-Symbolic Approach Towards Identifying Grammatically Correct Sentences	Jul 16, 2023	ArticlesCoLA	—Unverified	0
Think-on-Graph: Deep and Responsible Reasoning of Large Language Model on Knowledge Graph	Jul 15, 2023	HallucinationKnowledge Graphs	CodeCode Available	2
Coupling Large Language Models with Logic Programming for Robust and General Reasoning from Text	Jul 15, 2023	Language ModelingLanguage Modelling	CodeCode Available	1
Sensi-BERT: Towards Sensitivity Driven Fine-Tuning for Parameter-Efficient BERT	Jul 14, 2023	QNLIQQP	—Unverified	0
A scoping review on multimodal deep learning in biomedical images and texts	Jul 14, 2023	Cross-Modal RetrievalDecision Making	—Unverified	0
DecompEval: Evaluating Generated Texts as Unsupervised Decomposed Question Answering	Jul 13, 2023	Dialogue Generationnlg evaluation	CodeCode Available	0
MegaWika: Millions of reports and their sources across 50 diverse languages	Jul 13, 2023	ArticlesCross-Lingual Question Answering	—Unverified	0
Prompt Generate Train (PGT): Few-shot Domain Adaption of Retrieval Augmented Generation Models for Open Book Question-Answering	Jul 12, 2023	Domain AdaptationGenerative Question Answering	—Unverified	0
PolyLM: An Open Source Polyglot Large Language Model	Jul 12, 2023	Language ModelingLanguage Modelling	—Unverified	0
Model Card and Evaluations for Claude Models	Jul 11, 2023	Arithmetic ReasoningBug fixing	—Unverified	0
CAT-ViL: Co-Attention Gated Vision-Language Embedding for Visual Question Localized-Answering in Robotic Surgery	Jul 11, 2023	Question AnsweringScene Understanding	CodeCode Available	1
One-Versus-Others Attention: Scalable Multimodal Integration for Biomedical Data	Jul 11, 2023	Autonomous DrivingQuestion Answering	CodeCode Available	1
EgoVLPv2: Egocentric Video-Language Pre-training with Fusion in the Backbone	Jul 11, 2023	Action RecognitionMoment Queries	CodeCode Available	1
Overview of BioASQ 2023: The eleventh BioASQ challenge on Large-Scale Biomedical Semantic Indexing and Question Answering	Jul 11, 2023	Question Answering	—Unverified	0
Emu: Generative Pretraining in Multimodality	Jul 11, 2023	Image CaptioningImage Generation	CodeCode Available	3
Rad-ReStruct: A Novel VQA Benchmark and Method for Structured Radiology Reporting	Jul 11, 2023	Medical Visual Question AnsweringQuestion Answering	CodeCode Available	1
BeaverTails: Towards Improved Safety Alignment of LLM via a Human-Preference Dataset	Jul 10, 2023	Question AnsweringSafety Alignment	CodeCode Available	1
Event Extraction as Question Generation and Answering	Jul 10, 2023	Event ExtractionQuestion Answering	CodeCode Available	1
Enhancing Biomedical Text Summarization and Question-Answering: On the Utility of Domain-Specific Pre-Training	Jul 10, 2023	Language ModelingLanguage Modelling	—Unverified	0
Multi-granularity Temporal Question Answering over Knowledge Graphs	Jul 9, 2023	Knowledge GraphsQuestion Answering	CodeCode Available	1
Self-Adaptive Sampling for Efficient Video Question-Answering on Image--Text Models	Jul 9, 2023	Question AnsweringTGIF-Frame	CodeCode Available	1
SVIT: Scaling up Visual Instruction Tuning	Jul 9, 2023	DiversityImage Captioning	CodeCode Available	3
Answering Ambiguous Questions via Iterative Prompting	Jul 8, 2023	DiversityOpen-Domain Question Answering	CodeCode Available	1
Reading Between the Lanes: Text VideoQA on the Road	Jul 8, 2023	Question AnsweringScene Text Recognition	CodeCode Available	0
TRAQ: Trustworthy Retrieval Augmented Question Answering via Conformal Prediction	Jul 7, 2023	Bayesian OptimizationChatbot	CodeCode Available	0
Read, Look or Listen? What's Needed for Solving a Multimodal Dataset	Jul 6, 2023	Question AnsweringSpeaker Identification	—Unverified	0
CORE-GPT: Combining Open Access research and large language models for credible, trustworthy question answering	Jul 6, 2023	ArticlesQuestion Answering	CodeCode Available	0
Structure Guided Multi-modal Pre-trained Transformer for Knowledge Graph Reasoning	Jul 6, 2023	Knowledge GraphsQuestion Answering	—Unverified	0
VisKoP: Visual Knowledge oriented Programming for Interactive Knowledge Base Question Answering	Jul 6, 2023	Knowledge Base Question AnsweringProgram induction	—Unverified	0
Improving Retrieval-Augmented Large Language Models via Data Importance Learning	Jul 6, 2023	ImputationQuestion Answering	CodeCode Available	1

Show:10 25 50

← PrevPage 84 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified