General Knowledge

This task aims to evaluate the ability of a model to answer general-knowledge questions.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 301–350 of 399 papers

Title	Date	Tasks	Status
Transformer Based Bengali Chatbot Using General Knowledge Dataset	Nov 6, 2021	ChatbotDecoder	—Unverified
TRIM: Token Reduction and Inference Modeling for Cost-Effective Language Generation	Dec 10, 2024	General KnowledgeText Generation	—Unverified
TURNER: The Uncertainty-based Retrieval Framework for Chinese NER	Feb 18, 2022	General KnowledgeNER	—Unverified
Understanding Inequality of LLM Fact-Checking over Geographic Regions with Agent and Retrieval models	Mar 28, 2025	Fact CheckingGeneral Knowledge	—Unverified
Universal Item Tokenization for Transferable Generative Recommendation	Apr 6, 2025	General KnowledgeLarge Language Model	—Unverified
Utilisation d'une base de connaissances de sp\'ecialit\'e et de sens commun pour la simplification de comptes-rendus radiologiques (Radiological text simplification using a general knowledge base)	May 1, 2018	General KnowledgeText Simplification	—Unverified
Video Question Answering Using CLIP-Guided Visual-Text Attention	Mar 6, 2023	General KnowledgeQuestion Answering	—Unverified
ViKiNG: Vision-Based Kilometer-Scale Navigation with Geographic Hints	Feb 23, 2022	3D ReconstructionGeneral Knowledge	—Unverified
Vision-Language Modeling Meets Remote Sensing: Models, Datasets and Perspectives	May 20, 2025	Caption GenerationContrastive Learning	—Unverified
Visual Question Answering as Reading Comprehension	Nov 29, 2018	Common Sense ReasoningGeneral Knowledge	—Unverified
VLM Q-Learning: Aligning Vision-Language Models for Interactive Decision-Making	May 6, 2025	Decision MakingGeneral Knowledge	—Unverified
What's a Good Prediction? Challenges in evaluating an agent's knowledge	Jan 23, 2020	Continual LearningGeneral Knowledge	—Unverified
What Would You Ask When You First Saw a^2+b^2=c^2? Evaluating LLM on Curiosity-Driven Questioning	Sep 19, 2024	General Knowledge	—Unverified
When Life gives you LLMs, make LLM-ADE: Large Language Models with Adaptive Data Engineering	Apr 19, 2024	General Knowledge	—Unverified
"When Words Fail, Emojis Prevail": Generating Sarcastic Utterances with Emoji Using Valence Reversal and Semantic Incongruity	May 6, 2023	General KnowledgeSentence	—Unverified
MobiEdit: Resource-efficient Knowledge Editing for Personalized On-device LLMs	Jun 5, 2025	General Knowledgeknowledge editing	—Unverified
MoColl: Agent-Based Specific and General Model Collaboration for Image Captioning	Jan 3, 2025	DiagnosticGeneral Knowledge	—Unverified
Model Compression with Two-stage Multi-teacher Knowledge Distillation for Web Question Answering System	Oct 18, 2019	General KnowledgeKnowledge Distillation	—Unverified
Mol-LLaMA: Towards General Understanding of Molecules in Large Molecular Language Model	Feb 19, 2025	Drug DiscoveryGeneral Knowledge	—Unverified
MoSLD: An Extremely Parameter-Efficient Mixture-of-Shared LoRAs for Multi-Task Learning	Dec 12, 2024	Domain GeneralizationGeneral Knowledge	—Unverified
MoST: Multi-modality Scene Tokenization for Motion Prediction	Apr 30, 2024	General Knowledgemotion prediction	—Unverified
Motif-Based Prompt Learning for Universal Cross-Domain Recommendation	Oct 20, 2023	General KnowledgeMulti-Task Learning	—Unverified
Multilingual Tourist Assistance using ChatGPT: Comparing Capabilities in Hindi, Telugu, and Kannada	Jul 28, 2023	General KnowledgeLanguage Modeling	—Unverified
Multi-task Federated Learning with Encoder-Decoder Structure: Enabling Collaborative Learning Across Different Tasks	Apr 14, 2025	DecoderFederated Learning	—Unverified
Multi-View Feature Representation for Dialogue Generation with Bidirectional Distillation	Feb 22, 2021	Dialogue GenerationGeneral Knowledge	—Unverified
Neural Discourse Relation Recognition with Semantic Memory	Mar 12, 2016	General KnowledgeRelation	—Unverified
Neural Regularized Domain Adaptation for Chinese Word Segmentation	Dec 1, 2017	Chinese Word SegmentationDomain Adaptation	—Unverified
Shifted Autoencoders for Point Annotation Restoration in Object Counting	Dec 12, 2023	General KnowledgeObject	—Unverified
Nudging: Inference-time Alignment of LLMs via Guided Decoding	Oct 11, 2024	General KnowledgeGSM8K	—Unverified
One to Many: Adaptive Instrument Segmentation via Meta Learning and Dynamic Online Adaptation in Robotic Surgical Video	Mar 24, 2021	General KnowledgeMeta-Learning	—Unverified
On the Usage of Continual Learning for Out-of-Distribution Generalization in Pre-trained Language Models of Code	May 6, 2023	Continual LearningGeneral Knowledge	—Unverified
Organizing Linked Data Quality Related Methods	May 30, 2013	General Knowledge	—Unverified
Out of the Box: Reasoning with Graph Convolution Nets for Factual Visual Question Answering	Nov 1, 2018	Factual Visual Question AnsweringGeneral Knowledge	—Unverified
A Joint Planning and Learning Framework for Human-Aided Decision-Making	Jun 17, 2019	Decision MakingGeneral Knowledge	—Unverified
PASH at TREC 2021 Deep Learning Track: Generative Enhanced Model for Multi-stage Ranking	May 18, 2022	Deep LearningGeneral Knowledge	—Unverified
Luminoso at SemEval-2018 Task 10: Distinguishing Attributes Using Text Corpora and Relational Knowledge	Jun 5, 2018	General KnowledgeRelation Extraction	CodeCode Available
MM-Eval: A Hierarchical Benchmark for Modern Mongolian Evaluation in LLMs	Nov 14, 2024	General KnowledgeMath	CodeCode Available
Leveraging Large Language Models for Automated Dialogue Analysis	Sep 12, 2023	General KnowledgeLanguage Modeling	CodeCode Available
Eraser: Jailbreaking Defense in Large Language Models via Unlearning Harmful Knowledge	Apr 8, 2024	General KnowledgeSafety Alignment	CodeCode Available
Efficient Transfer Learning for Video-language Foundation Models	Nov 18, 2024	Action RecognitionFew-Shot Learning	CodeCode Available
Unveiling Causal Reasoning in Large Language Models: Reality or Mirage?	Jun 26, 2025	counterfactualGeneral Knowledge	CodeCode Available
Molecular Graph Representation Learning Integrating Large Language Models with Domain-specific Small Models	Aug 19, 2024	DescriptiveDrug Discovery	CodeCode Available
Task-Driven and Experience-Based Question Answering Corpus for In-Home Robot Application in the House3D Virtual Environment	Jun 1, 2022	General KnowledgeQuestion Answering	CodeCode Available
ContextFlow++: Generalist-Specialist Flow-based Generative Models with Mixed-Variable Context Encoding	Jun 2, 2024	Anomaly DetectionDensity Estimation	CodeCode Available
BnMMLU: Measuring Massive Multitask Language Understanding in Bengali	May 25, 2025	General KnowledgeMMLU	CodeCode Available
Avoiding Copyright Infringement via Large Language Model Unlearning	Jun 16, 2024	General KnowledgeLanguage Modeling	CodeCode Available
Learning to Understand Phrases by Embedding the Dictionary	Apr 2, 2015	General Knowledge	CodeCode Available
Efficient Relation-aware Neighborhood Aggregation in Graph Neural Networks via Tensor Decomposition	Dec 11, 2022	Contrastive LearningGeneral Knowledge	CodeCode Available
GenKnowSub: Improving Modularity and Reusability of LLMs through General Knowledge Subtraction	May 16, 2025	General KnowledgeZero-shot Generalization	CodeCode Available
SciDeBERTa: Learning DeBERTa for Science Technology Documents and Fine-Tuning Information Extraction Tasks	Jun 8, 2022	General KnowledgeJoint Entity and Relation Extraction	CodeCode Available

Show:10 25 50

← PrevPage 7 of 8Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Chinchilla-70B (few-shot, k=5)	Accuracy	94.3	—	Unverified
2	Gopher-280B (few-shot, k=5)	Accuracy	93.9	—	Unverified
3	Chinchilla-70B (few-shot, k=5)	Accuracy	85.7	—	Unverified
4	Gopher-280B (few-shot, k=5)	Accuracy	84.8	—	Unverified
5	Gopher-280B (few-shot, k=5)	Accuracy	84.2	—	Unverified
6	Gopher-280B (few-shot, k=5)	Accuracy	84.1	—	Unverified
7	Gopher-280B (few-shot, k=5)	Accuracy	83.9	—	Unverified
8	Gopher-280B (few-shot, k=5)	Accuracy	83.3	—	Unverified
9	Gopher-280B (few-shot, k=5)	Accuracy	81.8	—	Unverified
10	Gopher-280B (few-shot, k=5)	Accuracy	81	—	Unverified