General Knowledge

This task aims to evaluate the ability of a model to answer general-knowledge questions.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 251–300 of 399 papers

Title	Date	Tasks	Status
Microsoft Cloud-based Digitization Workflow with Rich Metadata Acquisition for Cultural Heritage Objects	Jul 9, 2024	General Knowledge	—Unverified
Colo-SCRL: Self-Supervised Contrastive Representation Learning for Colonoscopic Video Retrieval	Mar 28, 2023	Action RecognitionContrastive Learning	—Unverified
TURNER: The Uncertainty-based Retrieval Framework for Chinese NER	Feb 18, 2022	General KnowledgeNER	—Unverified
Collective inference of the truth of propositions from crowd probability judgments	Jan 9, 2025	General Knowledge	—Unverified
MobiEdit: Resource-efficient Knowledge Editing for Personalized On-device LLMs	Jun 5, 2025	General Knowledgeknowledge editing	—Unverified
MoColl: Agent-Based Specific and General Model Collaboration for Image Captioning	Jan 3, 2025	DiagnosticGeneral Knowledge	—Unverified
Model Compression with Two-stage Multi-teacher Knowledge Distillation for Web Question Answering System	Oct 18, 2019	General KnowledgeKnowledge Distillation	—Unverified
Understanding Inequality of LLM Fact-Checking over Geographic Regions with Agent and Retrieval models	Mar 28, 2025	Fact CheckingGeneral Knowledge	—Unverified
Mol-LLaMA: Towards General Understanding of Molecules in Large Molecular Language Model	Feb 19, 2025	Drug DiscoveryGeneral Knowledge	—Unverified
MoSLD: An Extremely Parameter-Efficient Mixture-of-Shared LoRAs for Multi-Task Learning	Dec 12, 2024	Domain GeneralizationGeneral Knowledge	—Unverified
MoST: Multi-modality Scene Tokenization for Motion Prediction	Apr 30, 2024	General Knowledgemotion prediction	—Unverified
Motif-Based Prompt Learning for Universal Cross-Domain Recommendation	Oct 20, 2023	General KnowledgeMulti-Task Learning	—Unverified
Collaborative ontology sharing and editing	May 30, 2013	General Knowledge	—Unverified
Multilingual Tourist Assistance using ChatGPT: Comparing Capabilities in Hindi, Telugu, and Kannada	Jul 28, 2023	General KnowledgeLanguage Modeling	—Unverified
Multi-task Federated Learning with Encoder-Decoder Structure: Enabling Collaborative Learning Across Different Tasks	Apr 14, 2025	DecoderFederated Learning	—Unverified
Multi-View Feature Representation for Dialogue Generation with Bidirectional Distillation	Feb 22, 2021	Dialogue GenerationGeneral Knowledge	—Unverified
Neural Discourse Relation Recognition with Semantic Memory	Mar 12, 2016	General KnowledgeRelation	—Unverified
Neural Regularized Domain Adaptation for Chinese Word Segmentation	Dec 1, 2017	Chinese Word SegmentationDomain Adaptation	—Unverified
Shifted Autoencoders for Point Annotation Restoration in Object Counting	Dec 12, 2023	General KnowledgeObject	—Unverified
Universal Item Tokenization for Transferable Generative Recommendation	Apr 6, 2025	General KnowledgeLarge Language Model	—Unverified
Nudging: Inference-time Alignment of LLMs via Guided Decoding	Oct 11, 2024	General KnowledgeGSM8K	—Unverified
Can LVLMs Obtain a Driver's License? A Benchmark Towards Reliable AGI for Autonomous Driving	Sep 4, 2024	Autonomous DrivingDecision Making	—Unverified
One to Many: Adaptive Instrument Segmentation via Meta Learning and Dynamic Online Adaptation in Robotic Surgical Video	Mar 24, 2021	General KnowledgeMeta-Learning	—Unverified
On the Usage of Continual Learning for Out-of-Distribution Generalization in Pre-trained Language Models of Code	May 6, 2023	Continual LearningGeneral Knowledge	—Unverified
Organizing Linked Data Quality Related Methods	May 30, 2013	General Knowledge	—Unverified
Out of the Box: Reasoning with Graph Convolution Nets for Factual Visual Question Answering	Nov 1, 2018	Factual Visual Question AnsweringGeneral Knowledge	—Unverified
Learning Electromagnetic Metamaterial Physics With ChatGPT	Apr 23, 2024	General Knowledge	—Unverified
A Joint Planning and Learning Framework for Human-Aided Decision-Making	Jun 17, 2019	Decision MakingGeneral Knowledge	—Unverified
CALM: Unleashing the Cross-Lingual Self-Aligning Ability of Language Model Question Answering	Jan 30, 2025	General KnowledgeLanguage Modeling	—Unverified
Bridge-Coder: Unlocking LLMs' Potential to Overcome Language Gaps in Low-Resource Code	Oct 24, 2024	General KnowledgeIn-Context Learning	—Unverified
PASH at TREC 2021 Deep Learning Track: Generative Enhanced Model for Multi-stage Ranking	May 18, 2022	Deep LearningGeneral Knowledge	—Unverified
PASS-FC: Progressive and Adaptive Search Scheme for Fact Checking of Comprehensive Claims	Apr 14, 2025	Fact CheckingGeneral Knowledge	—Unverified
What Would You Ask When You First Saw a^2+b^2=c^2? Evaluating LLM on Curiosity-Driven Questioning	Sep 19, 2024	General Knowledge	—Unverified
Utilisation d'une base de connaissances de sp\'ecialit\'e et de sens commun pour la simplification de comptes-rendus radiologiques (Radiological text simplification using a general knowledge base)	May 1, 2018	General KnowledgeText Simplification	—Unverified
PhD Knowledge Not Required: A Reasoning Challenge for Large Language Models	Feb 3, 2025	General Knowledge	—Unverified
Pilot: Building the Federated Multimodal Instruction Tuning Framework	Jan 23, 2025	General Knowledge	—Unverified
Video Question Answering Using CLIP-Guided Visual-Text Attention	Mar 6, 2023	General KnowledgeQuestion Answering	—Unverified
Bootstrapping Cognitive Agents with a Large Language Model	Feb 25, 2024	General KnowledgeLanguage Modeling	—Unverified
PoE: a Panel of Experts for Generalized Automatic Dialogue Assessment	Dec 18, 2022	Data AugmentationDialogue Evaluation	—Unverified
Boosting LLM Translation Skills without General Ability Loss via Rationale Distillation	Oct 17, 2024	General KnowledgeInstruction Following	—Unverified
Biomedical Large Languages Models Seem not to be Superior to Generalist Models on Unseen Medical Data	Aug 25, 2024	Document SummarizationGeneral Knowledge	—Unverified
BinBert: Binary Code Understanding with a Fine-tunable and Execution-aware Transformer	Aug 13, 2022	General Knowledge	—Unverified
Pretraining and Updates of Domain-Specific LLM: A Case Study in the Japanese Business Domain	Apr 12, 2024	Continual PretrainingGeneral Knowledge	—Unverified
Bilingual Evaluation of Language Models on General Knowledge in University Entrance Exams with Minimal Contamination	Sep 19, 2024	General KnowledgeMMLU	—Unverified
Proceedings of the ISCA/ITG Workshop on Diversity in Large Speech and Language Models	Mar 12, 2025	DiversityGeneral Knowledge	—Unverified
Profit: Benchmarking Personalization and Robustness Trade-off in Federated Prompt Tuning	Oct 6, 2023	BenchmarkingFederated Learning	—Unverified
PMoE: Progressive Mixture of Experts with Asymmetric Transformer for Continual Learning	Jul 31, 2024	Continual LearningGeneral Knowledge	—Unverified
Benchmarking Generative Models on Computational Thinking Tests in Elementary Visual Programming	Jun 14, 2024	BenchmarkingGeneral Knowledge	—Unverified
Prompting Encoder Models for Zero-Shot Classification: A Cross-Domain Study in Italian	Jul 30, 2024	Document ClassificationEntity Typing	—Unverified
BAPO: Base-Anchored Preference Optimization for Overcoming Forgetting in Large Language Models Personalization	Jun 30, 2024	Continual LearningGeneral Knowledge	—Unverified

Show:10 25 50

← PrevPage 6 of 8Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Chinchilla-70B (few-shot, k=5)	Accuracy	94.3	—	Unverified
2	Gopher-280B (few-shot, k=5)	Accuracy	93.9	—	Unverified
3	Chinchilla-70B (few-shot, k=5)	Accuracy	85.7	—	Unverified
4	Gopher-280B (few-shot, k=5)	Accuracy	84.8	—	Unverified
5	Gopher-280B (few-shot, k=5)	Accuracy	84.2	—	Unverified
6	Gopher-280B (few-shot, k=5)	Accuracy	84.1	—	Unverified
7	Gopher-280B (few-shot, k=5)	Accuracy	83.9	—	Unverified
8	Gopher-280B (few-shot, k=5)	Accuracy	83.3	—	Unverified
9	Gopher-280B (few-shot, k=5)	Accuracy	81.8	—	Unverified
10	Gopher-280B (few-shot, k=5)	Accuracy	81	—	Unverified