General Knowledge

This task aims to evaluate the ability of a model to answer general-knowledge questions.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–125 of 399 papers

Title	Date	Tasks	Status	Hype	Score
Knowledge Graph Contrastive Learning for Recommendation	May 2, 2022	Contrastive LearningGeneral Knowledge	CodeCode Available	1	5
The Unreasonable Effectiveness of Easy Training Data for Hard Tasks	Jan 12, 2024	General KnowledgeIn-Context Learning	CodeCode Available	1	5
RAD: A Comprehensive Dataset for Benchmarking the Robustness of Image Anomaly Detection	Jun 11, 2024	Anomaly DetectionBenchmarking	CodeCode Available	1	5
Large Pre-trained Language Models Contain Human-like Biases of What is Right and Wrong to Do	Mar 8, 2021	General Knowledge	CodeCode Available	1	5
Towards Task Sampler Learning for Meta-Learning	Jul 18, 2023	DiversityFew-Shot Learning	CodeCode Available	1	5
SAME: Learning Generic Language-Guided Visual Navigation with State-Adaptive Mixture of Experts	Dec 7, 2024	General KnowledgeMixture-of-Experts	CodeCode Available	1	5
TaxoAdapt: Aligning LLM-Based Multidimensional Taxonomy Construction to Evolving Research Corpora	Jun 12, 2025	General Knowledge	CodeCode Available	1	5
A New Learning Paradigm for Foundation Model-based Remote Sensing Change Detection	Dec 2, 2023	Building change detection for remote sensing imagesChange Detection	CodeCode Available	1	5
PELMS: Pre-training for Effective Low-Shot Multi-Document Summarization	Nov 16, 2023	Document SummarizationGeneral Knowledge	CodeCode Available	0	5
Patching as Translation: the Data and the Metaphor	Aug 24, 2020	General KnowledgeProgram Repair	CodeCode Available	0	5
Planning Safety Trajectories with Dual-Phase, Physics-Informed, and Transportation Knowledge-Driven Large Language Models	Apr 6, 2025	Computational EfficiencyGeneral Knowledge	CodeCode Available	0	5
Are Large Language Models a Good Replacement of Taxonomies?	Jun 17, 2024	General KnowledgeKnowledge Graphs	CodeCode Available	0	5
Molecular Graph Representation Learning Integrating Large Language Models with Domain-specific Small Models	Aug 19, 2024	DescriptiveDrug Discovery	CodeCode Available	0	5
Efficient Transfer Learning for Video-language Foundation Models	Nov 18, 2024	Action RecognitionFew-Shot Learning	CodeCode Available	0	5
Efficient Relation-aware Neighborhood Aggregation in Graph Neural Networks via Tensor Decomposition	Dec 11, 2022	Contrastive LearningGeneral Knowledge	CodeCode Available	0	5
Effective Skill Unlearning through Intervention and Abstention	Mar 27, 2025	General KnowledgeMath	CodeCode Available	0	5
MM-Eval: A Hierarchical Benchmark for Modern Mongolian Evaluation in LLMs	Nov 14, 2024	General KnowledgeMath	CodeCode Available	0	5
Can ChatGPT Enable ITS? The Case of Mixed Traffic Control via Reinforcement Learning	Jun 13, 2023	General KnowledgeManagement	CodeCode Available	0	5
Pruning neural network models for gene regulatory dynamics using data and domain knowledge	Mar 5, 2024	General KnowledgeNetwork Pruning	CodeCode Available	0	5
BnMMLU: Measuring Massive Multitask Language Understanding in Bengali	May 25, 2025	General KnowledgeMMLU	CodeCode Available	0	5
Leveraging Large Language Models for Automated Dialogue Analysis	Sep 12, 2023	General KnowledgeLanguage Modeling	CodeCode Available	0	5
Domain Generalization via Model-Agnostic Learning of Semantic Features	Oct 29, 2019	Domain GeneralizationGeneral Knowledge	CodeCode Available	0	5
Learning to Understand Phrases by Embedding the Dictionary	Apr 2, 2015	General Knowledge	CodeCode Available	0	5
Eraser: Jailbreaking Defense in Large Language Models via Unlearning Harmful Knowledge	Apr 8, 2024	General KnowledgeSafety Alignment	CodeCode Available	0	5
Learning to Learn Variational Semantic Memory	Oct 20, 2020	Few-Shot LearningGeneral Knowledge	CodeCode Available	0	5

Show:10 25 50

← PrevPage 5 of 16Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Chinchilla-70B (few-shot, k=5)	Accuracy	94.3	—	Unverified
2	Gopher-280B (few-shot, k=5)	Accuracy	93.9	—	Unverified
3	Chinchilla-70B (few-shot, k=5)	Accuracy	85.7	—	Unverified
4	Gopher-280B (few-shot, k=5)	Accuracy	84.8	—	Unverified
5	Gopher-280B (few-shot, k=5)	Accuracy	84.2	—	Unverified
6	Gopher-280B (few-shot, k=5)	Accuracy	84.1	—	Unverified
7	Gopher-280B (few-shot, k=5)	Accuracy	83.9	—	Unverified
8	Gopher-280B (few-shot, k=5)	Accuracy	83.3	—	Unverified
9	Gopher-280B (few-shot, k=5)	Accuracy	81.8	—	Unverified
10	Gopher-280B (few-shot, k=5)	Accuracy	81	—	Unverified