General Knowledge

This task aims to evaluate the ability of a model to answer general-knowledge questions.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 26–50 of 399 papers

Title	Date	Tasks	Status	Hype	Score
Keeping Yourself is Important in Downstream Tuning Multimodal Large Language Model	Mar 6, 2025	General KnowledgeImage Captioning	CodeCode Available	2	5
F-LMM: Grounding Frozen Large Multimodal Models	Jun 9, 2024	General KnowledgeInstruction Following	CodeCode Available	2	5
LLM-RG4: Flexible and Factual Radiology Report Generation across Diverse Input Contexts	Dec 16, 2024	General KnowledgeInstruction Following	CodeCode Available	2	5
Exploring the Potential of Large Language Models (LLMs) in Learning on Graphs	Jul 7, 2023	General KnowledgeNode Classification	CodeCode Available	2	5
GeoGalactica: A Scientific Large Language Model in Geoscience	Dec 31, 2023	Document ClassificationGeneral Knowledge	CodeCode Available	1	5
Generic Knowledge Boosted Pre-training For Remote Sensing Images	Jan 9, 2024	Change DetectionDeep Learning	CodeCode Available	1	5
GKD: A General Knowledge Distillation Framework for Large-scale Pre-trained Language Model	Jun 11, 2023	General KnowledgeKnowledge Distillation	CodeCode Available	1	5
FuseChat-3.0: Preference Optimization Meets Heterogeneous Model Fusion	Mar 6, 2025	General KnowledgeInstruction Following	CodeCode Available	1	5
A Dual-Space Framework for General Knowledge Distillation of Large Language Models	Apr 15, 2025	Code GenerationGeneral Knowledge	CodeCode Available	1	5
Generative Pre-Training from Molecules	Sep 16, 2021	Feature EngineeringGeneral Knowledge	CodeCode Available	1	5
Go From the General to the Particular: Multi-Domain Translation with Domain Transformation Networks	Nov 22, 2019	DecoderGeneral Knowledge	CodeCode Available	1	5
A New Learning Paradigm for Foundation Model-based Remote Sensing Change Detection	Dec 2, 2023	Building change detection for remote sensing imagesChange Detection	CodeCode Available	1	5
Decoupling General and Personalized Knowledge in Federated Learning via Additive and Low-Rank Decomposition	Jun 28, 2024	Federated LearningGeneral Knowledge	CodeCode Available	1	5
DA-Ada: Learning Domain-Aware Adapter for Domain Adaptive Object Detection	Oct 11, 2024	General Knowledgeobject-detection	CodeCode Available	1	5
Bert4XMR: Cross-Market Recommendation with Bidirectional Encoder Representations from Transformer	May 24, 2023	General KnowledgeTransfer Learning	CodeCode Available	1	5
DIAGen: Diverse Image Augmentation with Generative Models	Aug 26, 2024	Data AugmentationGeneral Knowledge	CodeCode Available	1	5
DomainRAG: A Chinese Benchmark for Evaluating Domain-specific Retrieval-Augmented Generation	Jun 9, 2024	Common Sense ReasoningDenoising	CodeCode Available	1	5
HAE-RAE Bench: Evaluation of Korean Knowledge in Language Models	Sep 6, 2023	General KnowledgeLogical Reasoning	CodeCode Available	1	5
Benchmarking Large Language Models for Persian: A Preliminary Study Focusing on ChatGPT	Apr 3, 2024	BenchmarkingGeneral Knowledge	CodeCode Available	1	5
BEAR: A Unified Framework for Evaluating Relational Knowledge in Causal and Masked Language Models	Apr 5, 2024	Factual probeGeneral Knowledge	CodeCode Available	1	5
BEAMetrics: A Benchmark for Language Generation Evaluation Evaluation	Oct 18, 2021	General KnowledgeInformativeness	CodeCode Available	1	5
E2Map: Experience-and-Emotion Map for Self-Reflective Robot Navigation with Language Models	Sep 16, 2024	General KnowledgeRobot Navigation	CodeCode Available	1	5
Better Question-Answering Models on a Budget	Apr 24, 2023	General KnowledgeQuestion Answering	CodeCode Available	1	5
Aligning Medical Images with General Knowledge from Large Language Models	Aug 31, 2024	General KnowledgeMedical Image Analysis	CodeCode Available	1	5
ElecBench: a Power Dispatch Evaluation Benchmark for Large Language Models	Jul 7, 2024	FairnessGeneral Knowledge	CodeCode Available	1	5

Show:10 25 50

← PrevPage 2 of 16Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Chinchilla-70B (few-shot, k=5)	Accuracy	94.3	—	Unverified
2	Gopher-280B (few-shot, k=5)	Accuracy	93.9	—	Unverified
3	Chinchilla-70B (few-shot, k=5)	Accuracy	85.7	—	Unverified
4	Gopher-280B (few-shot, k=5)	Accuracy	84.8	—	Unverified
5	Gopher-280B (few-shot, k=5)	Accuracy	84.2	—	Unverified
6	Gopher-280B (few-shot, k=5)	Accuracy	84.1	—	Unverified
7	Gopher-280B (few-shot, k=5)	Accuracy	83.9	—	Unverified
8	Gopher-280B (few-shot, k=5)	Accuracy	83.3	—	Unverified
9	Gopher-280B (few-shot, k=5)	Accuracy	81.8	—	Unverified
10	Gopher-280B (few-shot, k=5)	Accuracy	81	—	Unverified