General Knowledge

This task aims to evaluate the ability of a model to answer general-knowledge questions.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–125 of 399 papers

Title	Date	Tasks	Status	Hype
HELM: Hyperbolic Large Language Models via Mixture-of-Curvature Experts	May 30, 2025	ARCGeneral Knowledge	CodeCode Available	1
Safetywashing: Do AI Safety Benchmarks Actually Measure Safety Progress?	Jul 31, 2024	General Knowledge	CodeCode Available	1
Towards Task Sampler Learning for Meta-Learning	Jul 18, 2023	DiversityFew-Shot Learning	CodeCode Available	1
Seed-Guided Topic Discovery with Out-of-Vocabulary Seeds	May 4, 2022	DiversityGeneral Knowledge	CodeCode Available	1
Prompt Learning via Meta-Regularization	Apr 1, 2024	Domain GeneralizationGeneral Knowledge	CodeCode Available	1
Show, Attend and Distill:Knowledge Distillation via Attention-based Feature Matching	Feb 5, 2021	General KnowledgeKnowledge Distillation	CodeCode Available	1
DomainRAG: A Chinese Benchmark for Evaluating Domain-specific Retrieval-Augmented Generation	Jun 9, 2024	Common Sense ReasoningDenoising	CodeCode Available	1
A New Learning Paradigm for Foundation Model-based Remote Sensing Change Detection	Dec 2, 2023	Building change detection for remote sensing imagesChange Detection	CodeCode Available	1
Can LVLMs Obtain a Driver's License? A Benchmark Towards Reliable AGI for Autonomous Driving	Sep 4, 2024	Autonomous DrivingDecision Making	—Unverified	0
Are LLMs Good Cryptic Crossword Solvers?	Mar 15, 2024	General Knowledge	—Unverified	0
AcademicGPT: Empowering Academic Research	Nov 21, 2023	Abstract generationGeneral Knowledge	—Unverified	0
Learning Electromagnetic Metamaterial Physics With ChatGPT	Apr 23, 2024	General Knowledge	—Unverified	0
Enhancing Action Recognition from Low-Quality Skeleton Data via Part-Level Knowledge Distillation	Apr 28, 2024	Action RecognitionGeneral Knowledge	—Unverified	0
Enhance Graph Alignment for Large Language Models	Oct 15, 2024	General KnowledgeText Matching	—Unverified	0
Advancing Retrieval-Augmented Generation for Persian: Development of Language Models, Comprehensive Benchmarks, and Best Practices for Optimization	Jan 8, 2025	BenchmarkingGeneral Knowledge	—Unverified	0
Enabling Autonomic Microservice Management through Self-Learning Agents	Jan 31, 2025	General KnowledgeManagement	—Unverified	0
Applying SoftTriple Loss for Supervised Language Model Fine Tuning	Dec 15, 2021	General KnowledgeLanguage Modeling	—Unverified	0
AnomalyPainter: Vision-Language-Diffusion Synergy for Zero-Shot Realistic and Diverse Industrial Anomaly Synthesis	Mar 10, 2025	DiversityGeneral Knowledge	—Unverified	0
CALM: Unleashing the Cross-Lingual Self-Aligning Ability of Language Model Question Answering	Jan 30, 2025	General KnowledgeLanguage Modeling	—Unverified	0
Few Exemplar-Based General Medical Image Segmentation via Domain-Aware Selective Adaptation	Oct 11, 2024	General KnowledgeImage Segmentation	—Unverified	0
Enhancing Target-unspecific Tasks through a Features Matrix	May 6, 2025	General KnowledgePrompt Learning	—Unverified	0
Efficient illumination angle self-calibration in Fourier ptychography	Apr 10, 2018	General Knowledge	—Unverified	0
Bridge-Coder: Unlocking LLMs' Potential to Overcome Language Gaps in Low-Resource Code	Oct 24, 2024	General KnowledgeIn-Context Learning	—Unverified	0
Evaluating Company-specific Biases in Financial Sentiment Analysis using Large Language Models	Nov 1, 2024	General KnowledgeSentiment Analysis	—Unverified	0
Bootstrapping Cognitive Agents with a Large Language Model	Feb 25, 2024	General KnowledgeLanguage Modeling	—Unverified	0

Show:10 25 50

← PrevPage 5 of 16Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Chinchilla-70B (few-shot, k=5)	Accuracy	94.3	—	Unverified
2	Gopher-280B (few-shot, k=5)	Accuracy	93.9	—	Unverified
3	Chinchilla-70B (few-shot, k=5)	Accuracy	85.7	—	Unverified
4	Gopher-280B (few-shot, k=5)	Accuracy	84.8	—	Unverified
5	Gopher-280B (few-shot, k=5)	Accuracy	84.2	—	Unverified
6	Gopher-280B (few-shot, k=5)	Accuracy	84.1	—	Unverified
7	Gopher-280B (few-shot, k=5)	Accuracy	83.9	—	Unverified
8	Gopher-280B (few-shot, k=5)	Accuracy	83.3	—	Unverified
9	Gopher-280B (few-shot, k=5)	Accuracy	81.8	—	Unverified
10	Gopher-280B (few-shot, k=5)	Accuracy	81	—	Unverified