SOTAVerified|Agents Browse Leaderboard About

General Knowledge

This task aims to evaluate the ability of a model to answer general-knowledge questions.

Source: BIG-bench

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 61–70 of 399 papers

Title	Date	Tasks	Status	Hype
See Through Their Minds: Learning Transferable Neural Representation from Cross-Subject fMRI	Mar 11, 2024	Brain DecodingGeneral Knowledge	CodeCode Available	1
MedSafetyBench: Evaluating and Improving the Medical Safety of Large Language Models	Mar 6, 2024	EthicsGeneral Knowledge	CodeCode Available	1
Can LLM Generate Culturally Relevant Commonsense QA Data? Case Study in Indonesian and Sundanese	Feb 27, 2024	General KnowledgeQuestion Answering	CodeCode Available	1
OMGEval: An Open Multilingual Generative Evaluation Benchmark for Large Language Models	Feb 21, 2024	General KnowledgeLogical Reasoning	CodeCode Available	1
Pre-training and Diagnosing Knowledge Base Completion Models	Jan 27, 2024	General KnowledgeKnowledge Base Completion	CodeCode Available	1
The Unreasonable Effectiveness of Easy Training Data for Hard Tasks	Jan 12, 2024	General KnowledgeIn-Context Learning	CodeCode Available	1
Generic Knowledge Boosted Pre-training For Remote Sensing Images	Jan 9, 2024	Change DetectionDeep Learning	CodeCode Available	1
GeoGalactica: A Scientific Large Language Model in Geoscience	Dec 31, 2023	Document ClassificationGeneral Knowledge	CodeCode Available	1
Time Travelling Pixels: Bitemporal Features Integration with Foundation Model for Remote Sensing Image Change Detection	Dec 23, 2023	Change DetectionGeneral Knowledge	CodeCode Available	1
VIEScore: Towards Explainable Metrics for Conditional Image Synthesis Evaluation	Dec 22, 2023	Conditional Image GenerationGeneral Knowledge	CodeCode Available	1

Show:10 25 50

← PrevPage 7 of 40Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Chinchilla-70B (few-shot, k=5)	Accuracy	94.3	—	Unverified
2	Gopher-280B (few-shot, k=5)	Accuracy	93.9	—	Unverified
3	Chinchilla-70B (few-shot, k=5)	Accuracy	85.7	—	Unverified
4	Gopher-280B (few-shot, k=5)	Accuracy	84.8	—	Unverified
5	Gopher-280B (few-shot, k=5)	Accuracy	84.2	—	Unverified
6	Gopher-280B (few-shot, k=5)	Accuracy	84.1	—	Unverified
7	Gopher-280B (few-shot, k=5)	Accuracy	83.9	—	Unverified
8	Gopher-280B (few-shot, k=5)	Accuracy	83.3	—	Unverified
9	Gopher-280B (few-shot, k=5)	Accuracy	81.8	—	Unverified
10	Gopher-280B (few-shot, k=5)	Accuracy	81	—	Unverified