General Knowledge

This task aims to evaluate the ability of a model to answer general-knowledge questions.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 176–200 of 399 papers

Title	Date	Tasks	Status	Hype
Are LLMs Good Cryptic Crossword Solvers?	Mar 15, 2024	General Knowledge	—Unverified	0
CoIN: A Benchmark of Continual Instruction tuNing for Multimodel Large Language Model	Mar 13, 2024	General KnowledgeInstruction Following	CodeCode Available	2
DiPrompT: Disentangled Prompt Tuning for Multiple Latent Domain Generalization in Federated Learning	Mar 11, 2024	Domain GeneralizationFederated Learning	—Unverified	0
See Through Their Minds: Learning Transferable Neural Representation from Cross-Subject fMRI	Mar 11, 2024	Brain DecodingGeneral Knowledge	CodeCode Available	1
Deep Prompt Multi-task Network for Abuse Language Detection	Mar 8, 2024	Abusive LanguageGeneral Knowledge	—Unverified	0
MedSafetyBench: Evaluating and Improving the Medical Safety of Large Language Models	Mar 6, 2024	EthicsGeneral Knowledge	CodeCode Available	1
K-Link: Knowledge-Link Graph from LLMs for Enhanced Representation Learning in Multivariate Time-Series Data	Mar 6, 2024	General Knowledgegraph construction	—Unverified	0
Pruning neural network models for gene regulatory dynamics using data and domain knowledge	Mar 5, 2024	General KnowledgeNetwork Pruning	CodeCode Available	0
Beyond Specialization: Assessing the Capabilities of MLLMs in Age and Gender Estimation	Mar 4, 2024	Age And Gender ClassificationAge and Gender Estimation	CodeCode Available	3
Can LLM Generate Culturally Relevant Commonsense QA Data? Case Study in Indonesian and Sundanese	Feb 27, 2024	General KnowledgeQuestion Answering	CodeCode Available	1
Bootstrapping Cognitive Agents with a Large Language Model	Feb 25, 2024	General KnowledgeLanguage Modeling	—Unverified	0
OMGEval: An Open Multilingual Generative Evaluation Benchmark for Large Language Models	Feb 21, 2024	General KnowledgeLogical Reasoning	CodeCode Available	1
Inductive Graph Alignment Prompt: Bridging the Gap between Graph Pre-training and Inductive Fine-tuning From Spectral Perspective	Feb 21, 2024	General KnowledgeGraph Classification	—Unverified	0
CyberMetric: A Benchmark Dataset based on Retrieval-Augmented Generation for Evaluating LLMs in Cybersecurity Knowledge	Feb 12, 2024	General KnowledgeMultiple-choice	CodeCode Available	2
Pre-training and Diagnosing Knowledge Base Completion Models	Jan 27, 2024	General KnowledgeKnowledge Base Completion	CodeCode Available	1
GALA: Generating Animatable Layered Assets from a Single Scan	Jan 23, 2024	3D geometryGeneral Knowledge	—Unverified	0
INCPrompt: Task-Aware incremental Prompting for Rehearsal-Free Class-incremental Learning	Jan 22, 2024	class-incremental learningClass Incremental Learning	—Unverified	0
The Unreasonable Effectiveness of Easy Training Data for Hard Tasks	Jan 12, 2024	General KnowledgeIn-Context Learning	CodeCode Available	1
Generic Knowledge Boosted Pre-training For Remote Sensing Images	Jan 9, 2024	Change DetectionDeep Learning	CodeCode Available	1
Imagine Before Go: Self-Supervised Generative Map for Object Goal Navigation	Jan 1, 2024	General KnowledgeNavigate	CodeCode Available	2
KD-DETR: Knowledge Distillation for Detection Transformer with Consistent Distillation Points Sampling	Jan 1, 2024	General KnowledgeKnowledge Distillation	—Unverified	0
MMA: Multi-Modal Adapter for Vision-Language Models	Jan 1, 2024	Domain GeneralizationGeneral Knowledge	CodeCode Available	2
GeoGalactica: A Scientific Large Language Model in Geoscience	Dec 31, 2023	Document ClassificationGeneral Knowledge	CodeCode Available	1
Time Travelling Pixels: Bitemporal Features Integration with Foundation Model for Remote Sensing Image Change Detection	Dec 23, 2023	Change DetectionGeneral Knowledge	CodeCode Available	1
VIEScore: Towards Explainable Metrics for Conditional Image Synthesis Evaluation	Dec 22, 2023	Conditional Image GenerationGeneral Knowledge	CodeCode Available	1

Show:10 25 50

← PrevPage 8 of 16Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Chinchilla-70B (few-shot, k=5)	Accuracy	94.3	—	Unverified
2	Gopher-280B (few-shot, k=5)	Accuracy	93.9	—	Unverified
3	Chinchilla-70B (few-shot, k=5)	Accuracy	85.7	—	Unverified
4	Gopher-280B (few-shot, k=5)	Accuracy	84.8	—	Unverified
5	Gopher-280B (few-shot, k=5)	Accuracy	84.2	—	Unverified
6	Gopher-280B (few-shot, k=5)	Accuracy	84.1	—	Unverified
7	Gopher-280B (few-shot, k=5)	Accuracy	83.9	—	Unverified
8	Gopher-280B (few-shot, k=5)	Accuracy	83.3	—	Unverified
9	Gopher-280B (few-shot, k=5)	Accuracy	81.8	—	Unverified
10	Gopher-280B (few-shot, k=5)	Accuracy	81	—	Unverified