General Knowledge

This task aims to evaluate the ability of a model to answer general-knowledge questions.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–150 of 399 papers

Title	Date	Tasks	Status	Hype
HAE-RAE Bench: Evaluation of Korean Knowledge in Language Models	Sep 6, 2023	General KnowledgeLogical Reasoning	CodeCode Available	1
KALA: Knowledge-Augmented Language Model Adaptation	Apr 22, 2022	Domain AdaptationGeneral Knowledge	CodeCode Available	1
CC-Riddle: A Question Answering Dataset of Chinese Character Riddles	Jun 28, 2022	General KnowledgeLanguage Modelling	CodeCode Available	1
GeoGalactica: A Scientific Large Language Model in Geoscience	Dec 31, 2023	Document ClassificationGeneral Knowledge	CodeCode Available	1
Knowledge Prompt-tuning for Sequential Recommendation	Aug 14, 2023	General KnowledgeSequential Recommendation	CodeCode Available	1
Safetywashing: Do AI Safety Benchmarks Actually Measure Safety Progress?	Jul 31, 2024	General Knowledge	CodeCode Available	1
Transformers as Soft Reasoners over Language	Feb 14, 2020	counterfactualCounterfactual Reasoning	CodeCode Available	1
A New Learning Paradigm for Foundation Model-based Remote Sensing Change Detection	Dec 2, 2023	Building change detection for remote sensing imagesChange Detection	CodeCode Available	1
Can LVLMs Obtain a Driver's License? A Benchmark Towards Reliable AGI for Autonomous Driving	Sep 4, 2024	Autonomous DrivingDecision Making	—Unverified	0
Are LLMs Good Cryptic Crossword Solvers?	Mar 15, 2024	General Knowledge	—Unverified	0
AcademicGPT: Empowering Academic Research	Nov 21, 2023	Abstract generationGeneral Knowledge	—Unverified	0
Learning Electromagnetic Metamaterial Physics With ChatGPT	Apr 23, 2024	General Knowledge	—Unverified	0
Enhance Graph Alignment for Large Language Models	Oct 15, 2024	General KnowledgeText Matching	—Unverified	0
Advancing Retrieval-Augmented Generation for Persian: Development of Language Models, Comprehensive Benchmarks, and Best Practices for Optimization	Jan 8, 2025	BenchmarkingGeneral Knowledge	—Unverified	0
Igea: a Decoder-Only Language Model for Biomedical Text Generation in Italian	Jul 8, 2024	Computational EfficiencyDecoder	—Unverified	0
Enabling Autonomic Microservice Management through Self-Learning Agents	Jan 31, 2025	General KnowledgeManagement	—Unverified	0
Applying SoftTriple Loss for Supervised Language Model Fine Tuning	Dec 15, 2021	General KnowledgeLanguage Modeling	—Unverified	0
AnomalyPainter: Vision-Language-Diffusion Synergy for Zero-Shot Realistic and Diverse Industrial Anomaly Synthesis	Mar 10, 2025	DiversityGeneral Knowledge	—Unverified	0
CALM: Unleashing the Cross-Lingual Self-Aligning Ability of Language Model Question Answering	Jan 30, 2025	General KnowledgeLanguage Modeling	—Unverified	0
Enhancing Action Recognition from Low-Quality Skeleton Data via Part-Level Knowledge Distillation	Apr 28, 2024	Action RecognitionGeneral Knowledge	—Unverified	0
Enhancing Target-unspecific Tasks through a Features Matrix	May 6, 2025	General KnowledgePrompt Learning	—Unverified	0
How to Complete Domain Tuning while Keeping General Ability in LLM: Adaptive Layer-wise and Element-wise Regularization	Jan 23, 2025	General Knowledge	—Unverified	0
Efficient illumination angle self-calibration in Fourier ptychography	Apr 10, 2018	General Knowledge	—Unverified	0
Evaluating Company-specific Biases in Financial Sentiment Analysis using Large Language Models	Nov 1, 2024	General KnowledgeSentiment Analysis	—Unverified	0
Evaluating Consistency and Reasoning Capabilities of Large Language Models	Apr 25, 2024	General KnowledgeText Generation	—Unverified	0
Evaluating Polish linguistic and cultural competency in large language models	Mar 2, 2025	General Knowledge	—Unverified	0
Bridge-Coder: Unlocking LLMs' Potential to Overcome Language Gaps in Low-Resource Code	Oct 24, 2024	General KnowledgeIn-Context Learning	—Unverified	0
Bootstrapping Cognitive Agents with a Large Language Model	Feb 25, 2024	General KnowledgeLanguage Modeling	—Unverified	0
PMoE: Progressive Mixture of Experts with Asymmetric Transformer for Continual Learning	Jul 31, 2024	Continual LearningGeneral Knowledge	—Unverified	0
Image Captioning and Visual Question Answering Based on Attributes and External Knowledge	Mar 9, 2016	General KnowledgeImage Captioning	—Unverified	0
Dominance-based Rough Set Approach, basic ideas and main trends	Oct 6, 2022	General Knowledge	—Unverified	0
Boosting LLM Translation Skills without General Ability Loss via Rationale Distillation	Oct 17, 2024	General KnowledgeInstruction Following	—Unverified	0
Domain Specific, Semi-Supervised Transfer Learning for Medical Imaging	May 24, 2020	General KnowledgeTransfer Learning	—Unverified	0
An Energy Ontology for Global City Indicators (ISO 37120)	Jul 19, 2020	General Knowledge	—Unverified	0
Biomedical Large Languages Models Seem not to be Superior to Generalist Models on Unseen Medical Data	Aug 25, 2024	Document SummarizationGeneral Knowledge	—Unverified	0
Does Localization Inform Unlearning? A Rigorous Examination of Local Parameter Attribution for Knowledge Unlearning in Language Models	May 22, 2025	General Knowledge	—Unverified	0
BinBert: Binary Code Understanding with a Fine-tunable and Execution-aware Transformer	Aug 13, 2022	General Knowledge	—Unverified	0
Dobby: A Conversational Service Robot Driven by GPT-4	Oct 10, 2023	AI AgentDecision Making	—Unverified	0
DKT: Diverse Knowledge Transfer Transformer for Class Incremental Learning	Jan 1, 2023	class-incremental learningClass Incremental Learning	—Unverified	0
Who You Are Matters: Bridging Topics and Social Roles via LLM-Enhanced Logical Recommendation	May 16, 2025	General KnowledgeLarge Language Model	—Unverified	0
Hierarchical Inductive Transfer for Continual Dialogue Learning	Nov 16, 2021	General Knowledge	—Unverified	0
GRL-Prompt: Towards Knowledge Graph based Prompt Optimization via Reinforcement Learning	Nov 19, 2024	General KnowledgePrompt Engineering	—Unverified	0
Bilingual Evaluation of Language Models on General Knowledge in University Entrance Exams with Minimal Contamination	Sep 19, 2024	General KnowledgeMMLU	—Unverified	0
Distributed Fine-tuning of Language Models on Private Data	Jan 1, 2018	General KnowledgeLanguage Modeling	—Unverified	0
Analysis of Watson's Strategies for Playing Jeopardy!	Feb 4, 2014	Decision MakingGeneral Knowledge	—Unverified	0
Disentangling Knowledge-based and Visual Reasoning by Question Decomposition in KB-VQA	Jun 27, 2024	General KnowledgeQuestion Answering	—Unverified	0
An Ad-hoc graph node vector embedding algorithm for general knowledge graphs using Kinetica-Graph	Jul 22, 2024	General KnowledgeKnowledge Graphs	—Unverified	0
DiPrompT: Disentangled Prompt Tuning for Multiple Latent Domain Generalization in Federated Learning	Mar 11, 2024	Domain GeneralizationFederated Learning	—Unverified	0
Differentially Private Distributed Learning for Language Modeling Tasks	Dec 20, 2017	General KnowledgeLanguage Modeling	—Unverified	0
AdaptGCD: Multi-Expert Adapter Tuning for Generalized Category Discovery	Oct 29, 2024	General KnowledgePrompt Learning	—Unverified	0

Show:10 25 50

← PrevPage 3 of 8Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Chinchilla-70B (few-shot, k=5)	Accuracy	94.3	—	Unverified
2	Gopher-280B (few-shot, k=5)	Accuracy	93.9	—	Unverified
3	Chinchilla-70B (few-shot, k=5)	Accuracy	85.7	—	Unverified
4	Gopher-280B (few-shot, k=5)	Accuracy	84.8	—	Unverified
5	Gopher-280B (few-shot, k=5)	Accuracy	84.2	—	Unverified
6	Gopher-280B (few-shot, k=5)	Accuracy	84.1	—	Unverified
7	Gopher-280B (few-shot, k=5)	Accuracy	83.9	—	Unverified
8	Gopher-280B (few-shot, k=5)	Accuracy	83.3	—	Unverified
9	Gopher-280B (few-shot, k=5)	Accuracy	81.8	—	Unverified
10	Gopher-280B (few-shot, k=5)	Accuracy	81	—	Unverified