General Knowledge

This task aims to evaluate the ability of a model to answer general-knowledge questions.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 376–399 of 399 papers

Title	Date	Tasks	Status
Adapter-based Approaches to Knowledge-enhanced Language Models -- A Survey	Nov 25, 2024	General KnowledgeKnowledge Graphs	—Unverified
SHARP: Unlocking Interactive Hallucination via Stance Transfer in Role-Playing Agents	Nov 12, 2024	General KnowledgeHallucination	—Unverified
TOV: The Original Vision Model for Optical Remote Sensing Image Understanding via Self-supervised Learning	Apr 10, 2022	General Knowledgeobject-detection	—Unverified
Evaluating Company-specific Biases in Financial Sentiment Analysis using Large Language Models	Nov 1, 2024	General KnowledgeSentiment Analysis	—Unverified
GALA: Generating Animatable Layered Assets from a Single Scan	Jan 23, 2024	3D geometryGeneral Knowledge	—Unverified
Generating Diverse Q&A Benchmarks for RAG Evaluation with DataMorgana	Jan 22, 2025	General KnowledgeRAG	—Unverified
Generative Explore-Exploit: Training-free Optimization of Generative Recommender Systems using LLM Optimizers	Jun 7, 2024	General KnowledgeQuestion Generation	—Unverified
Generative Meta-Learning for Zero-Shot Relation Triplet Extraction	May 3, 2023	General KnowledgeMeta-Learning	—Unverified
Enhancing Target-unspecific Tasks through a Features Matrix	May 6, 2025	General KnowledgePrompt Learning	—Unverified
Generative Retrieval and Alignment Model: A New Paradigm for E-commerce Retrieval	Apr 2, 2025	General KnowledgeRetrieval	—Unverified
Enhancing Action Recognition from Low-Quality Skeleton Data via Part-Level Knowledge Distillation	Apr 28, 2024	Action RecognitionGeneral Knowledge	—Unverified
GeoEdit: Geometric Knowledge Editing for Large Language Models	Feb 27, 2025	General Knowledgeknowledge editing	—Unverified
Enhance Graph Alignment for Large Language Models	Oct 15, 2024	General KnowledgeText Matching	—Unverified
GFDC: Graph Function Dependence for Logically Consistent Dialogue Response Beyond Persona Data	Nov 16, 2021	Dialogue GenerationGeneral Knowledge	—Unverified
Enabling Autonomic Microservice Management through Self-Learning Agents	Jan 31, 2025	General KnowledgeManagement	—Unverified
Towards a Continuous Knowledge Learning Engine for Chatbots	Feb 16, 2018	General KnowledgeKnowledge Base Completion	—Unverified
Efficient illumination angle self-calibration in Fourier ptychography	Apr 10, 2018	General Knowledge	—Unverified
GOT4Rec: Graph of Thoughts for Sequential Recommendation	Nov 22, 2024	General KnowledgeSequential Recommendation	—Unverified
GRL-Prompt: Towards Knowledge Graph based Prompt Optimization via Reinforcement Learning	Nov 19, 2024	General KnowledgePrompt Engineering	—Unverified
Dominance-based Rough Set Approach, basic ideas and main trends	Oct 6, 2022	General Knowledge	—Unverified
Domain Specific, Semi-Supervised Transfer Learning for Medical Imaging	May 24, 2020	General KnowledgeTransfer Learning	—Unverified
Does Localization Inform Unlearning? A Rigorous Examination of Local Parameter Attribution for Knowledge Unlearning in Language Models	May 22, 2025	General Knowledge	—Unverified
Hierarchical Inductive Transfer for Continual Dialogue Learning	Nov 16, 2021	General Knowledge	—Unverified
Hierarchical Inductive Transfer for Continual Dialogue Learning	Mar 20, 2022	General Knowledge	—Unverified

Show:10 25 50

← PrevPage 16 of 16Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Chinchilla-70B (few-shot, k=5)	Accuracy	94.3	—	Unverified
2	Gopher-280B (few-shot, k=5)	Accuracy	93.9	—	Unverified
3	Chinchilla-70B (few-shot, k=5)	Accuracy	85.7	—	Unverified
4	Gopher-280B (few-shot, k=5)	Accuracy	84.8	—	Unverified
5	Gopher-280B (few-shot, k=5)	Accuracy	84.2	—	Unverified
6	Gopher-280B (few-shot, k=5)	Accuracy	84.1	—	Unverified
7	Gopher-280B (few-shot, k=5)	Accuracy	83.9	—	Unverified
8	Gopher-280B (few-shot, k=5)	Accuracy	83.3	—	Unverified
9	Gopher-280B (few-shot, k=5)	Accuracy	81.8	—	Unverified
10	Gopher-280B (few-shot, k=5)	Accuracy	81	—	Unverified