General Knowledge

This task aims to evaluate the ability of a model to answer general-knowledge questions.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–150 of 399 papers

Title	Date	Tasks	Status	Hype	Score
FuseChat-3.0: Preference Optimization Meets Heterogeneous Model Fusion	Mar 6, 2025	General KnowledgeInstruction Following	CodeCode Available	1	5
Structured Chemistry Reasoning with Large Language Models	Nov 16, 2023	General Knowledge	CodeCode Available	1	5
TaxoAdapt: Aligning LLM-Based Multidimensional Taxonomy Construction to Evolving Research Corpora	Jun 12, 2025	General Knowledge	CodeCode Available	1	5
Transformers as Soft Reasoners over Language	Feb 14, 2020	counterfactualCounterfactual Reasoning	CodeCode Available	1	5
Point-PRC: A Prompt Learning Based Regulation Framework for Generalizable Point Cloud Analysis	Oct 27, 2024	Domain GeneralizationGeneral Knowledge	CodeCode Available	1	5
Prediction and Control in Continual Reinforcement Learning	Dec 18, 2023	Continual LearningGeneral Knowledge	CodeCode Available	1	5
Time Travelling Pixels: Bitemporal Features Integration with Foundation Model for Remote Sensing Image Change Detection	Dec 23, 2023	Change DetectionGeneral Knowledge	CodeCode Available	1	5
A New Learning Paradigm for Foundation Model-based Remote Sensing Change Detection	Dec 2, 2023	Building change detection for remote sensing imagesChange Detection	CodeCode Available	1	5
SciDeBERTa: Learning DeBERTa for Science Technology Documents and Fine-Tuning Information Extraction Tasks	Jun 8, 2022	General KnowledgeJoint Entity and Relation Extraction	CodeCode Available	0	5
Eraser: Jailbreaking Defense in Large Language Models via Unlearning Harmful Knowledge	Apr 8, 2024	General KnowledgeSafety Alignment	CodeCode Available	0	5
Are Large Language Models a Good Replacement of Taxonomies?	Jun 17, 2024	General KnowledgeKnowledge Graphs	CodeCode Available	0	5
Should We Really Edit Language Models? On the Evaluation of Edited Language Models	Oct 24, 2024	General KnowledgeModel Editing	CodeCode Available	0	5
REFinD: Relation Extraction Financial Dataset	May 22, 2023	ArticlesGeneral Knowledge	CodeCode Available	0	5
Efficient Transfer Learning for Video-language Foundation Models	Nov 18, 2024	Action RecognitionFew-Shot Learning	CodeCode Available	0	5
Efficient Relation-aware Neighborhood Aggregation in Graph Neural Networks via Tensor Decomposition	Dec 11, 2022	Contrastive LearningGeneral Knowledge	CodeCode Available	0	5
Effective Skill Unlearning through Intervention and Abstention	Mar 27, 2025	General KnowledgeMath	CodeCode Available	0	5
RepLiQA: A Question-Answering Dataset for Benchmarking LLMs on Unseen Reference Content	Jun 17, 2024	BenchmarkingGeneral Knowledge	CodeCode Available	0	5
Can ChatGPT Enable ITS? The Case of Mixed Traffic Control via Reinforcement Learning	Jun 13, 2023	General KnowledgeManagement	CodeCode Available	0	5
BnMMLU: Measuring Massive Multitask Language Understanding in Bengali	May 25, 2025	General KnowledgeMMLU	CodeCode Available	0	5
PROL : Rehearsal Free Continual Learning in Streaming Data via Prompt Online Learning	Jul 16, 2025	Continual LearningGeneral Knowledge	CodeCode Available	0	5
Domain Generalization via Model-Agnostic Learning of Semantic Features	Oct 29, 2019	Domain GeneralizationGeneral Knowledge	CodeCode Available	0	5
Planning Safety Trajectories with Dual-Phase, Physics-Informed, and Transportation Knowledge-Driven Large Language Models	Apr 6, 2025	Computational EfficiencyGeneral Knowledge	CodeCode Available	0	5
Dive into the Resolution Augmentations and Metrics in Low Resolution Face Recognition: A Plain yet Effective New Baseline	Feb 11, 2023	Face RecognitionGeneral Knowledge	CodeCode Available	0	5
Distribution-aware Noisy-label Crack Segmentation	Oct 12, 2024	Crack SegmentationDomain Generalization	CodeCode Available	0	5
Distilling Stereo Networks for Performant and Efficient Leaner Networks	Mar 24, 2025	General KnowledgeKnowledge Distillation	CodeCode Available	0	5
Patching as Translation: the Data and the Metaphor	Aug 24, 2020	General KnowledgeProgram Repair	CodeCode Available	0	5
Disentangling Fine-Tuning from Pre-Training in Visual Captioning with Hybrid Markov Logic	Mar 18, 2025	General KnowledgeImage Captioning	CodeCode Available	0	5
Pruning neural network models for gene regulatory dynamics using data and domain knowledge	Mar 5, 2024	General KnowledgeNetwork Pruning	CodeCode Available	0	5
PELMS: Pre-training for Effective Low-Shot Multi-Document Summarization	Nov 16, 2023	Document SummarizationGeneral Knowledge	CodeCode Available	0	5
Quantized Prompt for Efficient Generalization of Vision-Language Models	Jul 15, 2024	General KnowledgeLanguage Modelling	CodeCode Available	0	5
Luminoso at SemEval-2018 Task 10: Distinguishing Attributes Using Text Corpora and Relational Knowledge	Jun 5, 2018	General KnowledgeRelation Extraction	CodeCode Available	0	5
DAGPrompT: Pushing the Limits of Graph Prompting with a Distribution-aware Graph Prompt Tuning Approach	Jan 25, 2025	General KnowledgeGraph Classification	CodeCode Available	0	5
MM-Eval: A Hierarchical Benchmark for Modern Mongolian Evaluation in LLMs	Nov 14, 2024	General KnowledgeMath	CodeCode Available	0	5
Avoiding Copyright Infringement via Large Language Model Unlearning	Jun 16, 2024	General KnowledgeLanguage Modeling	CodeCode Available	0	5
Learning to Understand Phrases by Embedding the Dictionary	Apr 2, 2015	General Knowledge	CodeCode Available	0	5
ContextFlow++: Generalist-Specialist Flow-based Generative Models with Mixed-Variable Context Encoding	Jun 2, 2024	Anomaly DetectionDensity Estimation	CodeCode Available	0	5
GenKnowSub: Improving Modularity and Reusability of LLMs through General Knowledge Subtraction	May 16, 2025	General KnowledgeZero-shot Generalization	CodeCode Available	0	5
Learning to Learn Variational Semantic Memory	Oct 20, 2020	Few-Shot LearningGeneral Knowledge	CodeCode Available	0	5
Leveraging Large Language Models for Automated Dialogue Analysis	Sep 12, 2023	General KnowledgeLanguage Modeling	CodeCode Available	0	5
Connecting a French Dictionary from the Beginning of the 20th Century to Wikidata	Jun 22, 2022	General Knowledge	CodeCode Available	0	5
Knowledge Distillation for Detection Transformer with Consistent Distillation Points Sampling	Nov 15, 2022	General KnowledgeKnowledge Distillation	CodeCode Available	0	5
Joey NMT: A Minimalist NMT Toolkit for Novices	Jul 29, 2019	General KnowledgeMachine Translation	CodeCode Available	0	5
Foundation X: Integrating Classification, Localization, and Segmentation through Lock-Release Pretraining Strategy for Chest X-ray Analysis	Mar 12, 2025	DiagnosticGeneral Knowledge	CodeCode Available	0	5
Integrating Semantic Knowledge to Tackle Zero-shot Text Classification	Mar 29, 2019	ClassificationData Augmentation	CodeCode Available	0	5
Commonsense Knowledge in Word Associations and ConceptNet	Sep 20, 2021	General KnowledgeKnowledge Graphs	CodeCode Available	0	5
Towards Difficulty-Agnostic Efficient Transfer Learning for Vision-Language Models	Nov 27, 2023	General Knowledgeimage-classification	CodeCode Available	0	5
Fed-CO2: Cooperation of Online and Offline Models for Severe Data Heterogeneity in Federated Learning	Dec 21, 2023	Domain GeneralizationFederated Learning	CodeCode Available	0	5
Improving Personalized Search with Regularized Low-Rank Parameter Updates	Jun 11, 2025	General KnowledgeImage Retrieval	CodeCode Available	0	5
Comprehensive Fair Meta-learned Recommender System	Jun 9, 2022	counterfactualFairness	CodeCode Available	0	5
Fantastic Gains and Where to Find Them: On the Existence and Prospect of General Knowledge Transfer between Any Pretrained Model	Oct 26, 2023	Data AugmentationGeneral Knowledge	CodeCode Available	0	5

Show:10 25 50

← PrevPage 3 of 8Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Chinchilla-70B (few-shot, k=5)	Accuracy	94.3	—	Unverified
2	Gopher-280B (few-shot, k=5)	Accuracy	93.9	—	Unverified
3	Chinchilla-70B (few-shot, k=5)	Accuracy	85.7	—	Unverified
4	Gopher-280B (few-shot, k=5)	Accuracy	84.8	—	Unverified
5	Gopher-280B (few-shot, k=5)	Accuracy	84.2	—	Unverified
6	Gopher-280B (few-shot, k=5)	Accuracy	84.1	—	Unverified
7	Gopher-280B (few-shot, k=5)	Accuracy	83.9	—	Unverified
8	Gopher-280B (few-shot, k=5)	Accuracy	83.3	—	Unverified
9	Gopher-280B (few-shot, k=5)	Accuracy	81.8	—	Unverified
10	Gopher-280B (few-shot, k=5)	Accuracy	81	—	Unverified