General Knowledge

This task aims to evaluate the ability of a model to answer general-knowledge questions.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 151–200 of 399 papers

Title	Date	Tasks	Status
AdaptGCD: Multi-Expert Adapter Tuning for Generalized Category Discovery	Oct 29, 2024	General KnowledgePrompt Learning	—Unverified
Advancing Retrieval-Augmented Generation for Persian: Development of Language Models, Comprehensive Benchmarks, and Best Practices for Optimization	Jan 8, 2025	BenchmarkingGeneral Knowledge	—Unverified
A Dynamic Approach to Probabilistic Inference	Mar 27, 2013	General Knowledge	—Unverified
A Factoid Question Answering System for Vietnamese	Mar 2, 2018	General KnowledgeQuestion Answering	—Unverified
A Human-Centered Data-Driven Planner-Actor-Critic Architecture via Logic Programming	Sep 18, 2019	General KnowledgeReinforcement Learning	—Unverified
AILS-NTUA at SemEval-2025 Task 4: Parameter-Efficient Unlearning for Large Language Models using Data Chunking	Mar 4, 2025	ChunkingGeneral Knowledge	—Unverified
All Roads Lead to Rome: Unveiling the Trajectory of Recommender Systems Across the LLM Era	Jul 14, 2024	AllConversational Recommendation	—Unverified
An Adaptive Deep Learning Framework for Day-ahead Forecasting of Photovoltaic Power Generation	Sep 28, 2021	General Knowledge	—Unverified
An Ad-hoc graph node vector embedding algorithm for general knowledge graphs using Kinetica-Graph	Jul 22, 2024	General KnowledgeKnowledge Graphs	—Unverified
Analysis of Watson's Strategies for Playing Jeopardy!	Feb 4, 2014	Decision MakingGeneral Knowledge	—Unverified
An Energy Ontology for Global City Indicators (ISO 37120)	Jul 19, 2020	General Knowledge	—Unverified
AnomalyPainter: Vision-Language-Diffusion Synergy for Zero-Shot Realistic and Diverse Industrial Anomaly Synthesis	Mar 10, 2025	DiversityGeneral Knowledge	—Unverified
Applying SoftTriple Loss for Supervised Language Model Fine Tuning	Dec 15, 2021	General KnowledgeLanguage Modeling	—Unverified
Are LLMs Good Cryptic Crossword Solvers?	Mar 15, 2024	General Knowledge	—Unverified
Are Longer Prompts Always Better? Prompt Selection in Large Language Models for Recommendation Systems	Dec 19, 2024	General KnowledgeRecommendation Systems	—Unverified
A Self-Supervised Learning of a Foundation Model for Analog Layout Design Automation	Mar 28, 2025	General KnowledgeLayout Design	—Unverified
Ask Me Anything: Free-form Visual Question Answering Based on Knowledge from External Sources	Nov 22, 2015	FormGeneral Knowledge	—Unverified
ASLseg: Adapting SAM in the Loop for Semi-supervised Liver Tumor Segmentation	Dec 13, 2023	General KnowledgeImage Segmentation	—Unverified
Assessing Look-Ahead Bias in Stock Return Predictions Generated By GPT Sentiment Analysis	Sep 29, 2023	General KnowledgeSentiment Analysis	—Unverified
A Unified Industrial Large Knowledge Model Framework in Industry 4.0 and Smart Manufacturing	Dec 22, 2023	General Knowledge	—Unverified
Autonomous Intelligent Software Development	Aug 12, 2022	General Knowledge	—Unverified
BAPO: Base-Anchored Preference Optimization for Overcoming Forgetting in Large Language Models Personalization	Jun 30, 2024	Continual LearningGeneral Knowledge	—Unverified
Benchmarking Generative Models on Computational Thinking Tests in Elementary Visual Programming	Jun 14, 2024	BenchmarkingGeneral Knowledge	—Unverified
Bilingual Evaluation of Language Models on General Knowledge in University Entrance Exams with Minimal Contamination	Sep 19, 2024	General KnowledgeMMLU	—Unverified
BinBert: Binary Code Understanding with a Fine-tunable and Execution-aware Transformer	Aug 13, 2022	General Knowledge	—Unverified
Biomedical Large Languages Models Seem not to be Superior to Generalist Models on Unseen Medical Data	Aug 25, 2024	Document SummarizationGeneral Knowledge	—Unverified
Boosting LLM Translation Skills without General Ability Loss via Rationale Distillation	Oct 17, 2024	General KnowledgeInstruction Following	—Unverified
Bootstrapping Cognitive Agents with a Large Language Model	Feb 25, 2024	General KnowledgeLanguage Modeling	—Unverified
Bridge-Coder: Unlocking LLMs' Potential to Overcome Language Gaps in Low-Resource Code	Oct 24, 2024	General KnowledgeIn-Context Learning	—Unverified
CALM: Unleashing the Cross-Lingual Self-Aligning Ability of Language Model Question Answering	Jan 30, 2025	General KnowledgeLanguage Modeling	—Unverified
Learning Electromagnetic Metamaterial Physics With ChatGPT	Apr 23, 2024	General Knowledge	—Unverified
Can LVLMs Obtain a Driver's License? A Benchmark Towards Reliable AGI for Autonomous Driving	Sep 4, 2024	Autonomous DrivingDecision Making	—Unverified
Collaborative ontology sharing and editing	May 30, 2013	General Knowledge	—Unverified
Collective inference of the truth of propositions from crowd probability judgments	Jan 9, 2025	General Knowledge	—Unverified
Colo-SCRL: Self-Supervised Contrastive Representation Learning for Colonoscopic Video Retrieval	Mar 28, 2023	Action RecognitionContrastive Learning	—Unverified
Comparative Insights from 12 Machine Learning Models in Extracting Economic Ideology from Political Text	Jan 16, 2025	General Knowledge	—Unverified
Composite Learning Units: Generalized Learning Beyond Parameter Updates to Transform LLMs into Adaptive Reasoners	Oct 9, 2024	General Knowledge	—Unverified
ConKI: Contrastive Knowledge Injection for Multimodal Sentiment Analysis	Jun 27, 2023	Contrastive LearningGeneral Knowledge	—Unverified
Constructing Enhanced Mutual Information for Online Class-Incremental Learning	Jul 26, 2024	class-incremental learningClass Incremental Learning	—Unverified
Context and Humor: Understanding Amul advertisements of India	Apr 15, 2018	General Knowledge	—Unverified
Controversy Rules - Discovering Regions Where Classifiers (Dis-)Agree Exceptionally	Aug 22, 2018	General ClassificationGeneral Knowledge	—Unverified
CoRA: Collaborative Information Perception by Large Language Model's Weights for Recommendation	Aug 20, 2024	Collaborative FilteringGeneral Knowledge	—Unverified
DAML-ST5: Low Resource Style Transfer via Domain Adaptive Meta Learning	Nov 16, 2021	General KnowledgeLanguage Modeling	—Unverified
Data structuring for the ontological modelling of wind energy systems	Oct 12, 2015	General Knowledge	—Unverified
Deep Prompt Multi-task Network for Abuse Language Detection	Mar 8, 2024	Abusive LanguageGeneral Knowledge	—Unverified
Differentially Private Distributed Learning for Language Modeling Tasks	Dec 20, 2017	General KnowledgeLanguage Modeling	—Unverified
DiPrompT: Disentangled Prompt Tuning for Multiple Latent Domain Generalization in Federated Learning	Mar 11, 2024	Domain GeneralizationFederated Learning	—Unverified
Generating Question Relevant Captions to Aid Visual Question Answering	Jun 3, 2019	General KnowledgeImage Captioning	—Unverified
Distributed Fine-tuning of Language Models on Private Data	Jan 1, 2018	General KnowledgeLanguage Modeling	—Unverified
DKT: Diverse Knowledge Transfer Transformer for Class Incremental Learning	Jan 1, 2023	class-incremental learningClass Incremental Learning	—Unverified

Show:10 25 50

← PrevPage 4 of 8Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Chinchilla-70B (few-shot, k=5)	Accuracy	94.3	—	Unverified
2	Gopher-280B (few-shot, k=5)	Accuracy	93.9	—	Unverified
3	Chinchilla-70B (few-shot, k=5)	Accuracy	85.7	—	Unverified
4	Gopher-280B (few-shot, k=5)	Accuracy	84.8	—	Unverified
5	Gopher-280B (few-shot, k=5)	Accuracy	84.2	—	Unverified
6	Gopher-280B (few-shot, k=5)	Accuracy	84.1	—	Unverified
7	Gopher-280B (few-shot, k=5)	Accuracy	83.9	—	Unverified
8	Gopher-280B (few-shot, k=5)	Accuracy	83.3	—	Unverified
9	Gopher-280B (few-shot, k=5)	Accuracy	81.8	—	Unverified
10	Gopher-280B (few-shot, k=5)	Accuracy	81	—	Unverified