General Knowledge

This task aims to evaluate the ability of a model to answer general-knowledge questions.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 201–225 of 399 papers

Title	Date	Tasks	Status
What Would You Ask When You First Saw a^2+b^2=c^2? Evaluating LLM on Curiosity-Driven Questioning	Sep 19, 2024	General Knowledge	—Unverified
Bilingual Evaluation of Language Models on General Knowledge in University Entrance Exams with Minimal Contamination	Sep 19, 2024	General KnowledgeMMLU	—Unverified
Can LVLMs Obtain a Driver's License? A Benchmark Towards Reliable AGI for Autonomous Driving	Sep 4, 2024	Autonomous DrivingDecision Making	—Unverified
Biomedical Large Languages Models Seem not to be Superior to Generalist Models on Unseen Medical Data	Aug 25, 2024	Document SummarizationGeneral Knowledge	—Unverified
CoRA: Collaborative Information Perception by Large Language Model's Weights for Recommendation	Aug 20, 2024	Collaborative FilteringGeneral Knowledge	—Unverified
Molecular Graph Representation Learning Integrating Large Language Models with Domain-specific Small Models	Aug 19, 2024	DescriptiveDrug Discovery	CodeCode Available
PMoE: Progressive Mixture of Experts with Asymmetric Transformer for Continual Learning	Jul 31, 2024	Continual LearningGeneral Knowledge	—Unverified
Prompting Encoder Models for Zero-Shot Classification: A Cross-Domain Study in Italian	Jul 30, 2024	Document ClassificationEntity Typing	—Unverified
Constructing Enhanced Mutual Information for Online Class-Incremental Learning	Jul 26, 2024	class-incremental learningClass Incremental Learning	—Unverified
An Ad-hoc graph node vector embedding algorithm for general knowledge graphs using Kinetica-Graph	Jul 22, 2024	General KnowledgeKnowledge Graphs	—Unverified
Quantized Prompt for Efficient Generalization of Vision-Language Models	Jul 15, 2024	General KnowledgeLanguage Modelling	CodeCode Available
All Roads Lead to Rome: Unveiling the Trajectory of Recommender Systems Across the LLM Era	Jul 14, 2024	AllConversational Recommendation	—Unverified
Microsoft Cloud-based Digitization Workflow with Rich Metadata Acquisition for Cultural Heritage Objects	Jul 9, 2024	General Knowledge	—Unverified
Igea: a Decoder-Only Language Model for Biomedical Text Generation in Italian	Jul 8, 2024	Computational EfficiencyDecoder	—Unverified
SAM-Med3D-MoE: Towards a Non-Forgetting Segment Anything Model via Mixture of Experts for 3D Medical Image Segmentation	Jul 6, 2024	General KnowledgeImage Segmentation	—Unverified
SAFT: Towards Out-of-Distribution Generalization in Fine-Tuning	Jul 3, 2024	Few-Shot LearningGeneral Knowledge	—Unverified
BAPO: Base-Anchored Preference Optimization for Overcoming Forgetting in Large Language Models Personalization	Jun 30, 2024	Continual LearningGeneral Knowledge	—Unverified
Leveraging Large Language Models for enhanced personalised user experience in Smart Homes	Jun 28, 2024	General Knowledge	—Unverified
Disentangling Knowledge-based and Visual Reasoning by Question Decomposition in KB-VQA	Jun 27, 2024	General KnowledgeQuestion Answering	—Unverified
Exploring Safety-Utility Trade-Offs in Personalized Language Models	Jun 17, 2024	General Knowledge	—Unverified
Are Large Language Models a Good Replacement of Taxonomies?	Jun 17, 2024	General KnowledgeKnowledge Graphs	CodeCode Available
RepLiQA: A Question-Answering Dataset for Benchmarking LLMs on Unseen Reference Content	Jun 17, 2024	BenchmarkingGeneral Knowledge	CodeCode Available
Avoiding Copyright Infringement via Large Language Model Unlearning	Jun 16, 2024	General KnowledgeLanguage Modeling	CodeCode Available
Benchmarking Generative Models on Computational Thinking Tests in Elementary Visual Programming	Jun 14, 2024	BenchmarkingGeneral Knowledge	—Unverified
Learning from Natural Language Explanations for Generalizable Entity Matching	Jun 13, 2024	Binary ClassificationDomain Generalization	—Unverified

Show:10 25 50

← PrevPage 9 of 16Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Chinchilla-70B (few-shot, k=5)	Accuracy	94.3	—	Unverified
2	Gopher-280B (few-shot, k=5)	Accuracy	93.9	—	Unverified
3	Chinchilla-70B (few-shot, k=5)	Accuracy	85.7	—	Unverified
4	Gopher-280B (few-shot, k=5)	Accuracy	84.8	—	Unverified
5	Gopher-280B (few-shot, k=5)	Accuracy	84.2	—	Unverified
6	Gopher-280B (few-shot, k=5)	Accuracy	84.1	—	Unverified
7	Gopher-280B (few-shot, k=5)	Accuracy	83.9	—	Unverified
8	Gopher-280B (few-shot, k=5)	Accuracy	83.3	—	Unverified
9	Gopher-280B (few-shot, k=5)	Accuracy	81.8	—	Unverified
10	Gopher-280B (few-shot, k=5)	Accuracy	81	—	Unverified