General Knowledge

This task aims to evaluate the ability of a model to answer general-knowledge questions.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 151–175 of 399 papers

Title	Date	Tasks	Status
Insect-Foundation: A Foundation Model and Large Multimodal Dataset for Vision-Language Insect Understanding	Feb 14, 2025	General KnowledgeQuestion Answering	—Unverified
PhD Knowledge Not Required: A Reasoning Challenge for Large Language Models	Feb 3, 2025	General Knowledge	—Unverified
Enabling Autonomic Microservice Management through Self-Learning Agents	Jan 31, 2025	General KnowledgeManagement	—Unverified
FlexiCrackNet: A Flexible Pipeline for Enhanced Crack Segmentation with General Features Transfered from SAM	Jan 31, 2025	Computational EfficiencyCrack Segmentation	—Unverified
CALM: Unleashing the Cross-Lingual Self-Aligning Ability of Language Model Question Answering	Jan 30, 2025	General KnowledgeLanguage Modeling	—Unverified
Sample-Efficient Behavior Cloning Using General Domain Knowledge	Jan 27, 2025	Car RacingFeature Engineering	—Unverified
DAGPrompT: Pushing the Limits of Graph Prompting with a Distribution-aware Graph Prompt Tuning Approach	Jan 25, 2025	General KnowledgeGraph Classification	CodeCode Available
Pilot: Building the Federated Multimodal Instruction Tuning Framework	Jan 23, 2025	General Knowledge	—Unverified
How to Complete Domain Tuning while Keeping General Ability in LLM: Adaptive Layer-wise and Element-wise Regularization	Jan 23, 2025	General Knowledge	—Unverified
LLM4WM: Adapting LLM for Wireless Multi-Tasking	Jan 22, 2025	General KnowledgeLanguage Modeling	—Unverified
Generating Diverse Q&A Benchmarks for RAG Evaluation with DataMorgana	Jan 22, 2025	General KnowledgeRAG	—Unverified
Comparative Insights from 12 Machine Learning Models in Extracting Economic Ideology from Political Text	Jan 16, 2025	General Knowledge	—Unverified
Collective inference of the truth of propositions from crowd probability judgments	Jan 9, 2025	General Knowledge	—Unverified
Advancing Retrieval-Augmented Generation for Persian: Development of Language Models, Comprehensive Benchmarks, and Best Practices for Optimization	Jan 8, 2025	BenchmarkingGeneral Knowledge	—Unverified
KAnoCLIP: Zero-Shot Anomaly Detection through Knowledge-Driven Prompt Learning and Enhanced Cross-Modal Integration	Jan 7, 2025	Anomaly DetectionAnomaly Segmentation	—Unverified
The Scaling Law for LoRA Base on Mutual Information Upper Bound	Jan 6, 2025	General Knowledge	—Unverified
MoColl: Agent-Based Specific and General Model Collaboration for Image Captioning	Jan 3, 2025	DiagnosticGeneral Knowledge	—Unverified
KnowRA: Knowledge Retrieval Augmented Method for Document-level Relation Extraction with Comprehensive Reasoning Abilities	Dec 31, 2024	Common Sense ReasoningDocument-level Relation Extraction	—Unverified
scReader: Prompting Large Language Models to Interpret scRNA-seq Data	Dec 24, 2024	General Knowledge	—Unverified
Survey on Abstractive Text Summarization: Dataset, Models, and Metrics	Dec 22, 2024	Abstractive Text SummarizationGeneral Knowledge	CodeCode Available
Extending TWIG: Zero-Shot Predictive Hyperparameter Selection for KGEs based on Graph Structure	Dec 19, 2024	General KnowledgeKnowledge Graph Embeddings	—Unverified
Are Longer Prompts Always Better? Prompt Selection in Large Language Models for Recommendation Systems	Dec 19, 2024	General KnowledgeRecommendation Systems	—Unverified
MoSLD: An Extremely Parameter-Efficient Mixture-of-Shared LoRAs for Multi-Task Learning	Dec 12, 2024	Domain GeneralizationGeneral Knowledge	—Unverified
What Makes Cryptic Crosswords Challenging for LLMs?	Dec 12, 2024	General Knowledge	CodeCode Available
TRIM: Token Reduction and Inference Modeling for Cost-Effective Language Generation	Dec 10, 2024	General KnowledgeText Generation	—Unverified

Show:10 25 50

← PrevPage 7 of 16Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Chinchilla-70B (few-shot, k=5)	Accuracy	94.3	—	Unverified
2	Gopher-280B (few-shot, k=5)	Accuracy	93.9	—	Unverified
3	Chinchilla-70B (few-shot, k=5)	Accuracy	85.7	—	Unverified
4	Gopher-280B (few-shot, k=5)	Accuracy	84.8	—	Unverified
5	Gopher-280B (few-shot, k=5)	Accuracy	84.2	—	Unverified
6	Gopher-280B (few-shot, k=5)	Accuracy	84.1	—	Unverified
7	Gopher-280B (few-shot, k=5)	Accuracy	83.9	—	Unverified
8	Gopher-280B (few-shot, k=5)	Accuracy	83.3	—	Unverified
9	Gopher-280B (few-shot, k=5)	Accuracy	81.8	—	Unverified
10	Gopher-280B (few-shot, k=5)	Accuracy	81	—	Unverified