Hallucination

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 926–950 of 1816 papers

Title	Date	Tasks	Status
AMSnet-KG: A Netlist Dataset for LLM-based AMS Circuit Auto-Design Using Knowledge Graph RAG	Nov 7, 2024	Bayesian OptimizationHallucination	—Unverified
Prompt-Guided Internal States for Hallucination Detection of Large Language Models	Nov 7, 2024	Domain GeneralizationHallucination	—Unverified
H-POPE: Hierarchical Polling-based Probing Evaluation of Hallucinations in Large Vision-Language Models	Nov 6, 2024	HallucinationObject	—Unverified
Fine-Tuning Vision-Language Model for Automated Engineering Drawing Information Extraction	Nov 6, 2024	HallucinationLanguage Modeling	—Unverified
Fine-Grained Guidance for Retrievers: Leveraging LLMs' Feedback in Retrieval-Augmented Generation	Nov 6, 2024	HallucinationRAG	—Unverified
DDFAV: Remote Sensing Large Vision Language Models Dataset and Evaluation Benchmark	Nov 5, 2024	Data AugmentationHallucination	CodeCode Available
VERITAS: A Unified Approach to Reliability Evaluation	Nov 5, 2024	Fact CheckingHallucination	—Unverified
Automated, LLM enabled extraction of synthesis details for reticular materials from scientific literature	Nov 5, 2024	HallucinationIn-Context Learning	—Unverified
Leveraging Vision-Language Models for Manufacturing Feature Recognition in CAD Designs	Nov 5, 2024	Few-Shot LearningHallucination	—Unverified
Robust plug-and-play methods for highly accelerated non-Cartesian MRI reconstruction	Nov 4, 2024	compressed sensingDenoising	—Unverified
CleAR: Robust Context-Guided Generative Lighting Estimation for Mobile Augmented Reality	Nov 4, 2024	HallucinationLighting Estimation	—Unverified
Improving Scientific Hypothesis Generation with Knowledge Grounded Large Language Models	Nov 4, 2024	Experimental DesignHallucination	—Unverified
Rate, Explain and Cite (REC): Enhanced Explanation and Attribution in Automatic Evaluation by Large Language Models	Nov 3, 2024	HallucinationInstruction Following	CodeCode Available
Towards Multi-Source Retrieval-Augmented Generation via Synergizing Reasoning and Preference-Driven Retrieval	Nov 1, 2024	HallucinationRAG	—Unverified
RadFlag: A Black-Box Hallucination Detection Method for Medical Vision Language Models	Nov 1, 2024	HallucinationLanguage Modeling	—Unverified
Exploring the Knowledge Mismatch Hypothesis: Hallucination Propensity in Small Models Fine-tuned on Data from Larger Models	Oct 31, 2024	HallucinationMisinformation	—Unverified
Improbable Bigrams Expose Vulnerabilities of Incomplete Tokens in Byte-Level Tokenizers	Oct 31, 2024	Hallucination	—Unverified
VisAidMath: Benchmarking Visual-Aided Mathematical Reasoning	Oct 30, 2024	BenchmarkingHallucination	—Unverified
EF-LLM: Energy Forecasting LLM with AI-assisted Automation, Enhanced Sparse Prediction, Hallucination Detection	Oct 30, 2024	Continual LearningHallucination	—Unverified
Unified Triplet-Level Hallucination Evaluation for Large Vision-Language Models	Oct 30, 2024	HallucinationHallucination Evaluation	CodeCode Available
Beyond Ontology in Dialogue State Tracking for Goal-Oriented Chatbot	Oct 30, 2024	ChatbotDialogue State Tracking	CodeCode Available
FactBench: A Dynamic Benchmark for In-the-Wild Language Model Factuality Evaluation	Oct 29, 2024	HallucinationLanguage Modeling	—Unverified
MARCO: Multi-Agent Real-time Chat Orchestration	Oct 29, 2024	HallucinationLanguage Modeling	—Unverified
A Perspective for Adapting Generalist AI to Specialized Medical AI Applications and Their Challenges	Oct 28, 2024	Drug DiscoveryHallucination	—Unverified
A Debate-Driven Experiment on LLM Hallucinations and Accuracy	Oct 25, 2024	Fact CheckingHallucination	—Unverified

Show:10 25 50

← PrevPage 38 of 73Next →

No leaderboard results yet.