Hallucination

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 901–950 of 1816 papers

Title	Date	Tasks	Status
VL-Uncertainty: Detecting Hallucination in Large Vision-Language Model via Uncertainty Estimation	Nov 18, 2024	HallucinationLanguage Modeling	CodeCode Available
Enabling Explainable Recommendation in E-commerce with LLM-powered Product Knowledge Graph	Nov 17, 2024	Explainable RecommendationHallucination	—Unverified
Understanding Multimodal LLMs: the Mechanistic Interpretability of Llava in Visual Question Answering	Nov 17, 2024	HallucinationIn-Context Learning	CodeCode Available
INVARLLM: LLM-assisted Physical Invariant Extraction for Cyber-Physical Systems Anomaly Detection	Nov 17, 2024	Anomaly DetectionHallucination	—Unverified
Chain-of-Programming (CoP) : Empowering Large Language Models for Geospatial Code Generation	Nov 16, 2024	Code GenerationData Visualization	—Unverified
ViBe: A Text-to-Video Benchmark for Evaluating Hallucination in Large Multimodal Models	Nov 16, 2024	HallucinationVideo Generation	—Unverified
A Novel Approach to Eliminating Hallucinations in Large Language Model-Assisted Causal Discovery	Nov 16, 2024	Causal DiscoveryHallucination	—Unverified
Seeing Clearly by Layer Two: Enhancing Attention Heads to Alleviate Hallucination in LVLMs	Nov 15, 2024	Hallucination	—Unverified
Mitigating Hallucination in Multimodal Large Language Model via Hallucination-targeted Direct Preference Optimization	Nov 15, 2024	HallucinationHallucination Evaluation	—Unverified
Layer Importance and Hallucination Analysis in Large Language Models via Enhanced Activation Variance-Sparsity	Nov 15, 2024	Contrastive LearningHallucination	—Unverified
LLM Hallucination Reasoning with Zero-shot Knowledge Test	Nov 14, 2024	Hallucination	—Unverified
DAHL: Domain-specific Automated Hallucination Evaluation of Long-Form Text through a Benchmark Dataset in Biomedicine	Nov 14, 2024	FormHallucination	CodeCode Available
On the Limits of Language Generation: Trade-Offs Between Hallucination and Mode Collapse	Nov 14, 2024	HallucinationLanguage Modeling	—Unverified
Bridging the Visual Gap: Fine-Tuning Multimodal Models with Knowledge-Adapted Captions	Nov 13, 2024	DescriptiveHallucination	CodeCode Available
Confidence-aware Denoised Fine-tuning of Off-the-shelf Models for Certified Robustness	Nov 13, 2024	Adversarial RobustnessDenoising	CodeCode Available
Verbosity Veracity: Demystify Verbosity Compensation Behavior of Large Language Models	Nov 12, 2024	Hallucination	CodeCode Available
Trustful LLMs: Customizing and Grounding Text Generation with Knowledge Bases and Dual Decoders	Nov 12, 2024	DecoderHallucination	—Unverified
DecoPrompt : Decoding Prompts Reduces Hallucinations when Large Language Models Meet False Premises	Nov 12, 2024	Hallucination	CodeCode Available
SHARP: Unlocking Interactive Hallucination via Stance Transfer in Role-Playing Agents	Nov 12, 2024	General KnowledgeHallucination	—Unverified
Evaluating the Accuracy of Chatbots in Financial Literature	Nov 11, 2024	ChatbotHallucination	—Unverified
Invar-RAG: Invariant LLM-aligned Retrieval for Better Generation	Nov 11, 2024	HallucinationInformation Retrieval	—Unverified
Prompt-Efficient Fine-Tuning for GPT-like Deep Models to Reduce Hallucination and to Improve Reproducibility in Scientific Text Generation Using Stochastic Optimisation Techniques	Nov 10, 2024	Hallucinationparameter-efficient fine-tuning	—Unverified
Mitigating Hallucination with ZeroG: An Advanced Knowledge Management Engine	Nov 8, 2024	Computational EfficiencyHallucination	—Unverified
Seeing Through the Fog: A Cost-Effectiveness Analysis of Hallucination Detection Systems	Nov 8, 2024	DiagnosticHallucination	—Unverified
LLM-R: A Framework for Domain-Adaptive Maintenance Scheme Generation Combining Hierarchical Agents and RAG	Nov 7, 2024	HallucinationRAG	—Unverified
AMSnet-KG: A Netlist Dataset for LLM-based AMS Circuit Auto-Design Using Knowledge Graph RAG	Nov 7, 2024	Bayesian OptimizationHallucination	—Unverified
Prompt-Guided Internal States for Hallucination Detection of Large Language Models	Nov 7, 2024	Domain GeneralizationHallucination	—Unverified
H-POPE: Hierarchical Polling-based Probing Evaluation of Hallucinations in Large Vision-Language Models	Nov 6, 2024	HallucinationObject	—Unverified
Fine-Tuning Vision-Language Model for Automated Engineering Drawing Information Extraction	Nov 6, 2024	HallucinationLanguage Modeling	—Unverified
Fine-Grained Guidance for Retrievers: Leveraging LLMs' Feedback in Retrieval-Augmented Generation	Nov 6, 2024	HallucinationRAG	—Unverified
DDFAV: Remote Sensing Large Vision Language Models Dataset and Evaluation Benchmark	Nov 5, 2024	Data AugmentationHallucination	CodeCode Available
VERITAS: A Unified Approach to Reliability Evaluation	Nov 5, 2024	Fact CheckingHallucination	—Unverified
Automated, LLM enabled extraction of synthesis details for reticular materials from scientific literature	Nov 5, 2024	HallucinationIn-Context Learning	—Unverified
Leveraging Vision-Language Models for Manufacturing Feature Recognition in CAD Designs	Nov 5, 2024	Few-Shot LearningHallucination	—Unverified
Robust plug-and-play methods for highly accelerated non-Cartesian MRI reconstruction	Nov 4, 2024	compressed sensingDenoising	—Unverified
CleAR: Robust Context-Guided Generative Lighting Estimation for Mobile Augmented Reality	Nov 4, 2024	HallucinationLighting Estimation	—Unverified
Improving Scientific Hypothesis Generation with Knowledge Grounded Large Language Models	Nov 4, 2024	Experimental DesignHallucination	—Unverified
Rate, Explain and Cite (REC): Enhanced Explanation and Attribution in Automatic Evaluation by Large Language Models	Nov 3, 2024	HallucinationInstruction Following	CodeCode Available
Towards Multi-Source Retrieval-Augmented Generation via Synergizing Reasoning and Preference-Driven Retrieval	Nov 1, 2024	HallucinationRAG	—Unverified
RadFlag: A Black-Box Hallucination Detection Method for Medical Vision Language Models	Nov 1, 2024	HallucinationLanguage Modeling	—Unverified
Exploring the Knowledge Mismatch Hypothesis: Hallucination Propensity in Small Models Fine-tuned on Data from Larger Models	Oct 31, 2024	HallucinationMisinformation	—Unverified
Improbable Bigrams Expose Vulnerabilities of Incomplete Tokens in Byte-Level Tokenizers	Oct 31, 2024	Hallucination	—Unverified
VisAidMath: Benchmarking Visual-Aided Mathematical Reasoning	Oct 30, 2024	BenchmarkingHallucination	—Unverified
EF-LLM: Energy Forecasting LLM with AI-assisted Automation, Enhanced Sparse Prediction, Hallucination Detection	Oct 30, 2024	Continual LearningHallucination	—Unverified
Unified Triplet-Level Hallucination Evaluation for Large Vision-Language Models	Oct 30, 2024	HallucinationHallucination Evaluation	CodeCode Available
Beyond Ontology in Dialogue State Tracking for Goal-Oriented Chatbot	Oct 30, 2024	ChatbotDialogue State Tracking	CodeCode Available
FactBench: A Dynamic Benchmark for In-the-Wild Language Model Factuality Evaluation	Oct 29, 2024	HallucinationLanguage Modeling	—Unverified
MARCO: Multi-Agent Real-time Chat Orchestration	Oct 29, 2024	HallucinationLanguage Modeling	—Unverified
A Perspective for Adapting Generalist AI to Specialized Medical AI Applications and Their Challenges	Oct 28, 2024	Drug DiscoveryHallucination	—Unverified
A Debate-Driven Experiment on LLM Hallucinations and Accuracy	Oct 25, 2024	Fact CheckingHallucination	—Unverified

Show:10 25 50

← PrevPage 19 of 37Next →

No leaderboard results yet.