Hallucination

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1051–1100 of 1816 papers

Title	Date	Tasks	Status
Effectively Enhancing Vision Language Large Models by Prompt Augmentation and Caption Utilization	Sep 22, 2024	HallucinationHallucination Evaluation	CodeCode Available
Contrastive Learning for Knowledge-Based Question Generation in Large Language Models	Sep 21, 2024	Contrastive LearningHallucination	—Unverified
FIHA: Autonomous Hallucination Evaluation in Vision-Language Models with Davidson Scene Graphs	Sep 20, 2024	HallucinationHallucination Evaluation	—Unverified
A Multiple-Fill-in-the-Blank Exam Approach for Enhancing Zero-Resource Hallucination Detection in Large Language Models	Sep 20, 2024	HallucinationSentence	—Unverified
JourneyBench: A Challenging One-Stop Vision-Language Understanding Benchmark of Generated Images	Sep 19, 2024	HallucinationImage Captioning	CodeCode Available
LLMs Can Check Their Own Results to Mitigate Hallucinations in Traffic Understanding Tasks	Sep 19, 2024	Autonomous DrivingHallucination	—Unverified
Textualized Agent-Style Reasoning for Complex Tasks by Multiple Round LLM Generation	Sep 19, 2024	Hallucination	—Unverified
THaMES: An End-to-End Tool for Hallucination Mitigation and Evaluation in Large Language Models	Sep 17, 2024	BenchmarkingBinary Classification	CodeCode Available
Zero-resource Hallucination Detection for Text Generation via Graph-based Contextual Knowledge Triples Modeling	Sep 17, 2024	HallucinationText Generation	—Unverified
Depth-based Privileged Information for Boosting 3D Human Pose Estimation on RGB	Sep 17, 2024	3D Human Pose EstimationHallucination	—Unverified
Exploring the Trade-Offs: Quantization Methods, Task Difficulty, and Model Size in Large Language Models From Edge to Giant	Sep 17, 2024	HallucinationInstruction Following	CodeCode Available
Optimizing Resource Consumption in Diffusion Models through Hallucination Early Detection	Sep 16, 2024	Hallucination	—Unverified
HALO: Hallucination Analysis and Learning Optimization to Empower LLMs with Retrieval-Augmented Context for Guided Clinical Decision Making	Sep 16, 2024	Answer GenerationDecision Making	CodeCode Available
SFR-RAG: Towards Contextually Faithful LLMs	Sep 16, 2024	counterfactualHallucination	—Unverified
Confidence Estimation for LLM-Based Dialogue State Tracking	Sep 15, 2024	Dialogue State TrackingHallucination	CodeCode Available
Explore the Hallucination on Low-level Perception for MLLMs	Sep 15, 2024	HallucinationQuestion Answering	—Unverified
ODE: Open-Set Evaluation of Hallucinations in Multimodal Large Language Models	Sep 14, 2024	AttributeHallucination	—Unverified
Winning Solution For Meta KDD Cup' 24	Sep 13, 2024	HallucinationKnowledge Graphs	—Unverified
MEDIC: Towards a Comprehensive Framework for Evaluating LLMs in Clinical Applications	Sep 11, 2024	EthicsHallucination	—Unverified
Safety challenges of AI in medicine in the era of large language models	Sep 11, 2024	Hallucination	—Unverified
Mitigating Hallucination in Visual-Language Models via Re-Balancing Contrastive Decoding	Sep 10, 2024	HallucinationImage Captioning	—Unverified
LLMs Will Always Hallucinate, and We Need to Live With This	Sep 9, 2024	Fact CheckingHallucination	—Unverified
Generating Faithful and Salient Text from Multimodal Data	Sep 6, 2024	HallucinationKnowledge Graphs	CodeCode Available
Detecting Buggy Contracts via Smart Testing	Sep 6, 2024	Hallucination	—Unverified
Combining LLMs and Knowledge Graphs to Reduce Hallucinations in Question Answering	Sep 6, 2024	HallucinationKnowledge Graphs	—Unverified
Vietnamese Legal Information Retrieval in Question-Answering System	Sep 5, 2024	HallucinationInformation Retrieval	—Unverified
CLUE: Concept-Level Uncertainty Estimation for Large Language Models	Sep 4, 2024	HallucinationSentence	—Unverified
Improved Single Camera BEV Perception Using Multi-Camera Training	Sep 4, 2024	Autonomous DrivingHallucination	—Unverified
Hallucination Detection in LLMs: Fast and Memory-Efficient Fine-Tuned Models	Sep 4, 2024	GPUHallucination	CodeCode Available
Multi-Source Knowledge Pruning for Retrieval-Augmented Generation: A Benchmark and Empirical Study	Sep 3, 2024	BenchmarkingHallucination	CodeCode Available
Understanding Multimodal Hallucination with Parameter-Free Representation Alignment	Sep 2, 2024	HallucinationObject	CodeCode Available
What does it take to get state of the art in simultaneous speech-to-speech translation?	Sep 2, 2024	HallucinationManagement	—Unverified
LLMs Prompted for Graphs: Hallucinations and Generative Capabilities	Aug 30, 2024	DiversityHallucination	—Unverified
Pre-Training Multimodal Hallucination Detectors with Corrupted Grounding Data	Aug 30, 2024	HallucinationPhrase Grounding	—Unverified
UserSumBench: A Benchmark Framework for Evaluating User Summarization Approaches	Aug 30, 2024	HallucinationRecommendation Systems	—Unverified
VLM4Bio: A Benchmark Dataset to Evaluate Pretrained Vision-Language Models for Trait Discovery from Biological Images	Aug 28, 2024	Hallucination	CodeCode Available
Measuring text summarization factuality using atomic facts entailment metrics in the context of retrieval augmented generation	Aug 27, 2024	HallucinationRetrieval-augmented Generation	—Unverified
Evidence-Enhanced Triplet Generation Framework for Hallucination Alleviation in Generative Question Answering	Aug 27, 2024	Generative Question AnsweringHallucination	—Unverified
Negation Blindness in Large Language Models: Unveiling the NO Syndrome in Image Generation	Aug 27, 2024	HallucinationImage Generation	—Unverified
Genetic Approach to Mitigate Hallucination in Generative IR	Aug 25, 2024	Answer GenerationHallucination	CodeCode Available
Towards Reliable Medical Question Answering: Techniques and Challenges in Mitigating Hallucinations in Language Models	Aug 25, 2024	Decision MakingHallucination	—Unverified
Internal and External Knowledge Interactive Refinement Framework for Knowledge-Intensive Question Answering	Aug 23, 2024	HallucinationQuestion Answering	—Unverified
Can LLM be a Good Path Planner based on Prompt Engineering? Mitigating the Hallucination for Path Planning	Aug 23, 2024	HallucinationPrompt Engineering	—Unverified
Improving Factuality in Large Language Models via Decoding-Time Hallucinatory and Truthful Comparators	Aug 22, 2024	HallucinationMixture-of-Experts	CodeCode Available
RoVRM: A Robust Visual Reward Model Optimized via Auxiliary Textual Preference Data	Aug 22, 2024	Hallucination	CodeCode Available
GRATR: Zero-Shot Evidence Graph Retrieval-Augmented Trustworthiness Reasoning	Aug 22, 2024	Decision MakingHallucination	CodeCode Available
MedDiT: A Knowledge-Controlled Diffusion Transformer Framework for Dynamic Medical Image Generation in Virtual Simulated Patient	Aug 22, 2024	DiagnosticHallucination	—Unverified
Towards Analyzing and Mitigating Sycophancy in Large Vision-Language Models	Aug 21, 2024	HallucinationPrompt Engineering	—Unverified
RAG-Optimized Tibetan Tourism LLMs: Enhancing Accuracy and Personalization	Aug 21, 2024	HallucinationRAG	—Unverified
MAPLE: Enhancing Review Generation with Multi-Aspect Prompt LEarning in Explainable Recommendation	Aug 19, 2024	DiversityExplainable Recommendation	—Unverified

Show:10 25 50

← PrevPage 22 of 37Next →

No leaderboard results yet.