Hallucination

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 451–500 of 1816 papers

Title	Date	Tasks	Status	Hype
Large Language Model-Enhanced Symbolic Reasoning for Knowledge Base Completion	Jan 2, 2025	DiversityHallucination	—Unverified	0
Think More, Hallucinate Less: Mitigating Hallucinations via Dual Process of Fast and Slow Thinking	Jan 2, 2025	HallucinationText Generation	—Unverified	0
Stop Learning it all to Mitigate Visual Hallucination, Focus on the Hallucination Target.	Jan 1, 2025	AllHallucination	—Unverified	0
VASparse: Towards Efficient Visual Hallucination Mitigation via Visual-Aware Token Sparsification	Jan 1, 2025	Hallucination	CodeCode Available	1
Mitigating Object Hallucinations in Large Vision-Language Models with Assembly of Global and Local Attention	Jan 1, 2025	HallucinationResponse Generation	CodeCode Available	2
Octopus: Alleviating Hallucination via Dynamic Contrastive Decoding	Jan 1, 2025	Hallucination	CodeCode Available	1
VL-RewardBench: A Challenging Benchmark for Vision-Language Generative Reward Models	Jan 1, 2025	Hallucination	—Unverified	0
POPEN: Preference-Based Optimization and Ensemble for LVLM-Based Reasoning Segmentation	Jan 1, 2025	HallucinationReasoning Segmentation	—Unverified	0
RRHF-V: Ranking Responses to Mitigate Hallucinations in Multimodal Large Language Models with Human Feedback	Jan 1, 2025	HallucinationImage Comprehension	CodeCode Available	0
IllusionBench: A Large-scale and Comprehensive Benchmark for Visual Illusion Understanding in Vision-Language Models	Jan 1, 2025	HallucinationMultiple-choice	—Unverified	0
A review of faithfulness metrics for hallucination assessment in Large Language Models	Dec 31, 2024	BenchmarkingHallucination	—Unverified	0
Distilling Desired Comments for Enhanced Code Review with Large Language Models	Dec 29, 2024	Dataset DistillationHallucination	—Unverified	0
HALLUCINOGEN: A Benchmark for Evaluating Object Hallucination in Large Visual-Language Models	Dec 29, 2024	HallucinationObject	CodeCode Available	0
Is Your Text-to-Image Model Robust to Caption Noise?	Dec 27, 2024	DescriptiveHallucination	—Unverified	0
An End-to-End Depth-Based Pipeline for Selfie Image Rectification	Dec 26, 2024	Depth EstimationHallucination	—Unverified	0
MedHallBench: A New Benchmark for Assessing Hallucination in Medical Large Language Models	Dec 25, 2024	Hallucinationreinforcement-learning	—Unverified	0
From Hallucinations to Facts: Enhancing Language Models with Curated Knowledge Graphs	Dec 24, 2024	HallucinationKnowledge Graphs	—Unverified	0
Extract Free Dense Misalignment from CLIP	Dec 24, 2024	HallucinationImage Generation	CodeCode Available	1
Improving Factuality with Explicit Working Memory	Dec 24, 2024	Fact CheckingHallucination	—Unverified	0
Harnessing Large Language Models for Knowledge Graph Question Answering via Adaptive Multi-Aspect Retrieval-Augmentation	Dec 24, 2024	Graph Question AnsweringHallucination	CodeCode Available	1
Multimodal Preference Data Synthetic Alignment with Reward Model	Dec 23, 2024	2kCaption Generation	CodeCode Available	0
CiteBART: Learning to Generate Citations for Local Citation Recommendation	Dec 23, 2024	Citation PredictionCitation Recommendation	CodeCode Available	0
AlzheimerRAG: Multimodal Retrieval Augmented Generation for PubMed articles	Dec 21, 2024	ArticlesDecision Making	—Unverified	0
Toward Robust Hyper-Detailed Image Captioning: A Multiagent Approach and Dual Evaluation Metrics for Factuality and Coverage	Dec 20, 2024	AttributeBenchmarking	—Unverified	0
Logical Consistency of Large Language Models in Fact-checking	Dec 20, 2024	Fact CheckingHallucination	—Unverified	0
Token Preference Optimization with Self-Calibrated Visual-Anchored Rewards for Hallucination Mitigation	Dec 19, 2024	Hallucination	—Unverified	0
Think&Cite: Improving Attributed Text Generation with Self-Guided Tree Search and Progress Reward Modeling	Dec 19, 2024	HallucinationText Generation	—Unverified	0
A Comparative Study of DSPy Teleprompter Algorithms for Aligning Large Language Models Evaluation Metrics to Human Evaluation	Dec 19, 2024	HallucinationLanguage Modeling	—Unverified	0
Query pipeline optimization for cancer patient question answering systems	Dec 19, 2024	HallucinationPassage Retrieval	—Unverified	0
Dehallucinating Parallel Context Extension for Retrieval-Augmented Generation	Dec 19, 2024	HallucinationRAG	—Unverified	0
Cracking the Code of Hallucination in LVLMs with Vision-aware Head Divergence	Dec 18, 2024	HallucinationMultimodal Reasoning	—Unverified	0
Are LLMs Good Literature Review Writers? Evaluating the Literature Review Writing Ability of Large Language Models	Dec 18, 2024	Hallucination	—Unverified	0
ReXTrust: A Model for Fine-Grained Hallucination Detection in AI-Generated Radiology Reports	Dec 17, 2024	Hallucination	—Unverified	0
A MapReduce Approach to Effectively Utilize Long Context Information in Retrieval Augmented Language Models	Dec 17, 2024	HallucinationRAG	—Unverified	0
When to Speak, When to Abstain: Contrastive Decoding with Abstention	Dec 17, 2024	HallucinationQuestion Answering	—Unverified	0
What External Knowledge is Preferred by LLMs? Characterizing and Exploring Chain of Evidence in Imperfect Context	Dec 17, 2024	HallucinationMisinformation	—Unverified	0
A Benchmark and Robustness Study of In-Context-Learning with Large Language Models in Music Entity Detection	Dec 16, 2024	HallucinationIn-Context Learning	CodeCode Available	0
Emma-X: An Embodied Multimodal Action Model with Grounded Chain of Thought and Look-ahead Spatial Reasoning	Dec 16, 2024	HallucinationRobot Manipulation	CodeCode Available	2
CG-Bench: Clue-grounded Question Answering Benchmark for Long Video Understanding	Dec 16, 2024	HallucinationMultiple-choice	—Unverified	0
Task-Oriented Dialog Systems for the Senegalese Wolof Language	Dec 15, 2024	ChatbotHallucination	—Unverified	0
RAC3: Retrieval-Augmented Corner Case Comprehension for Autonomous Driving with Vision-Language Models	Dec 15, 2024	Autonomous DrivingContrastive Learning	—Unverified	0
Combating Multimodal LLM Hallucination via Bottom-Up Holistic Reasoning	Dec 15, 2024	Hallucination	—Unverified	0
Accelerating Retrieval-Augmented Generation	Dec 14, 2024	CPUHallucination	—Unverified	0
NoisyEQA: Benchmarking Embodied Question Answering Against Noisy Queries	Dec 14, 2024	BenchmarkingEmbodied Question Answering	—Unverified	0
Thinking with Knowledge Graphs: Enhancing LLM Reasoning Through Structured Data	Dec 14, 2024	HallucinationKnowledge Graphs	—Unverified	0
TACOMORE: Leveraging the Potential of LLMs in Corpus-based Discourse Analysis with Prompt Engineering	Dec 13, 2024	ArticlesHallucination	—Unverified	0
Detecting LLM Hallucination Through Layer-wise Information Deficiency: Analysis of Unanswerable Questions and Ambiguous Prompts	Dec 13, 2024	Hallucination	—Unverified	0
Benchmarking large language models for materials synthesis: the case of atomic layer deposition	Dec 13, 2024	BenchmarkingHallucination	—Unverified	0
Multi-Task Learning with LLMs for Implicit Sentiment Analysis: Data-level and Task-level Automatic Weight Learning	Dec 12, 2024	Aspect-Based Sentiment Analysis (ABSA)Hallucination	—Unverified	0
Filter-then-Generate: Large Language Models with Structure-Text Adapter for Knowledge Graph Completion	Dec 12, 2024	HallucinationKnowledge Graph Completion	CodeCode Available	1

Show:10 25 50

← PrevPage 10 of 37Next →

No leaderboard results yet.