Hallucination

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–150 of 1816 papers

Title	Date	Tasks	Status	Hype
Chain-of-Thought Poisoning Attacks against R1-based Retrieval-Augmented Generation Systems	May 22, 2025	Adversarial AttackHallucination	—Unverified	0
Mitigating Hallucinations in Vision-Language Models through Image-Guided Head Suppression	May 22, 2025	HallucinationImage Description	CodeCode Available	1
AudioTrust: Benchmarking the Multifaceted Trustworthiness of Audio Large Language Models	May 22, 2025	BenchmarkingFairness	CodeCode Available	3
Walk&Retrieve: Simple Yet Effective Zero-shot Retrieval-Augmented Generation via Knowledge Graph Walks	May 22, 2025	HallucinationRAG	CodeCode Available	0
NEXT-EVAL: Next Evaluation of Traditional and LLM Web Data Record Extraction	May 21, 2025	BenchmarkingHallucination	—Unverified	0
Aug2Search: Enhancing Facebook Marketplace Search with LLM-Generated Synthetic Data Augmentation	May 21, 2025	Data AugmentationDiversity	—Unverified	0
OViP: Online Vision-Language Preference Learning	May 21, 2025	Hallucination	—Unverified	0
Hallucinate at the Last in Long Response Generation: A Case Study on Long Document Summarization	May 21, 2025	Document SummarizationHallucination	—Unverified	0
Multilingual Prompting for Improving LLM Generation Diversity	May 21, 2025	DiversityHallucination	—Unverified	0
KaFT: Knowledge-aware Fine-tuning for Boosting LLMs' Domain-specific Question-Answering Performance	May 21, 2025	HallucinationQuestion Answering	—Unverified	0
RePPL: Recalibrating Perplexity by Uncertainty in Semantic Propagation and Language Generation for Explainable QA Hallucination Detection	May 21, 2025	HallucinationText Generation	—Unverified	0
HCRMP: A LLM-Hinted Contextual Reinforcement Learning Framework for Autonomous Driving	May 21, 2025	Autonomous DrivingHallucination	—Unverified	0
Reinforcing Question Answering Agents with Minimalist Policy Gradient Optimization	May 20, 2025	HallucinationIn-Context Learning	—Unverified	0
Foundations of Unknown-aware Machine Learning	May 20, 2025	Hallucination	—Unverified	0
Multimodal RAG-driven Anomaly Detection and Classification in Laser Powder Bed Fusion using Large Language Models	May 20, 2025	Anomaly DetectionDescriptive	—Unverified	0
Visual Instruction Bottleneck Tuning	May 20, 2025	HallucinationObject Hallucination	—Unverified	0
JARVIS: A Multi-Agent Code Assistant for High-Quality EDA Script Generation	May 20, 2025	HallucinationScript Generation	—Unverified	0
Plane Geometry Problem Solving with Multi-modal Reasoning: A Survey	May 20, 2025	DecoderGeometry Problem Solving	—Unverified	0
Pierce the Mists, Greet the Sky: Decipher Knowledge Overshadowing via Knowledge Circuit Analysis	May 20, 2025	Hallucination	—Unverified	0
The Hallucination Tax of Reinforcement Finetuning	May 20, 2025	HallucinationMath	—Unverified	0
Towards Omnidirectional Reasoning with 360-R1: A Dataset, Benchmark, and GRPO-based Method	May 20, 2025	HallucinationObject Localization	—Unverified	0
Aligning Attention Distribution to Information Flow for Hallucination Mitigation in Large Vision-Language Models	May 20, 2025	HallucinationImage Captioning	—Unverified	0
Toward Reliable Biomedical Hypothesis Generation: Evaluating Truthfulness and Hallucination in Large Language Models	May 20, 2025	Hallucinationscientific discovery	CodeCode Available	0
DeepEyes: Incentivizing "Thinking with Images" via Reinforcement Learning	May 20, 2025	HallucinationMathematical Reasoning	CodeCode Available	5
Legal Rule Induction: Towards Generalizable Principle Discovery from Analogous Judicial Precedents	May 20, 2025	Hallucination	—Unverified	0
MultiHal: Multilingual Dataset for Knowledge-Graph Grounded Evaluation of LLM Hallucinations	May 20, 2025	Fact CheckingHallucination	CodeCode Available	0
Know Or Not: a library for evaluating out-of-knowledge base robustness	May 19, 2025	HallucinationRAG	CodeCode Available	1
Selective Code Generation for Functional Guarantees	May 19, 2025	Code GenerationHallucination	—Unverified	0
Granary: Speech Recognition and Translation Dataset in 25 European Languages	May 19, 2025	HallucinationPunctuation Restoration	—Unverified	0
LLM-based Query Expansion Fails for Unfamiliar and Ambiguous Queries	May 19, 2025	HallucinationRetrieval	CodeCode Available	0
Calm-Whisper: Reduce Whisper Hallucination On Non-Speech By Calming Crazy Heads Down	May 19, 2025	Automatic Speech RecognitionDecoder	—Unverified	0
Mitigating Hallucination in VideoLLMs via Temporal-Aware Activation Engineering	May 19, 2025	Hallucination	—Unverified	0
Detection and Mitigation of Hallucination in Large Reasoning Models: A Mechanistic Perspective	May 19, 2025	Hallucination	—Unverified	0
Tianyi: A Traditional Chinese Medicine all-rounder language model and its Real-World Clinical Practice	May 19, 2025	AllHallucination	—Unverified	0
Learning Auxiliary Tasks Improves Reference-Free Hallucination Detection in Open-Domain Long-Form Generation	May 18, 2025	Fact CheckingForm	—Unverified	0
Mitigating Hallucinations via Inter-Layer Consistency Aggregation in Large Vision-Language Models	May 18, 2025	HallucinationMME	—Unverified	0
The Tower of Babel Revisited: Multilingual Jailbreak Prompts on Closed-Source Large Language Models	May 18, 2025	Hallucination	—Unverified	0
Mixture of Decoding: An Attention-Inspired Adaptive Decoding Strategy to Mitigate Hallucinations in Large Vision-Language Models	May 17, 2025	Hallucination	CodeCode Available	0
CCNU at SemEval-2025 Task 3: Leveraging Internal and External Knowledge of Large Language Models for Multilingual Hallucination Annotation	May 17, 2025	HallucinationQuestion Answering	—Unverified	0
Are Multimodal Large Language Models Ready for Omnidirectional Spatial Reasoning?	May 17, 2025	HallucinationObject Counting	—Unverified	0
Towards Robust Evaluation of STEM Education: Leveraging MLLMs in Project-Based Learning	May 16, 2025	HallucinationInformation Retrieval	—Unverified	0
Diverging Towards Hallucination: Detection of Failures in Vision-Language Models via Multi-token Aggregation	May 16, 2025	DiagnosticHallucination	—Unverified	0
EmotionHallucer: Evaluating Emotion Hallucinations in Multimodal Large Language Models	May 16, 2025	Hallucination	CodeCode Available	0
Phare: A Safety Probe for Large Language Models	May 16, 2025	DiagnosticHallucination	CodeCode Available	1
Finetune-RAG: Fine-Tuning Language Models to Resist Hallucination in Retrieval-Augmented Generation	May 16, 2025	HallucinationRAG	CodeCode Available	1
DO-RAG: A Domain-Specific QA Framework Using Knowledge Graph-Enhanced Retrieval-Augmented Generation	May 15, 2025	graph constructionHallucination	CodeCode Available	0
AI Agents vs. Agentic AI: A Conceptual Taxonomy, Applications and Challenges	May 15, 2025	AI AgentData Summarization	—Unverified	0
Beyond the Black Box: Interpretability of LLMs in Finance	May 14, 2025	FairnessHallucination	—Unverified	0
The Impact of Large Language Models on Task Automation in Manufacturing Services	May 14, 2025	HallucinationQuestion Answering	—Unverified	0
A Multimodal Multi-Agent Framework for Radiology Report Generation	May 14, 2025	DiagnosticHallucination	—Unverified	0

Show:10 25 50

← PrevPage 3 of 37Next →

No leaderboard results yet.