TruthfulQA

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–80 of 80 papers

Title	Date	Tasks	Status
DYNAMAX: Dynamic computing for Transformers and Mamba based architectures	Apr 29, 2025	MambaTriviaQA	—Unverified
Efficiently Deploying LLMs with Controlled Risk	Oct 3, 2024	MMLUTruthfulQA	—Unverified
Efficient MAP Estimation of LLM Judgment Performance with Prior Transfer	Apr 17, 2025	Conformal PredictionTruthfulQA	—Unverified
Elastic Weight Consolidation for Full-Parameter Continual Pre-Training of Gemma2	May 9, 2025	ARCBelebele	—Unverified
Evaluating Consistencies in LLM responses through a Semantic Clustering of Question Answering	Oct 20, 2024	Language ModellingLarge Language Model	—Unverified
GRATH: Gradual Self-Truthifying for Large Language Models	Jan 22, 2024	TruthfulQA	—Unverified
Harmonic LLMs are Trustworthy	Apr 30, 2024	HallucinationTruthfulQA	—Unverified
Instruction Tuning with Human Curriculum	Oct 14, 2023	ARCMMLU	—Unverified
Investigating Data Contamination in Modern Benchmarks for Large Language Models	Nov 16, 2023	Common Sense ReasoningMMLU	—Unverified
Iter-AHMCL: Alleviate Hallucination for Large Language Model via Iterative Model-level Contrastive Learning	Oct 16, 2024	Contrastive Learninggraph construction	—Unverified
Just Ask for Calibration: Strategies for Eliciting Calibrated Confidence Scores from Language Models Fine-Tuned with Human Feedback	May 24, 2023	TriviaQATruthfulQA	—Unverified
Layer Importance and Hallucination Analysis in Large Language Models via Enhanced Activation Variance-Sparsity	Nov 15, 2024	Contrastive LearningHallucination	—Unverified
LokiLM: Technical Report	Jul 10, 2024	Knowledge DistillationLanguage Modeling	—Unverified
Lower Layer Matters: Alleviating Hallucination via Multi-Layer Fusion Contrastive Decoding with Truthfulness Refocused	Aug 16, 2024	HallucinationTruthfulQA	—Unverified
Maintaining Informative Coherence: Migrating Hallucinations in Large Language Models via Absorbing Markov Chains	Oct 27, 2024	Text GenerationTruthfulQA	—Unverified
Mitigating Adversarial Attacks in LLMs through Defensive Suffix Generation	Dec 18, 2024	TruthfulQA	—Unverified
Model Unlearning via Sparse Autoencoder Subspace Guided Projections	May 30, 2025	Adversarial Robustnessfeature selection	—Unverified
Monty Hall and Optimized Conformal Prediction to Improve Decision-Making with LLMs	Dec 31, 2024	Conformal PredictionDecision Making	—Unverified
More is Less: The Pitfalls of Multi-Model Synthetic Preference Data in DPO Safety Alignment	Apr 3, 2025	ARCHellaSwag	—Unverified
Multi-Reference Preference Optimization for Large Language Models	May 26, 2024	GSM8KTruthfulQA	—Unverified
A Debate-Driven Experiment on LLM Hallucinations and Accuracy	Oct 25, 2024	Fact CheckingHallucination	—Unverified
On The Truthfulness of 'Surprisingly Likely' Responses of Large Language Models	Nov 13, 2023	Language ModelingLanguage Modelling	—Unverified
PRobELM: Plausibility Ranking Evaluation for Language Models	Apr 4, 2024	Question AnsweringTruthfulQA	—Unverified
Teuken-7B-Base & Teuken-7B-Instruct: Towards European LLMs	Sep 30, 2024	ARCDiversity	—Unverified
Reducing LLM Hallucinations using Epistemic Neural Networks	Dec 25, 2023	TruthfulQA	—Unverified
Student Data Paradox and Curious Case of Single Student-Tutor Model: Regressive Side Effects of Training LLMs for Personalized Learning	Apr 23, 2024	ARCCommon Sense Reasoning	—Unverified
Sample, Don't Search: Rethinking Test-Time Alignment for Language Models	Apr 4, 2025	GSM8KMathematical Reasoning	—Unverified
Selective Self-Rehearsal: A Fine-Tuning Approach to Improve Generalization in Large Language Models	Sep 7, 2024	MMLUTruthfulQA	—Unverified
Selective Self-to-Supervised Fine-Tuning for Generalization in Large Language Models	Feb 12, 2025	Mathematical ReasoningMMLU	—Unverified
Self-Alignment for Factuality: Mitigating Hallucinations in LLMs via Self-Evaluation	Feb 14, 2024	TruthfulQA	—Unverified

Show:10 25 50

← PrevPage 2 of 2Next →

No leaderboard results yet.