SOTAVerified|Agents Browse Leaderboard About

TruthfulQA

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–75 of 80 papers

Title	Date	Tasks	Status	Hype
When Hindsight is Not 20/20: Testing Limits on Reflective Thinking in Large Language Models	Apr 14, 2024	TruthfulQA	CodeCode Available	0
PoLLMgraph: Unraveling Hallucinations in Large Language Models via State Transition Dynamics	Apr 6, 2024	BenchmarkingHallucination	CodeCode Available	0
PRobELM: Plausibility Ranking Evaluation for Language Models	Apr 4, 2024	Question AnsweringTruthfulQA	—Unverified	0
Non-Linear Inference Time Intervention: Improving LLM Truthfulness	Mar 27, 2024	Large Language ModelMultiple-choice	CodeCode Available	1
In-Context Sharpness as Alerts: An Inner Representation Perspective for Hallucination Mitigation	Mar 3, 2024	HallucinationTruthfulQA	CodeCode Available	2
TruthX: Alleviating Hallucinations by Editing Large Language Models in Truthful Space	Feb 27, 2024	Contrastive LearningHallucination	CodeCode Available	2
SaGE: Evaluating Moral Consistency in Large Language Models	Feb 21, 2024	Decision MakingHellaSwag	CodeCode Available	0
LLMAuditor: A Framework for Auditing Large Language Models Using Human-in-the-Loop	Feb 14, 2024	HallucinationTruthfulQA	—Unverified	0
Self-Alignment for Factuality: Mitigating Hallucinations in LLMs via Self-Evaluation	Feb 14, 2024	TruthfulQA	—Unverified	0
GRATH: Gradual Self-Truthifying for Large Language Models	Jan 22, 2024	TruthfulQA	—Unverified	0
Tuning Language Models by Proxy	Jan 16, 2024	Domain AdaptationMath	CodeCode Available	2
Truth Forest: Toward Multi-Scale Truthfulness in Large Language Models through Intervention without Tuning	Dec 29, 2023	TruthfulQA	CodeCode Available	1
Alleviating Hallucinations of Large Language Models through Induced Hallucinations	Dec 25, 2023	HallucinationHallucination Evaluation	CodeCode Available	1
Reducing LLM Hallucinations using Epistemic Neural Networks	Dec 25, 2023	TruthfulQA	—Unverified	0
Self-Evaluation Improves Selective Generation in Large Language Models	Dec 14, 2023	Multiple-choiceTruthfulQA	—Unverified	0
Uncertainty-aware Language Modeling for Selective Question Answering	Nov 26, 2023	Language ModelingLanguage Modelling	—Unverified	0
Investigating Data Contamination in Modern Benchmarks for Large Language Models	Nov 16, 2023	Common Sense ReasoningMMLU	—Unverified	0
On The Truthfulness of 'Surprisingly Likely' Responses of Large Language Models	Nov 13, 2023	Language ModelingLanguage Modelling	—Unverified	0
Instruction Tuning with Human Curriculum	Oct 14, 2023	ARCMMLU	CodeCode Available	0
Tool-Augmented Reward Modeling	Oct 2, 2023	TruthfulQA	CodeCode Available	1
RAIN: Your Language Models Can Align Themselves without Finetuning	Sep 13, 2023	Adversarial AttackTruthfulQA	CodeCode Available	1
Sight Beyond Text: Multi-Modal Training Enhances LLMs in Truthfulness and Ethics	Sep 13, 2023	EthicsTruthfulQA	CodeCode Available	1
DoLa: Decoding by Contrasting Layers Improves Factuality in Large Language Models	Sep 7, 2023	TruthfulQA	CodeCode Available	2
Red-Teaming Large Language Models using Chain of Utterances for Safety-Alignment	Aug 18, 2023	MMLURed Teaming	CodeCode Available	1
Semantic Consistency for Assuring Reliability of Large Language Models	Aug 17, 2023	Question AnsweringText Generation	—Unverified	0

Show:10 25 50

← PrevPage 3 of 4Next →

No leaderboard results yet.