SOTAVerified|Agents Browse Leaderboard About Blog

Bias Detection

Bias detection is the task of detecting and measuring racism, sexism and otherwise discriminatory behavior in a model (Source: https://stereoset.mit.edu/)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 61–70 of 199 papers

Title	Date	Tasks	Status	Hype	Score
Quantifying Gender Biases Towards Politicians on Reddit	Dec 22, 2021	Bias DetectionGender Bias Detection	CodeCode Available	0	5
DeNetDM: Debiasing by Network Depth Modulation	Mar 28, 2024	Bias DetectionMitigating Contextual Bias	CodeCode Available	0	5
fairmodels: A Flexible Tool For Bias Detection, Visualization, And Mitigation	Apr 1, 2021	Bias DetectionFairness	CodeCode Available	0	5
Detection of Puffery on the English Wikipedia	Nov 1, 2021	Bias DetectionInformation Retrieval	CodeCode Available	0	5
Don’t Discard All the Biased Instances: Investigating a Core Assumption in Dataset Bias Mitigation Techniques	Nov 1, 2021	AllBias Detection	CodeCode Available	0	5
Detecting Media Bias in News Articles using Gaussian Bias Distributions	Oct 20, 2020	ArticlesBias Detection	CodeCode Available	0	5
Disentangling Structure and Style: Political Bias Detection in News by Inducing Document Hierarchy	Apr 5, 2023	ArticlesBias Detection	CodeCode Available	0	5
DispaRisk: Auditing Fairness Through Usable Information	May 20, 2024	BenchmarkingBias Detection	CodeCode Available	0	5
Can Global XAI Methods Reveal Injected Bias in LLMs? SHAP vs Rule Extraction vs RuleSHAP	May 16, 2025	Bias DetectionMisinformation	CodeCode Available	0	5
Automated Dependence Plots	Dec 2, 2019	Bias DetectionModel Selection	CodeCode Available	0	5

Show:10 25 50

← PrevPage 7 of 20Next →

All datasets StereoSet rt-inod-bias ICAT LLM bias PlantVillage_8px Wiki Neutrality Corpus

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	GPT-2 (small)	ICAT Score	72.97	—	Unverified
2	XLNet (large)	ICAT Score	72.03	—	Unverified
3	GPT-2 (medium)	ICAT Score	71.73	—	Unverified
4	BERT (base)	ICAT Score	71.21	—	Unverified
5	GPT-2 (large)	ICAT Score	70.54	—	Unverified
6	BERT (large)	ICAT Score	69.89	—	Unverified
7	RoBERTa (base)	ICAT Score	67.5	—	Unverified
8	GAL 120B	ICAT Score	65.6	—	Unverified
9	XLNet (base)	ICAT Score	62.1	—	Unverified
10	GPT-3 (text-davinci-002)	ICAT Score	60.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4	Best-of	0.5	—	Unverified
2	Baseline	Best-of	0.41	—	Unverified
3	Gemma	Best-of	0.41	—	Unverified
4	Mistral	Best-of	0.36	—	Unverified
5	Llama2	Best-of	0.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BAD	ICAT Score	23.44	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RandomForest_default_hyperparameters	Accuracy (%)	49	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RoBERTa+ALBERT	F1	70.4	—	Unverified