SOTAVerified|Agents Browse Leaderboard About

Bias Detection

Bias detection is the task of detecting and measuring racism, sexism and otherwise discriminatory behavior in a model (Source: https://stereoset.mit.edu/)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 131–140 of 199 papers

Title	Date	Tasks	Status	Hype
Learning to Split for Automatic Bias Detection	Apr 28, 2022	Bias Detectionimage-classification	CodeCode Available	1
A Meta Survey of Quality Evaluation Criteria in Explanation Methods	Mar 25, 2022	Bias DetectionExplainable artificial intelligence	—Unverified	0
Entropy-based Attention Regularization Frees Unintended Bias Mitigation from Lists	Mar 17, 2022	Abuse DetectionBias Detection	CodeCode Available	1
Towards Identifying Social Bias in Dialog Systems: Frame, Datasets, and Benchmarks	Feb 16, 2022	Bias DetectionOpen-Domain Dialog	—Unverified	0
Modeling Multi-level Context for Informational Bias Detection by Contrastive Learning and Sentential Graph Network	Jan 25, 2022	ArticlesBias Detection	—Unverified	0
An Interdisciplinary Approach for the Automated Detection and Visualization of Media Bias in News Articles	Dec 26, 2021	ArticlesBias Detection	—Unverified	0
Forward Composition Propagation for Explainable Neural Reasoning	Dec 23, 2021	Bias DetectionFairness	CodeCode Available	0
Quantifying Gender Biases Towards Politicians on Reddit	Dec 22, 2021	Bias DetectionGender Bias Detection	CodeCode Available	0
Towards A Reliable Ground-Truth For Biased Language Detection	Dec 14, 2021	ArticlesBias Detection	—Unverified	0
Sparse Interventions in Language Models with Differentiable Masking	Dec 13, 2021	Bias DetectionGender Bias Detection	—Unverified	0

Show:10 25 50

← PrevPage 14 of 20Next →

All datasets StereoSet rt-inod-bias ICAT LLM bias PlantVillage_8px Wiki Neutrality Corpus

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	GPT-2 (small)	ICAT Score	72.97	—	Unverified
2	XLNet (large)	ICAT Score	72.03	—	Unverified
3	GPT-2 (medium)	ICAT Score	71.73	—	Unverified
4	BERT (base)	ICAT Score	71.21	—	Unverified
5	GPT-2 (large)	ICAT Score	70.54	—	Unverified
6	BERT (large)	ICAT Score	69.89	—	Unverified
7	RoBERTa (base)	ICAT Score	67.5	—	Unverified
8	GAL 120B	ICAT Score	65.6	—	Unverified
9	XLNet (base)	ICAT Score	62.1	—	Unverified
10	GPT-3 (text-davinci-002)	ICAT Score	60.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4	Best-of	0.5	—	Unverified
2	Baseline	Best-of	0.41	—	Unverified
3	Gemma	Best-of	0.41	—	Unverified
4	Mistral	Best-of	0.36	—	Unverified
5	Llama2	Best-of	0.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BAD	ICAT Score	23.44	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RandomForest_default_hyperparameters	Accuracy (%)	49	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RoBERTa+ALBERT	F1	70.4	—	Unverified