Bias Detection

Bias detection is the task of detecting and measuring racism, sexism and otherwise discriminatory behavior in a model (Source: https://stereoset.mit.edu/)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 176–199 of 199 papers

Title	Date	Tasks	Status	Hype
Enhancing Bias Detection in Political News Using Pragmatic Presupposition	Jul 1, 2020	ArticlesBias Detection	—Unverified	0
Towards Integrating Fairness Transparently in Industrial Applications	Jun 10, 2020	Bias DetectionFairness	—Unverified	0
Detecting Emergent Intersectional Biases: Contextualized Word Embeddings Contain a Distribution of Human-like Biases	Jun 6, 2020	Bias DetectionSentence	CodeCode Available	1
NewB: 200,000+ Sentences for Political Bias Detection	Jun 4, 2020	Bias DetectionBinary Classification	CodeCode Available	0
Fair Is Better than Sensational: Man Is to Doctor as Woman Is to Doctor	Jun 1, 2020	Bias DetectionDiagnostic	—Unverified	0
Towards explainable classifiers using the counterfactual approach -- global explanations for discovering bias in data	May 5, 2020	Bias Detectioncounterfactual	CodeCode Available	1
Annotating and Analyzing Biased Sentences in News Articles using Crowdsourcing	May 1, 2020	ArticlesBias Detection	—Unverified	0
The Impact of Presentation Style on Human-In-The-Loop Detection of Algorithmic Bias	Apr 26, 2020	Bias DetectionBIG-bench Machine Learning	—Unverified	0
StereoSet: Measuring stereotypical bias in pretrained language models	Apr 20, 2020	Bias DetectionMath	CodeCode Available	1
InsideBias: Measuring Bias in Deep Networks and Application to Face Gender Biometrics	Apr 14, 2020	Bias Detection	—Unverified	0
Designing Tools for Semi-Automated Detection of Machine Learning Biases: An Interview Study	Mar 13, 2020	Bias DetectionBIG-bench Machine Learning	—Unverified	0
Towards Detection of Subjective Bias using Contextualized Word Embeddings	Feb 16, 2020	Bias DetectionPropaganda detection	CodeCode Available	0
Bias in word embeddings	Jan 27, 2020	Bias DetectionWord Embeddings	—Unverified	0
Automated Dependence Plots	Dec 2, 2019	Bias DetectionModel Selection	CodeCode Available	0
My Approach = Your Apparatus? Entropy-Based Topic Modeling on Multiple Domain-Specific Text Collections	Nov 25, 2019	ArticlesBias Detection	CodeCode Available	0
Accurate Uncertainty Estimation and Decomposition in Ensemble Learning	Nov 11, 2019	Bias DetectionEnsemble Learning	—Unverified	0
Predicting the Leading Political Ideology of YouTube Channels Using Acoustic, Textual, and Metadata Information	Oct 20, 2019	Bias DetectionMultimodal Deep Learning	CodeCode Available	0
Multilingual sentence-level bias detection in Wikipedia	Sep 1, 2019	ArticlesBias Detection	CodeCode Available	0
Detecting Political Bias in News Articles Using Headline Attention	Aug 1, 2019	ArticlesBias Detection	—Unverified	0
Measuring Gender Bias in Word Embeddings across Domains and Discovering New Gender Bias Word Categories	Aug 1, 2019	Bias DetectionClustering	CodeCode Available	0
Team Kermit-the-frog at SemEval-2019 Task 4: Bias Detection Through Sentiment Analysis and Simple Linguistic Features	Jun 1, 2019	Bias DetectionSentiment Analysis	—Unverified	0
Fair is Better than Sensational:Man is to Doctor as Woman is to Doctor	May 23, 2019	Bias DetectionDiagnostic	CodeCode Available	0
Evaluating Fairness Metrics in the Presence of Dataset Bias	Sep 24, 2018	Bias DetectionCausal Inference	—Unverified	0
Large-scale news entity sentiment analysis	Sep 1, 2017	ArticlesBias Detection	—Unverified	0

Show:10 25 50

← PrevPage 8 of 8Next →

All datasets StereoSet rt-inod-bias ICAT LLM bias PlantVillage_8px Wiki Neutrality Corpus

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	GPT-2 (small)	ICAT Score	72.97	—	Unverified
2	XLNet (large)	ICAT Score	72.03	—	Unverified
3	GPT-2 (medium)	ICAT Score	71.73	—	Unverified
4	BERT (base)	ICAT Score	71.21	—	Unverified
5	GPT-2 (large)	ICAT Score	70.54	—	Unverified
6	BERT (large)	ICAT Score	69.89	—	Unverified
7	RoBERTa (base)	ICAT Score	67.5	—	Unverified
8	GAL 120B	ICAT Score	65.6	—	Unverified
9	XLNet (base)	ICAT Score	62.1	—	Unverified
10	GPT-3 (text-davinci-002)	ICAT Score	60.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4	Best-of	0.5	—	Unverified
2	Baseline	Best-of	0.41	—	Unverified
3	Gemma	Best-of	0.41	—	Unverified
4	Mistral	Best-of	0.36	—	Unverified
5	Llama2	Best-of	0.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BAD	ICAT Score	23.44	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RandomForest_default_hyperparameters	Accuracy (%)	49	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RoBERTa+ALBERT	F1	70.4	—	Unverified