Bias Detection

Bias detection is the task of detecting and measuring racism, sexism and otherwise discriminatory behavior in a model (Source: https://stereoset.mit.edu/)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–150 of 199 papers

Title	Date	Tasks	Status
Decoding News Narratives: A Critical Analysis of Large Language Models in Framing Detection	Feb 18, 2024	Bias Detection	—Unverified
IndiVec: An Exploration of Leveraging Large Language Models for Media Bias Detection with Fine-Grained Bias Indicators	Feb 1, 2024	Bias DetectionInstruction Following	CodeCode Available
The Media Bias Taxonomy: A Systematic Literature Review on the Forms and Automated Detection of Media Bias	Dec 26, 2023	Bias DetectionSystematic Literature Review	CodeCode Available
Multilingual Bias Detection and Mitigation for Indian Languages	Dec 23, 2023	Bias DetectionBinary Classification	—Unverified
Large Language Model (LLM) Bias Index -- LLMBI	Dec 22, 2023	Bias DetectionFairness	—Unverified
Extending Variability-Aware Model Selection with Bias Detection in Machine Learning Projects	Nov 23, 2023	Bias DetectionModel Selection	—Unverified
Current Topological and Machine Learning Applications for Bias Detection in Text	Nov 22, 2023	Bias DetectionLanguage Modeling	—Unverified
Subtle Misogyny Detection and Mitigation: An Expert-Annotated Dataset	Nov 15, 2023	Bias DetectionText Generation	—Unverified
Unmasking Bias in AI: A Systematic Review of Bias Detection and Mitigation Strategies in Electronic Health Record-based Models	Oct 30, 2023	ArticlesBias Detection	—Unverified
Target-Aware Contextual Political Bias Detection in News	Oct 2, 2023	Bias DetectionData Augmentation	—Unverified
Unlocking Bias Detection: Leveraging Transformer-Based Models for Content Analysis	Sep 30, 2023	Bias DetectionDecision Making	—Unverified
Investigating Subtler Biases in LLMs: Ageism, Beauty, Institutional, and Nationality Bias in Generative Models	Sep 16, 2023	Age/Bias-conflictingBias Detection	CodeCode Available
Unsupervised Bias Detection in College Student Newspapers	Sep 11, 2023	Bias DetectionLanguage Modeling	—Unverified
LUCID-GAN: Conditional Generative Models to Locate Unfairness	Jul 28, 2023	Bias DetectionFairness	CodeCode Available
Auditing Predictive Models for Intersectional Biases	Jun 22, 2023	Bias DetectionFairness	—Unverified
Trade-Offs Between Fairness and Privacy in Language Modeling	May 24, 2023	Bias DetectionFairness	CodeCode Available
Language-Agnostic Bias Detection in Language Models with Bias Probing	May 22, 2023	Bias Detection	CodeCode Available
Bipol: A Novel Multi-Axes Bias Evaluation Metric with Explainability for NLP	Apr 8, 2023	Bias DetectionSentence	CodeCode Available
Disentangling Structure and Style: Political Bias Detection in News by Inducing Document Hierarchy	Apr 5, 2023	ArticlesBias Detection	CodeCode Available
Adding Instructions during Pretraining: Effective Way of Controlling Toxicity in Language Models	Feb 14, 2023	Bias DetectionData Augmentation	—Unverified
Bipol: Multi-axes Evaluation of Bias with Explainability in Benchmark Datasets	Jan 28, 2023	Bias DetectionDiagnostic	CodeCode Available
Auditing Algorithmic Fairness in Machine Learning for Health with Severity-Based LOGAN	Nov 16, 2022	Bias DetectionClustering	—Unverified
Mind Your Bias: A Critical Review of Bias Detection Methods for Contextual Language Models	Nov 15, 2022	Bias DetectionWord Embeddings	CodeCode Available
Exploiting Transformer-based Multitask Learning for the Detection of Media Bias in News Articles	Nov 7, 2022	ArticlesBias Detection	—Unverified
A Keyword Based Approach to Understanding the Overpenalization of Marginalized Groups by English Marginal Abuse Models on Twitter	Oct 7, 2022	Bias DetectionFairness	—Unverified
Efficient Gender Debiasing of Pre-trained Indic Language Models	Sep 8, 2022	Bias DetectionCultural Vocal Bursts Intensity Prediction	—Unverified
A Unified Comparison of User Modeling Techniques for Predicting Data Interaction and Detecting Exploration Bias	Aug 9, 2022	Bias DetectionData Interaction	CodeCode Available
Robots Enact Malignant Stereotypes	Jul 23, 2022	Bias DetectionGender Bias Detection	—Unverified
MRCLens: an MRC Dataset Bias Detection Toolkit	Jul 18, 2022	Bias DetectionMachine Reading Comprehension	—Unverified
A methodology to characterize bias and harmful stereotypes in natural language processing in Latin America	Jul 14, 2022	Bias DetectionDecision Making	CodeCode Available
Incorporating Subjectivity into Gendered Ambiguous Pronoun (GAP) Resolution using Style Transfer	Jul 1, 2022	Bias Detectioncoreference-resolution	—Unverified
HeteroCorpus: A Corpus for Heteronormative Language Detection	Jul 1, 2022	Bias DetectionGender Bias Detection	CodeCode Available
Personalized Detection of Cognitive Biases in Actions of Users from Their Logs: Anchoring and Recency Biases	Jun 30, 2022	Bias DetectionEthics	—Unverified
Towards WinoQueer: Developing a Benchmark for Anti-Queer Bias in Large Language Models	Jun 23, 2022	Bias Detection	—Unverified
Uncovering bias in the PlantVillage dataset	Jun 9, 2022	Bias DetectionDeep Learning	CodeCode Available
Beyond Explanation: A Case for Exploratory Text Visualizations of Non-Aggregated, Annotated Datasets	Jun 1, 2022	Bias DetectionHate Speech Detection	—Unverified
A Domain-adaptive Pre-training Approach for Language Bias Detection in News	May 22, 2022	Bias DetectionDecision Making	CodeCode Available
How sensitive are translation systems to extra contexts? Mitigating gender bias in Neural Machine Translation models through relevant contexts	May 22, 2022	Bias DetectionMachine Translation	CodeCode Available
Constructive Interpretability with CoLabel: Corroborative Integration, Complementary Features, and Collaborative Learning	May 20, 2022	Bias Detection	—Unverified
Towards Detecting Political Bias in Hindi News Articles	May 1, 2022	ArticlesBias Detection	—Unverified
A Meta Survey of Quality Evaluation Criteria in Explanation Methods	Mar 25, 2022	Bias DetectionExplainable artificial intelligence	—Unverified
Towards Identifying Social Bias in Dialog Systems: Frame, Datasets, and Benchmarks	Feb 16, 2022	Bias DetectionOpen-Domain Dialog	—Unverified
Modeling Multi-level Context for Informational Bias Detection by Contrastive Learning and Sentential Graph Network	Jan 25, 2022	ArticlesBias Detection	—Unverified
An Interdisciplinary Approach for the Automated Detection and Visualization of Media Bias in News Articles	Dec 26, 2021	ArticlesBias Detection	—Unverified
Forward Composition Propagation for Explainable Neural Reasoning	Dec 23, 2021	Bias DetectionFairness	CodeCode Available
Quantifying Gender Biases Towards Politicians on Reddit	Dec 22, 2021	Bias DetectionGender Bias Detection	CodeCode Available
Towards A Reliable Ground-Truth For Biased Language Detection	Dec 14, 2021	ArticlesBias Detection	—Unverified
Sparse Interventions in Language Models with Differentiable Masking	Dec 13, 2021	Bias DetectionGender Bias Detection	—Unverified
Anatomizing Bias in Facial Analysis	Dec 13, 2021	Bias Detection	—Unverified
MRCLens: an MRC Dataset Bias Detection Toolkit	Nov 16, 2021	Bias DetectionMachine Reading Comprehension	—Unverified

Show:10 25 50

← PrevPage 3 of 4Next →

All datasets StereoSet rt-inod-bias ICAT LLM bias PlantVillage_8px Wiki Neutrality Corpus

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	GPT-2 (small)	ICAT Score	72.97	—	Unverified
2	XLNet (large)	ICAT Score	72.03	—	Unverified
3	GPT-2 (medium)	ICAT Score	71.73	—	Unverified
4	BERT (base)	ICAT Score	71.21	—	Unverified
5	GPT-2 (large)	ICAT Score	70.54	—	Unverified
6	BERT (large)	ICAT Score	69.89	—	Unverified
7	RoBERTa (base)	ICAT Score	67.5	—	Unverified
8	GAL 120B	ICAT Score	65.6	—	Unverified
9	XLNet (base)	ICAT Score	62.1	—	Unverified
10	GPT-3 (text-davinci-002)	ICAT Score	60.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4	Best-of	0.5	—	Unverified
2	Gemma	Best-of	0.41	—	Unverified
3	Baseline	Best-of	0.41	—	Unverified
4	Mistral	Best-of	0.36	—	Unverified
5	Llama2	Best-of	0.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BAD	ICAT Score	23.44	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RandomForest_default_hyperparameters	Accuracy (%)	49	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RoBERTa+ALBERT	F1	70.4	—	Unverified