Hate Speech Detection

Hate speech detection is the task of detecting if communication such as text, audio, and so on contains hatred and or encourages violence towards a person or a group of people. This is usually based on prejudice against 'protected characteristics' such as their ethnicity, gender, sexual orientation, religion, age et al. Some example benchmarks are ETHOS and HateXplain. Models can be evaluated with metrics like the F-score or F-measure.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 401–450 of 507 papers

Title	Date	Tasks	Status
Hate Speech Detection in Saudi Twittersphere: A Deep Learning Approach	Dec 1, 2020	Deep LearningHate Speech Detection	—Unverified
Learning Domain Terms - Empirical Methods to Enhance Enterprise Text Analytics Performance	Dec 1, 2020	Hate Speech Detection	—Unverified
Effect of Word Embedding Models on Hate and Offensive Speech Detection	Nov 23, 2020	Hate Speech Detection	—Unverified
An Online Multilingual Hate speech Recognition System	Nov 23, 2020	Hate Speech Detectionspeech-recognition	CodeCode Available
DeL-haTE: A Deep Learning Tunable Ensemble for Hate Speech Detection	Nov 3, 2020	Hate Speech DetectionTransfer Learning	CodeCode Available
Towards Code-switched Classification Exploiting Constituent Language Resources	Nov 3, 2020	ClassificationGeneral Classification	—Unverified
Comparative Evaluation of Label-Agnostic Selection Bias in Multilingual Hate Speech Datasets	Nov 1, 2020	Hate Speech DetectionSelection bias	CodeCode Available
Investigating Annotator Bias with a Graph-Based Approach	Nov 1, 2020	BIG-bench Machine LearningCommunity Detection	CodeCode Available
In Data We Trust: A Critical Analysis of Hate Speech Detection Datasets	Nov 1, 2020	Hate Speech Detection	—Unverified
Impact of Politically Biased Data on Hate Speech Classification	Nov 1, 2020	ClassificationHate Speech Detection	CodeCode Available
Bayesian Methods for Semi-supervised Text Annotation	Oct 28, 2020	Deep LearningHate Speech Detection	—Unverified
CRAB: Class Representation Attentive BERT for Hate Speech Identification in Social Media	Oct 25, 2020	Hate Speech DetectionSentence	—Unverified
Fair Hate Speech Detection through Evaluation of Social Group Counterfactuals	Oct 24, 2020	counterfactualFairness	—Unverified
On Transferability of Bias Mitigation Effects in Language Model Fine-Tuning	Oct 24, 2020	coreference-resolutionCoreference Resolution	—Unverified
HateBERT: Retraining BERT for Abusive Language Detection in English	Oct 23, 2020	Abusive LanguageHate Speech Detection	CodeCode Available
Reducing Unintended Identity Bias in Russian Hate Speech Detection	Oct 22, 2020	Hate Speech Detection	—Unverified
Gauravarora@HASOC-Dravidian-CodeMix-FIRE2020: Pre-training ULMFiT on Synthetically Generated Code-Mixed Data for Hate Speech Detection	Oct 5, 2020	Hate Speech Detection	—Unverified
Empirical Study of Text Augmentation on Social Media Text in Vietnamese	Sep 25, 2020	Data AugmentationGeneral Classification	CodeCode Available
Hate Speech Detection and Racial Bias Mitigation in Social Media based on BERT model	Aug 14, 2020	Abusive LanguageHate Speech Detection	—Unverified
HSD Shared Task in VLSP Campaign 2019:Hate Speech Detection for Social Good	Jul 13, 2020	General ClassificationHate Speech Detection	CodeCode Available
To BAN or not to BAN: Bayesian Attention Networks for Reliable Hate Speech Detection	Jul 10, 2020	ClassificationGeneral Classification	—Unverified
Automatic Detection of Sexist Statements Commonly Used at the Workplace	Jul 8, 2020	Hate Speech DetectionSentiment Analysis	CodeCode Available
TweetBLM: A Hate Speech Dataset and Analysis of Black Lives Matter-related Microblogs on Twitter:	Jun 25, 2020	Hate Speech Detection	—Unverified
SemEval-2020 Task 12: Multilingual Offensive Language Identification in Social Media (OffensEval 2020)	Jun 12, 2020	Abusive LanguageHate Speech Detection	—Unverified
Investigating Deep Learning Approaches for Hate Speech Detection in Social Media	May 29, 2020	Hate Speech Detection	—Unverified
Demoting Racial Bias in Hate Speech Detection	May 25, 2020	Hate Speech Detection	—Unverified
Leveraging Affective Bidirectional Transformers for Offensive Language Detection	May 16, 2020	Data AugmentationFeature Engineering	—Unverified
OSACT4 Shared Task on Offensive Language Detection: Intensive Preprocessing-Based Approach	May 14, 2020	ClassificationDimensionality Reduction	—Unverified
Towards Hate Speech Detection at Large via Deep Generative Modeling	May 13, 2020	DiversityHate Speech Detection	CodeCode Available
Code-switching patterns can be an effective route to improve performance of downstream NLP applications: A case study of humour, sarcasm and hate speech detection	May 5, 2020	Hate Speech Detection	—Unverified
OSACT4 Shared Tasks: Ensembled Stacked Classification for Offensive and Hate Speech in Arabic Tweets	May 1, 2020	General ClassificationHate Speech Detection	—Unverified
Arabic Offensive Language Detection with Attention-based Deep Neural Networks	May 1, 2020	Abusive LanguageBIG-bench Machine Learning	—Unverified
Multitask Learning for Arabic Offensive Language and Hate-Speech Detection	May 1, 2020	Hate Speech DetectionTransfer Learning	—Unverified
A Comparative Study of Different State-of-the-Art Hate Speech Detection Methods in Hindi-English Code-Mixed Data	May 1, 2020	Hate Speech Detection	—Unverified
ALT Submission for OSACT Shared Task on Offensive Language Detection	May 1, 2020	Hate Speech Detection	—Unverified
Cross-lingual Zero- and Few-shot Hate Speech Detection Utilising Frozen Transformer Language Models and AXEL	Apr 13, 2020	Few-Shot LearningGeneral Classification	—Unverified
A Legal Approach to Hate Speech -- Operationalizing the EU's Legal Framework against the Expression of Hatred as an NLP Task	Apr 7, 2020	Decision MakingHate Speech Detection	—Unverified
4chan & 8chan embeddings	Apr 2, 2020	Hate Speech DetectionWord Embeddings	—Unverified
Evaluating Semantic Feature Representations to Efficiently Detect Hate Intent on Social Media	Feb 1, 2020	General ClassificationHate Speech Detection	—Unverified
Comparison Between Traditional Machine Learning Models And Neural Network Models For Vietnamese Hate Speech Detection	Jan 31, 2020	BIG-bench Machine LearningHate Speech Detection	CodeCode Available
Stereotypical Bias Removal for Hate Speech Detection Task using Knowledge-based Generalizations	Jan 15, 2020	Abuse DetectionHate Speech Detection	—Unverified
Towards countering hate speech against journalists on social media	Dec 5, 2019	Active LearningHate Speech Detection	—Unverified
Hate Speech Detection on Vietnamese Social Media Text using the Bi-GRU-LSTM-CNN Model	Nov 9, 2019	Hate Speech DetectionVietnamese Hate Speech Detection	CodeCode Available
Hate Speech Detection on Vietnamese Social Media Text using the Bidirectional-LSTM Model	Nov 9, 2019	BIG-bench Machine LearningHate Speech Detection	CodeCode Available
A BERT-Based Transfer Learning Approach for Hate Speech Detection in Online Social Media	Oct 28, 2019	Hate Speech DetectionLanguage Modelling	CodeCode Available
VAIS Hate Speech Detection System: A Deep Learning based Approach for System Combination	Oct 12, 2019	Hate Speech Detection	—Unverified
Exploring Hate Speech Detection in Multimodal Publications	Oct 9, 2019	Hate Speech Detection	CodeCode Available
Voice for the Voiceless: Active Sampling to Detect Comments Supporting the Rohingyas	Oct 8, 2019	Active LearningHate Speech Detection	—Unverified
Hate Speech in Pixels: Detection of Offensive Memes towards Automatic Moderation	Oct 5, 2019	Hate Speech Detection	CodeCode Available
Prediction Uncertainty Estimation for Hate Speech Classification	Sep 16, 2019	Bayesian InferenceClassification	—Unverified

Show:10 25 50

← PrevPage 9 of 11Next →

All datasets Ethos Binary HateXplain Ethos MultiLabel Waseem et al., 2018 AbusEval Automatic Misogynistic Identification HateMM HatEval OffensEval 2019 ToLD-Br bajer_danish_misogyny DKhate

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	BiLSTM + static BE	F1-score	0.8	—	Unverified
2	BERT	F1-score	0.79	—	Unverified
3	BiLSTM+Attention+FT	F1-score	0.77	—	Unverified
4	OPT-175B (few-shot)	F1-score	0.76	—	Unverified
5	CNN+Attention+FT+GV	F1-score	0.74	—	Unverified
6	OPT-175B (one-shot)	F1-score	0.71	—	Unverified
7	OPT-175B (zero-shot)	F1-score	0.67	—	Unverified
8	SVM	F1-score	0.66	—	Unverified
9	Random Forests	F1-score	0.64	—	Unverified
10	Davinci (zero-shot)	F1-score	0.63	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BERT-MRP	AUROC	0.86	—	Unverified
2	BERT-RP	AUROC	0.85	—	Unverified
3	BERT-HateXplain [LIME]	AUROC	0.85	—	Unverified
4	BERT-HateXplain [Attn]	AUROC	0.85	—	Unverified
5	BERT [Attn]	AUROC	0.84	—	Unverified
6	BiRNN-HateXplain [Attn]	AUROC	0.81	—	Unverified
7	BiRNN-Attn [Attn]	AUROC	0.8	—	Unverified
8	CNN-GRU [LIME]	AUROC	0.79	—	Unverified
9	BiRNN [LIME]	AUROC	0.77	—	Unverified
10	XG-HSI-BERT	Accuracy	0.75	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MLARAM	Hamming Loss	0.29	—	Unverified
2	MLkNN	Hamming Loss	0.16	—	Unverified
3	Binary Relevance	Hamming Loss	0.14	—	Unverified
4	Neural Classifier Chains	Hamming Loss	0.13	—	Unverified
5	Neural Binary Relevance	Hamming Loss	0.11	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Mozafari et al., 2019	AAA	50.94	—	Unverified
2	SVM	AAA	46.51	—	Unverified
3	Kennedy et al., 2020	AAA	45.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	HateBERT	Macro F1	0.74	—	Unverified
2	BERT	Macro F1	0.72	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	mBert	Accuracy	0.83	—	Unverified
2	Logistic Regression	Accuracy	0.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	HXP + CLAP + CLIP	TEST F1 (macro)	0.85	—	Unverified
2	BERT + ViT + MFCC	TEST F1 (macro)	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	HateBERT	Macro F1	0.49	—	Unverified
2	BERT	Macro F1	0.48	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	HateBERT	Macro F1	0.81	—	Unverified
2	BERT	Macro F1	0.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Multilingual BERT	F1-score	0.75	—	Unverified
2	AutoML	F1-score	0.74	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AOM mBERT	F1	0.85	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Baseline	F1	0.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RoBERTa-large-ST	Macro F1	80.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Baseline BERT (task A)	F1	0.77	—	Unverified