Word Embeddings

Word embedding is the collective name for a set of language modeling and feature learning techniques in natural language processing (NLP) where words or phrases from the vocabulary are mapped to vectors of real numbers.

Techniques for learning word embeddings can include Word2Vec, GloVe, and other neural network-based approaches that train on an NLP task such as language modeling or document classification.

( Image credit: Dynamic Word Embedding for Evolving Semantic Discovery )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–50 of 4002 papers

Title	Date	Tasks	Status	Hype	Score
Fine-mixing: Mitigating Backdoors in Fine-tuned Language Models	Oct 18, 2022	Language ModellingSentence	CodeCode Available	8	5
CharacterFactory: Sampling Consistent Characters with GANs for Diffusion Models	Apr 24, 2024	Consistent Character GenerationWord Embeddings	CodeCode Available	3	5
Generative Adversarial Training for Text-to-Speech Synthesis Based on Raw Phonetic Input and Explicit Prosody Modelling	Oct 14, 2023	Speech Synthesistext-to-speech	CodeCode Available	2	5
ConceptNet at SemEval-2017 Task 2: Extending Word Embeddings with Multilingual Relational Knowledge	Apr 11, 2017	General KnowledgeMultilingual Word Embeddings	CodeCode Available	2	5
ConceptNet 5.5: An Open Multilingual Graph of General Knowledge	Dec 12, 2016	General KnowledgeWord Embeddings	CodeCode Available	2	5
FASTopic: Pretrained Transformer is a Fast, Adaptive, Stable, and Transferable Topic Model	May 28, 2024	RelationTopic Models	CodeCode Available	2	5
WSI-VQA: Interpreting Whole Slide Images by Generative Visual Question Answering	Jul 8, 2024	DiagnosticGenerative Visual Question Answering	CodeCode Available	2	5
RETVec: Resilient and Efficient Text Vectorizer	Feb 18, 2023	Adversarial TextMetric Learning	CodeCode Available	2	5
A Pilot Study for Chinese SQL Semantic Parsing	Sep 29, 2019	Cross-Lingual Word EmbeddingsQuestion Answering	CodeCode Available	2	5
Contextual Semantic Embeddings for Ontology Subsumption Prediction	Feb 20, 2022	Knowledge Graph EmbeddingsLanguage Modeling	CodeCode Available	2	5
VNLP: Turkish NLP Package	Mar 2, 2024	Morphological Analysisnamed-entity-recognition	CodeCode Available	2	5
An Ensemble Method to Produce High-Quality Word Embeddings (2016)	Apr 6, 2016	Vocal Bursts Intensity PredictionWord Embeddings	CodeCode Available	2	5
Train Short, Test Long: Attention with Linear Biases Enables Input Length Extrapolation	Aug 27, 2021	Inductive BiasPlaying the Game of 2048	CodeCode Available	2	5
CTRAN: CNN-Transformer-based Network for Natural Language Understanding	Mar 19, 2023	DecoderIntent Detection	CodeCode Available	1	5
Cross-Lingual Word Embedding Refinement by _1 Norm Optimisation	Jun 1, 2021	Bilingual Lexicon InductionCross-Lingual Transfer	CodeCode Available	1	5
Cycle Text-To-Image GAN with BERT	Mar 26, 2020	Image GenerationWord Embeddings	CodeCode Available	1	5
Cooperative Self-training of Machine Reading Comprehension	Mar 12, 2021	Extractive Question-AnsweringMachine Reading Comprehension	CodeCode Available	1	5
Contextualized Embeddings based Transformer Encoder for Sentence Similarity Modeling in Answer Selection Task	May 1, 2020	Answer SelectionSentence	CodeCode Available	1	5
Cross-lingual Transfer for Text Classification with Dictionary-based Heterogeneous Graph	Sep 9, 2021	Cross-Lingual TransferGraph Neural Network	CodeCode Available	1	5
Data Mining in Clinical Trial Text: Transformers for Classification and Question Answering Tasks	Jan 30, 2020	Entity Extraction using GANGeneral Classification	CodeCode Available	1	5
Compositional Demographic Word Embeddings	Oct 6, 2020	Language ModelingLanguage Modelling	CodeCode Available	1	5
Combining Static Word Embeddings and Contextual Representations for Bilingual Lexicon Induction	Jun 6, 2021	Bilingual Lexicon InductionWord Embeddings	CodeCode Available	1	5
AI4Bharat-IndicNLP Corpus: Monolingual Corpora and Word Embeddings for Indic Languages	Apr 30, 2020	Word Embeddings	CodeCode Available	1	5
Context-aware Feature Generation for Zero-shot Semantic Segmentation	Aug 16, 2020	SegmentationSemantic Segmentation	CodeCode Available	1	5
comp-syn: Perceptually Grounded Word Embeddings with Color	Oct 8, 2020	Image RetrievalWord Embeddings	CodeCode Available	1	5
Contextual Word Representations: A Contextual Introduction	Feb 15, 2019	Question AnsweringTranslation	CodeCode Available	1	5
ALIGN-MLM: Word Embedding Alignment is Crucial for Multilingual Pre-training	Nov 15, 2022	Cross-Lingual TransferPOS	CodeCode Available	1	5
Cross-Lingual Word Embedding Refinement by _1 Norm Optimisation	Apr 11, 2021	Bilingual Lexicon InductionCross-Lingual Transfer	CodeCode Available	1	5
All Word Embeddings from One Embedding	Apr 25, 2020	AllDecoder	CodeCode Available	1	5
ALL-IN-1: Short Text Classification with One Model for All Languages	Oct 26, 2017	AllGeneral Classification	CodeCode Available	1	5
CODER: Knowledge infused cross-lingual medical term embedding for term normalization	Nov 5, 2020	Contrastive LearningKnowledge Graphs	CodeCode Available	1	5
Can a Fruit Fly Learn Word Embeddings?	Jan 18, 2021	Document ClassificationWord Embeddings	CodeCode Available	1	5
FAME: Feature-Based Adversarial Meta-Embeddings for Robust Input Representations	Oct 23, 2020	NERPOS	CodeCode Available	1	5
Combining Self-Training and Self-Supervised Learning for Unsupervised Disfluency Detection	Oct 29, 2020	Self-Supervised LearningWord Embeddings	CodeCode Available	1	5
BERT for Monolingual and Cross-Lingual Reverse Dictionary	Sep 30, 2020	Reverse DictionaryWord Embeddings	CodeCode Available	1	5
Be Careful about Poisoned Word Embeddings: Exploring the Vulnerability of the Embedding Layers in NLP Models	Mar 29, 2021	Backdoor AttackData Poisoning	CodeCode Available	1	5
BERT Goes Shopping: Comparing Distributional Models for Product Representations	Dec 17, 2020	Language ModellingProduct Recommendation	CodeCode Available	1	5
A Source-Criticism Debiasing Method for GloVe Embeddings	Jun 25, 2021	Word Embeddings	CodeCode Available	1	5
A Comprehensive Analysis of Static Word Embeddings for Turkish	May 13, 2024	Word Embeddings	CodeCode Available	1	5
Backpack Language Models	May 26, 2023	Language ModelingLanguage Modelling	CodeCode Available	1	5
Circumventing Concept Erasure Methods For Text-to-Image Generative Models	Aug 3, 2023	Face SwappingWord Embeddings	CodeCode Available	1	5
Classification Benchmarks for Under-resourced Bengali Language based on Multichannel Convolutional-LSTM Network	Apr 11, 2020	ArticlesClassification	CodeCode Available	1	5
Zero-Shot Semantic Segmentation	Jun 3, 2019	General ClassificationSegmentation	CodeCode Available	1	5
ADEPT: A DEbiasing PrompT Framework	Nov 10, 2022	AttributeLanguage Modelling	CodeCode Available	1	5
Comparative Evaluation of Pretrained Transfer Learning Models on Automatic Short Answer Grading	Sep 2, 2020	automatic short answer gradingTransfer Learning	CodeCode Available	1	5
Compass-aligned Distributional Embeddings for Studying Semantic Differences across Corpora	Apr 13, 2020	ArticlesWord Embeddings	CodeCode Available	1	5
Affective and Contextual Embedding for Sarcasm Detection	Dec 1, 2020	Sarcasm DetectionWord Embeddings	CodeCode Available	1	5
Adversarial Training Methods for Semi-Supervised Text Classification	May 25, 2016	ClassificationGeneral Classification	CodeCode Available	1	5
Conditional probing: measuring usable information beyond a baseline	Sep 19, 2021	Word Embeddings	CodeCode Available	1	5
GLOW : Global Weighted Self-Attention Network for Web Search	Jul 10, 2020	Document RankingInformation Retrieval	CodeCode Available	1	5

Show:10 25 50

← PrevPage 1 of 81Next →

No leaderboard results yet.