Diversity

Diversity in data sampling is crucial across various use cases, including search, recommendation systems, and more. Ensuring diverse samples means capturing a wide range of variations and perspectives, which leads to more robust, unbiased, and comprehensive models. In search use cases, for instance, diversity helps avoid redundancy, ensuring that users are exposed to a broader set of relevant information rather than repeated similar results.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1751–1800 of 9051 papers

Title	Date	Tasks	Status
Hybrid Disagreement-Diversity Active Learning for Bioacoustic Sound Event Detection	May 27, 2025	Active LearningDiversity	CodeCode Available
Towards Pretraining Robust ASR Foundation Model with Acoustic-Aware Data Augmentation	May 27, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Prismatic Synthesis: Gradient-based Data Diversification Boosts Generalization in LLM Reasoning	May 26, 2025	DiversityMath	—Unverified
CulFiT: A Fine-grained Cultural-aware LLM Training Paradigm via Multilingual Critique Data Synthesis	May 26, 2025	DiversityOpen-Ended Question Answering	CodeCode Available
EmoNet-Face: An Expert-Annotated Benchmark for Synthetic Emotion Recognition	May 26, 2025	DiversityEmotion Recognition	—Unverified
ReDDiT: Rehashing Noise for Discrete Visual Generation	May 26, 2025	AttributeDiversity	—Unverified
DiffVLA: Vision-Language Guided Diffusion Planning for Autonomous Driving	May 26, 2025	Autonomous DrivingDiversity	—Unverified
Token-Importance Guided Direct Preference Optimization	May 26, 2025	Diversity	—Unverified
We Need to Measure Data Diversity in NLP -- Better and Broader	May 26, 2025	Diversityvalid	—Unverified
The Role of Diversity in In-Context Learning for Large Language Models	May 26, 2025	DiversityIn-Context Learning	—Unverified
Force Prompting: Video Generation Models Can Learn and Generalize Physics-based Control Signals	May 26, 2025	DiversityVideo Generation	—Unverified
Diversity-Driven Generative Dataset Distillation Based on Diffusion Model with Self-Adaptive Memory	May 26, 2025	Dataset DistillationDiversity	—Unverified
Holes in Latent Space: Topological Signatures Under Adversarial Influence	May 26, 2025	DiversityTopological Data Analysis	—Unverified
An Out-Of-Distribution Membership Inference Attack Approach for Cross-Domain Graph Attacks	May 26, 2025	DiversityGraph Neural Network	—Unverified
The NaijaVoices Dataset: Cultivating Large-Scale, High-Quality, Culturally-Rich Speech Data for African Languages	May 26, 2025	Automatic Speech RecognitionDiversity	—Unverified
Kuramoto-FedAvg: Using Synchronization Dynamics to Improve Federated Learning Optimization under Statistical Heterogeneity	May 26, 2025	DiversityFederated Learning	—Unverified
VisualToolAgent (VisTA): A Reinforcement Learning Framework for Visual Tool Selection	May 26, 2025	Diversityreinforcement-learning	—Unverified
The Price of Format: Diversity Collapse in LLMs	May 25, 2025	DiversityGSM8K	CodeCode Available
PIGPVAE: Physics-Informed Gaussian Process Variational Autoencoders	May 25, 2025	DiversitySynthetic Data Generation	—Unverified
MGD^3: Mode-Guided Dataset Distillation using Diffusion Models	May 25, 2025	Dataset DistillationDiversity	—Unverified
Beyond Editing Pairs: Fine-Grained Instructional Image Editing via Multi-Scale Learnable Regions	May 25, 2025	Diversity	—Unverified
Less is More: Efficient Point Cloud Reconstruction via Multi-Head Decoders	May 25, 2025	DecoderDiversity	—Unverified
Pan-tropical plant functional trait variation from space	May 25, 2025	Diversity	—Unverified
SpokenNativQA: Multilingual Everyday Spoken Queries for LLMs	May 25, 2025	BenchmarkingDiversity	—Unverified
MoMBS: Mixed-order minibatch sampling enhances model training from diverse-quality images	May 24, 2025	Diversityimage-classification	—Unverified
LiSTEN: Learning Soft Token Embeddings for Neural Audio LLMs	May 24, 2025	Diversity	—Unverified
Voice of a Continent: Mapping Africa's Speech Technology Frontier	May 24, 2025	Diversity	—Unverified
ToDRE: Visual Token Pruning via Diversity and Task Awareness for Efficient Large Vision-Language Models	May 24, 2025	DecoderDiversity	—Unverified
Measuring diversity of synthetic prompts and data generated with fine-grained persona prompting	May 23, 2025	Diversity	—Unverified
High-Fidelity Functional Ultrasound Reconstruction via A Visual Auto-Regressive Framework	May 23, 2025	DiversityFairness	—Unverified
Large language model as user daily behavior data generator: balancing population diversity and individual personality	May 23, 2025	Data AugmentationDiversity	—Unverified
JALMBench: Benchmarking Jailbreak Vulnerabilities in Audio Language Models	May 23, 2025	BenchmarkingDiversity	CodeCode Available
CrashAgent: Crash Scenario Generation via Multi-modal Reasoning	May 23, 2025	Autonomous DrivingDiversity	—Unverified
Generative AI and Creativity: A Systematic Literature Review and Meta-Analysis	May 22, 2025	DiversitySystematic Literature Review	CodeCode Available
Exploring the Relationship Between Diversity and Quality in Ad Text Generation	May 22, 2025	DiversityMachine Translation	—Unverified
Position of Uncertainty: A Cross-Linguistic Study of Positional Bias in Large Language Models	May 22, 2025	DiversityPosition	—Unverified
Robust Invariant Representation Learning by Distribution Extrapolation	May 22, 2025	DiversityRepresentation Learning	—Unverified
Sudoku-Bench: Evaluating creative reasoning with Sudoku variants	May 22, 2025	DiversityLogical Reasoning	CodeCode Available
Diverse, not Short: A Length-Controlled Self-Learning Framework for Improving Response Diversity of Language Models	May 22, 2025	DiversitySelf-Learning	—Unverified
Can LLMs Simulate Human Behavioral Variability? A Case Study in the Phonemic Fluency Task	May 22, 2025	DiversitySpecificity	—Unverified
AdaSTaR: Adaptive Data Sampling for Training Self-Taught Reasoners	May 22, 2025	Diversity	—Unverified
LongMagpie: A Self-synthesis Method for Generating Large-scale Long-context Instructions	May 22, 2025	Diversity	—Unverified
Swarm Intelligence Enhanced Reasoning: A Density-Driven Framework for LLM-Based Multi-Agent Optimization	May 21, 2025	Density EstimationDiversity	—Unverified
Aug2Search: Enhancing Facebook Marketplace Search with LLM-Generated Synthetic Data Augmentation	May 21, 2025	Data AugmentationDiversity	—Unverified
GS2E: Gaussian Splatting is an Effective Data Generator for Event Stream Generation	May 21, 2025	3D ReconstructionDiversity	—Unverified
Multilingual Prompting for Improving LLM Generation Diversity	May 21, 2025	DiversityHallucination	—Unverified
FaceCrafter: Identity-Conditional Diffusion with Disentangled Control over Facial Pose, Expression, and Emotion	May 21, 2025	AttributeDiversity	—Unverified
Loss-Guided Auxiliary Agents for Overcoming Mode Collapse in GFlowNets	May 21, 2025	Diversityvalid	—Unverified
GAMA++: Disentangled Geometric Alignment with Adaptive Contrastive Perturbation for Reliable Domain Transfer	May 21, 2025	DisentanglementDiversity	—Unverified
An Inclusive Foundation Model for Generalizable Cytogenetics in Precision Oncology	May 21, 2025	DiversitySelf-Supervised Learning	—Unverified

Show:10 25 50

← PrevPage 36 of 182Next →

No leaderboard results yet.