Diversity

Diversity in data sampling is crucial across various use cases, including search, recommendation systems, and more. Ensuring diverse samples means capturing a wide range of variations and perspectives, which leads to more robust, unbiased, and comprehensive models. In search use cases, for instance, diversity helps avoid redundancy, ensuring that users are exposed to a broader set of relevant information rather than repeated similar results.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 151–200 of 9051 papers

Title	Date	Tasks	Status	Hype
Diversity-Aware Policy Optimization for Large Language Model Reasoning	May 29, 2025	DiversityLanguage Modeling	—Unverified	0
Revisiting Multi-Agent Debate as Test-Time Scaling: A Systematic Study of Conditional Effectiveness	May 29, 2025	DiversityLarge Language Model	—Unverified	0
DiCoFlex: Model-agnostic diverse counterfactuals with flexible control	May 29, 2025	counterfactualDecision Making	—Unverified	0
Generating Diverse Training Samples for Relation Extraction with Large Language Models	May 29, 2025	DiversityIn-Context Learning	—Unverified	0
ZIPA: A family of efficient models for multilingual phone recognition	May 29, 2025	Diversity	CodeCode Available	2
Interspeech 2025 URGENT Speech Enhancement Challenge	May 29, 2025	DiversitySpeech Enhancement	—Unverified	0
MermaidFlow: Redefining Agentic Workflow Generation via Safety-Constrained Evolutionary Programming	May 29, 2025	DiversityEfficient Exploration	CodeCode Available	2
Single Domain Generalization for Alzheimer's Detection from 3D MRIs with Pseudo-Morphological Augmentations and Contrastive Learning	May 28, 2025	Alzheimer's DetectionAlzheimer's Disease Detection	CodeCode Available	0
Cultural Evaluations of Vision-Language Models Have a Lot to Learn from Cultural Theory	May 28, 2025	DiversityPosition	—Unverified	0
VME: A Satellite Imagery Dataset and Benchmark for Detecting Vehicles in the Middle East and Beyond	May 28, 2025	Disaster ResponseDiversity	CodeCode Available	0
Can LLMs Deceive CLIP? Benchmarking Adversarial Compositionality of Pre-trained Multimodal Representation via Text Updates	May 28, 2025	BenchmarkingDiversity	—Unverified	0
Analysis and Evaluation of Synthetic Data Generation in Speech Dysfluency Detection	May 28, 2025	DiversitySynthetic Data Generation	CodeCode Available	1
AudioTurbo: Fast Text-to-Audio Generation with Rectified Diffusion	May 28, 2025	AudioCapsAudio Generation	—Unverified	0
From Failures to Fixes: LLM-Driven Scenario Repair for Self-Evolving Autonomous Driving	May 28, 2025	Autonomous DrivingBench2Drive	—Unverified	0
Jailbreak Distillation: Renewable Safety Benchmarking	May 28, 2025	BenchmarkingDiversity	—Unverified	0
Incorporating LLMs for Large-Scale Urban Complex Mobility Simulation	May 28, 2025	DiversityLanguage Modeling	—Unverified	0
PoisonSwarm: Universal Harmful Information Synthesis via Model Crowdsourcing	May 27, 2025	counterfactualDiversity	—Unverified	0
CNVSRC 2024: The Second Chinese Continuous Visual Speech Recognition Challenge	May 27, 2025	Diversityspeech-recognition	—Unverified	0
LLM-Driven E-Commerce Marketing Content Optimization: Balancing Creativity and Conversion	May 27, 2025	DiversityMarketing	—Unverified	0
Response to comment on Mutualism weaken the latitudinal diversity gradient among oceanic islands	May 27, 2025	ArticlesDiversity	CodeCode Available	0
Conditional Diffusion Models with Classifier-Free Gibbs-like Guidance	May 27, 2025	Audio GenerationDenoising	CodeCode Available	0
Fundamental Limits of Game-Theoretic LLM Alignment: Smith Consistency and Preference Matching	May 27, 2025	Diversity	—Unverified	0
Hybrid Disagreement-Diversity Active Learning for Bioacoustic Sound Event Detection	May 27, 2025	Active LearningDiversity	CodeCode Available	0
PromptEVC: Controllable Emotional Voice Conversion with Natural Language Prompts	May 27, 2025	DiversityRhythm	—Unverified	0
Towards Pretraining Robust ASR Foundation Model with Acoustic-Aware Data Augmentation	May 27, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Counterfactual Multi-player Bandits for Explainable Recommendation Diversification	May 27, 2025	counterfactualDiversity	CodeCode Available	0
The NaijaVoices Dataset: Cultivating Large-Scale, High-Quality, Culturally-Rich Speech Data for African Languages	May 26, 2025	Automatic Speech RecognitionDiversity	—Unverified	0
Holes in Latent Space: Topological Signatures Under Adversarial Influence	May 26, 2025	DiversityTopological Data Analysis	—Unverified	0
Token-Importance Guided Direct Preference Optimization	May 26, 2025	Diversity	—Unverified	0
Kuramoto-FedAvg: Using Synchronization Dynamics to Improve Federated Learning Optimization under Statistical Heterogeneity	May 26, 2025	DiversityFederated Learning	—Unverified	0
An Out-Of-Distribution Membership Inference Attack Approach for Cross-Domain Graph Attacks	May 26, 2025	DiversityGraph Neural Network	—Unverified	0
Prismatic Synthesis: Gradient-based Data Diversification Boosts Generalization in LLM Reasoning	May 26, 2025	DiversityMath	—Unverified	0
We Need to Measure Data Diversity in NLP -- Better and Broader	May 26, 2025	Diversityvalid	—Unverified	0
Diversity-Driven Generative Dataset Distillation Based on Diffusion Model with Self-Adaptive Memory	May 26, 2025	Dataset DistillationDiversity	—Unverified	0
Force Prompting: Video Generation Models Can Learn and Generalize Physics-based Control Signals	May 26, 2025	DiversityVideo Generation	—Unverified	0
CulFiT: A Fine-grained Cultural-aware LLM Training Paradigm via Multilingual Critique Data Synthesis	May 26, 2025	DiversityOpen-Ended Question Answering	CodeCode Available	0
ReDDiT: Rehashing Noise for Discrete Visual Generation	May 26, 2025	AttributeDiversity	—Unverified	0
EmoNet-Face: An Expert-Annotated Benchmark for Synthetic Emotion Recognition	May 26, 2025	DiversityEmotion Recognition	—Unverified	0
The Role of Diversity in In-Context Learning for Large Language Models	May 26, 2025	DiversityIn-Context Learning	—Unverified	0
VisualToolAgent (VisTA): A Reinforcement Learning Framework for Visual Tool Selection	May 26, 2025	Diversityreinforcement-learning	—Unverified	0
DiffVLA: Vision-Language Guided Diffusion Planning for Autonomous Driving	May 26, 2025	Autonomous DrivingDiversity	—Unverified	0
Pan-tropical plant functional trait variation from space	May 25, 2025	Diversity	—Unverified	0
PIGPVAE: Physics-Informed Gaussian Process Variational Autoencoders	May 25, 2025	DiversitySynthetic Data Generation	—Unverified	0
MMP-2K: A Benchmark Multi-Labeled Macro Photography Image Quality Assessment Database	May 25, 2025	2kDiversity	CodeCode Available	1
Less is More: Efficient Point Cloud Reconstruction via Multi-Head Decoders	May 25, 2025	DecoderDiversity	—Unverified	0
The Price of Format: Diversity Collapse in LLMs	May 25, 2025	DiversityGSM8K	CodeCode Available	0
MGD^3: Mode-Guided Dataset Distillation using Diffusion Models	May 25, 2025	Dataset DistillationDiversity	—Unverified	0
Beyond Editing Pairs: Fine-Grained Instructional Image Editing via Multi-Scale Learnable Regions	May 25, 2025	Diversity	—Unverified	0
SpokenNativQA: Multilingual Everyday Spoken Queries for LLMs	May 25, 2025	BenchmarkingDiversity	—Unverified	0
Voice of a Continent: Mapping Africa's Speech Technology Frontier	May 24, 2025	Diversity	—Unverified	0

Show:10 25 50

← PrevPage 4 of 182Next →

No leaderboard results yet.