Diversity

Diversity in data sampling is crucial across various use cases, including search, recommendation systems, and more. Ensuring diverse samples means capturing a wide range of variations and perspectives, which leads to more robust, unbiased, and comprehensive models. In search use cases, for instance, diversity helps avoid redundancy, ensuring that users are exposed to a broader set of relevant information rather than repeated similar results.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 201–250 of 9051 papers

Title	Date	Tasks	Status	Hype
MoMBS: Mixed-order minibatch sampling enhances model training from diverse-quality images	May 24, 2025	Diversityimage-classification	—Unverified	0
LiSTEN: Learning Soft Token Embeddings for Neural Audio LLMs	May 24, 2025	Diversity	—Unverified	0
ToDRE: Visual Token Pruning via Diversity and Task Awareness for Efficient Large Vision-Language Models	May 24, 2025	DecoderDiversity	—Unverified	0
Large language model as user daily behavior data generator: balancing population diversity and individual personality	May 23, 2025	Data AugmentationDiversity	—Unverified	0
Measuring diversity of synthetic prompts and data generated with fine-grained persona prompting	May 23, 2025	Diversity	—Unverified	0
High-Fidelity Functional Ultrasound Reconstruction via A Visual Auto-Regressive Framework	May 23, 2025	DiversityFairness	—Unverified	0
BLAST: Balanced Sampling Time Series Corpus for Universal Forecasting Models	May 23, 2025	DiversityTime Series	CodeCode Available	5
CrashAgent: Crash Scenario Generation via Multi-modal Reasoning	May 23, 2025	Autonomous DrivingDiversity	—Unverified	0
JALMBench: Benchmarking Jailbreak Vulnerabilities in Audio Language Models	May 23, 2025	BenchmarkingDiversity	CodeCode Available	0
LongMagpie: A Self-synthesis Method for Generating Large-scale Long-context Instructions	May 22, 2025	Diversity	—Unverified	0
Generative AI and Creativity: A Systematic Literature Review and Meta-Analysis	May 22, 2025	DiversitySystematic Literature Review	CodeCode Available	0
SimpleDeepSearcher: Deep Information Seeking via Web-Powered Reasoning Trajectory Synthesis	May 22, 2025	DiversityInformation Retrieval	CodeCode Available	4
Robust Invariant Representation Learning by Distribution Extrapolation	May 22, 2025	DiversityRepresentation Learning	—Unverified	0
Can LLMs Simulate Human Behavioral Variability? A Case Study in the Phonemic Fluency Task	May 22, 2025	DiversitySpecificity	—Unverified	0
Sudoku-Bench: Evaluating creative reasoning with Sudoku variants	May 22, 2025	DiversityLogical Reasoning	CodeCode Available	0
Exploring the Relationship Between Diversity and Quality in Ad Text Generation	May 22, 2025	DiversityMachine Translation	—Unverified	0
Diverse, not Short: A Length-Controlled Self-Learning Framework for Improving Response Diversity of Language Models	May 22, 2025	DiversitySelf-Learning	—Unverified	0
AdaSTaR: Adaptive Data Sampling for Training Self-Taught Reasoners	May 22, 2025	Diversity	—Unverified	0
Position of Uncertainty: A Cross-Linguistic Study of Positional Bias in Large Language Models	May 22, 2025	DiversityPosition	—Unverified	0
Swarm Intelligence Enhanced Reasoning: A Density-Driven Framework for LLM-Based Multi-Agent Optimization	May 21, 2025	Density EstimationDiversity	—Unverified	0
OpenEthics: A Comprehensive Ethical Evaluation of Open-Source Generative Large Language Models	May 21, 2025	DiversityFairness	CodeCode Available	0
Aug2Search: Enhancing Facebook Marketplace Search with LLM-Generated Synthetic Data Augmentation	May 21, 2025	Data AugmentationDiversity	—Unverified	0
Ensembling Sparse Autoencoders	May 21, 2025	DiversityLanguage Modeling	—Unverified	0
An Inclusive Foundation Model for Generalizable Cytogenetics in Precision Oncology	May 21, 2025	DiversitySelf-Supervised Learning	—Unverified	0
Multilingual Prompting for Improving LLM Generation Diversity	May 21, 2025	DiversityHallucination	—Unverified	0
A Distributed Local Energy Market Clearing Framework Using a Two-Loop ADMM Method	May 21, 2025	Diversity	—Unverified	0
Towards Pre-training an Effective Respiratory Audio Foundation Model	May 21, 2025	Diversity	CodeCode Available	0
GAMA++: Disentangled Geometric Alignment with Adaptive Contrastive Perturbation for Reliable Domain Transfer	May 21, 2025	DisentanglementDiversity	—Unverified	0
FaceCrafter: Identity-Conditional Diffusion with Disentangled Control over Facial Pose, Expression, and Emotion	May 21, 2025	AttributeDiversity	—Unverified	0
GS2E: Gaussian Splatting is an Effective Data Generator for Event Stream Generation	May 21, 2025	3D ReconstructionDiversity	—Unverified	0
Loss-Guided Auxiliary Agents for Overcoming Mode Collapse in GFlowNets	May 21, 2025	Diversityvalid	—Unverified	0
SSR: Speculative Parallel Scaling Reasoning in Test-time	May 21, 2025	DiversityMath	—Unverified	0
WebNovelBench: Placing LLM Novelists on the Web Novel Distribution	May 20, 2025	DiversityStory Generation	CodeCode Available	1
KO: Kinetics-inspired Neural Optimizer with PDE Simulation Approaches	May 20, 2025	Diversityimage-classification	—Unverified	0
The Achilles Heel of AI: Fundamentals of Risk-Aware Training Data for High-Consequence Models	May 20, 2025	Disaster ResponseDiversity	—Unverified	0
Textual Steering Vectors Can Improve Visual Understanding in Multimodal Large Language Models	May 20, 2025	Diversity	—Unverified	0
CAFES: A Collaborative Multi-Agent Framework for Multi-Granular Multimodal Essay Scoring	May 20, 2025	Automated Essay ScoringDiversity	—Unverified	0
Creative Preference Optimization	May 20, 2025	DiversityText Generation	—Unverified	0
Success is in the Details: Evaluate and Enhance Details Sensitivity of Code LLMs through Counterfactuals	May 20, 2025	counterfactualDiversity	CodeCode Available	0
Algorithmic Hiring and Diversity: Reducing Human-Algorithm Similarity for Better Outcomes	May 20, 2025	DiversityFairness	—Unverified	0
ReactDiff: Latent Diffusion for Facial Reaction Generation	May 20, 2025	DecoderDiversity	CodeCode Available	0
SQLForge: Synthesizing Reliable and Diverse Data to Enhance Text-to-SQL Reasoning in LLMs	May 19, 2025	DiversityText to SQL	—Unverified	0
GeoRanker: Distance-Aware Ranking for Worldwide Image Geolocalization	May 19, 2025	DiversityPhoto geolocation estimation	—Unverified	0
The Effect of Language Diversity When Fine-Tuning Large Language Models for Translation	May 19, 2025	DiversityTranslation	—Unverified	0
Towards A Generalist Code Embedding Model Based On Massive Data Synthesis	May 19, 2025	DiversityDomain Generalization	CodeCode Available	0
Sat2Sound: A Unified Framework for Zero-Shot Soundscape Mapping	May 19, 2025	Contrastive LearningCross-Modal Retrieval	—Unverified	0
AD-AGENT: A Multi-agent Framework for End-to-end Anomaly Detection	May 19, 2025	Anomaly DetectionCode Generation	CodeCode Available	2
Active Learning on Synthons for Molecular Design	May 19, 2025	Active LearningDiversity	—Unverified	0
Few-Step Diffusion via Score identity Distillation	May 19, 2025	Diversity	CodeCode Available	0
EuLearn: A 3D database for learning Euler characteristics	May 18, 2025	Diversity	CodeCode Available	0

Show:10 25 50

← PrevPage 5 of 182Next →

No leaderboard results yet.