The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

474,278 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 19151–19200 of 474278 papers

Title	Date	Tasks	Status
Disentangling Granularity: An Implicit Inductive Bias in Factorized VAEs	May 30, 2025	DisentanglementInductive Bias	—Unverified
Multi-Domain ABSA Conversation Dataset Generation via LLMs for Real-World Evaluation and Model Comparison	May 30, 2025	Aspect-Based Sentiment AnalysisAspect-Based Sentiment Analysis (ABSA)	—Unverified
PhySense: Principle-Based Physics Reasoning Benchmarking for Large Language Models	May 30, 2025	Benchmarking	—Unverified
Time Blindness: Why Video-Language Models Can't See What Humans Can?	May 30, 2025	Temporal SequencesVideo Understanding	—Unverified
Multilinguality Does not Make Sense: Investigating Factors Behind Zero-Shot Transfer in Sense-Aware Tasks	May 30, 2025	Cross-Lingual TransferMultilingual NLP	—Unverified
DeepBoost-AF: A Novel Unsupervised Feature Learning and Gradient Boosting Fusion for Robust Atrial Fibrillation Detection in Raw ECG Signals	May 30, 2025	Atrial Fibrillation Detection	—Unverified
Proxy Target: Bridging the Gap Between Discrete Spiking Neural Networks and Continuous Control	May 30, 2025	continuous-controlContinuous Control	—Unverified
Quick-Draw Bandits: Quickly Optimizing in Nonstationary Environments with Extremely Many Arms	May 30, 2025	Multi-Armed Bandits	—Unverified
Proxy-FDA: Proxy-based Feature Distribution Alignment for Fine-tuning Vision Foundation Models without Forgetting	May 30, 2025	image-classificationImage Classification	—Unverified
A SHAP-based explainable multi-level stacking ensemble learning method for predicting the length of stay in acute stroke	May 30, 2025	Ensemble Learningfeature selection	—Unverified
LightSAM: Parameter-Agnostic Sharpness-Aware Minimization	May 30, 2025	Sensitivity	—Unverified
Rethinking Continual Learning with Progressive Neural Collapse	May 30, 2025	Continual Learning	—Unverified
On Fairness of Task Arithmetic: The Role of Task Vectors	May 30, 2025	FairnessHate Speech Detection	—Unverified
GradPower: Powering Gradients for Faster Language Model Pre-Training	May 30, 2025	Language ModelingLanguage Modelling	—Unverified
On the Emergence of Weak-to-Strong Generalization: A Bias-Variance Perspective	May 30, 2025	Attribute	—Unverified
Multi-task Learning for Heterogeneous Multi-source Block-Wise Missing Data	May 30, 2025	MarketingMulti-Task Learning	—Unverified
Advancing Compositional Awareness in CLIP with Efficient Fine-Tuning	May 30, 2025	Retrieval	—Unverified
Graph Flow Matching: Enhancing Image Generation with Neighbor-Aware Flow Fields	May 30, 2025	Image Generation	—Unverified
Smooth Model Compression without Fine-Tuning	May 30, 2025	modelModel Compression	—Unverified
Neuro-Symbolic Operator for Interpretable and Generalizable Characterization of Complex Piezoelectric Systems	May 30, 2025	Model Discovery	—Unverified
Rethinking Neural Combinatorial Optimization for Vehicle Routing Problems with Different Constraint Tightness Degrees	May 30, 2025	Combinatorial Optimization	—Unverified
Learning Distributions over Permutations and Rankings with Factorized Representations	May 30, 2025	Combinatorial OptimizationRe-Ranking	—Unverified
QGAN-based data augmentation for hybrid quantum-classical neural networks	May 30, 2025	Data AugmentationQuantum Machine Learning	—Unverified
Cascading Adversarial Bias from Injection to Distillation in Language Models	May 30, 2025	Bias DetectionCode Generation	—Unverified
Accelerated Sampling from Masked Diffusion Models via Entropy Bounded Unmasking	May 30, 2025	Language ModelingLanguage Modelling	—Unverified
Performative Risk Control: Calibrating Models for Reliable Deployment under Performativity	May 30, 2025	Decision Making	—Unverified
Aligning Protein Conformation Ensemble Generation with Physical Feedback	May 30, 2025	DenoisingDrug Discovery	—Unverified
MIRAGE: Assessing Hallucination in Multimodal Reasoning Chains of MLLM	May 30, 2025	HallucinationMultimodal Reasoning	—Unverified
Multi-task Learning for Heterogeneous Data via Integrating Shared and Task-Specific Encodings	May 30, 2025	Data IntegrationMarketing	—Unverified
Data Fusion for Partial Identification of Causal Effects	May 30, 2025	Causal Inferencecounterfactual	—Unverified
Distributed gradient methods under heavy-tailed communication noise	May 30, 2025	Distributed Optimization	—Unverified
Geospatial Foundation Models to Enable Progress on Sustainable Development Goals	May 30, 2025	BenchmarkingEarth Observation	—Unverified
Interpretable phenotyping of Heart Failure patients with Dutch discharge letters	May 30, 2025	Prognosis	—Unverified
MoDoMoDo: Multi-Domain Data Mixtures for Multimodal LLM Reinforcement Learning	May 30, 2025		—Unverified
CrossICL: Cross-Task In-Context Learning via Unsupervised Demonstration Transfer	May 30, 2025	In-Context Learning	—Unverified
Beyond Exponential Decay: Rethinking Error Accumulation in Large Language Models	May 30, 2025	Large Language Model	—Unverified
Benchmarking Large Language Models for Cryptanalysis and Mismatched-Generalization	May 30, 2025	BenchmarkingCryptanalysis	—Unverified
Intuitionistic Fuzzy Sets for Large Language Model Data Annotation: A Novel Approach to Side-by-Side Preference Labeling	May 30, 2025	Language ModelingLanguage Modelling	—Unverified
Automated Structured Radiology Report Generation	May 30, 2025	Benchmarking	—Unverified
HiCaM: A Hierarchical-Causal Modification Framework for Long-Form Text Modification	May 30, 2025	Form	—Unverified
Exploring the Impact of Occupational Personas on Domain-Specific QA	May 30, 2025	Question Answering	—Unverified
CaMMT: Benchmarking Culturally Aware Multimodal Machine Translation	May 30, 2025	BenchmarkingMachine Translation	—Unverified
Limited-Resource Adapters Are Regularizers, Not Linguists	May 30, 2025	Cross-Lingual TransferMachine Translation	—Unverified
Improving Language and Modality Transfer in Translation by Character-level Modeling	May 30, 2025	Speech-to-TextSpeech-to-Text Translation	—Unverified
GATE: General Arabic Text Embedding for Enhanced Semantic Textual Similarity with Matryoshka Representation Learning and Hybrid Loss Training	May 30, 2025	MTEB BenchmarkNatural Language Inference	—Unverified
When Harry Meets Superman: The Role of The Interlocutor in Persona-Based Dialogue Generation	May 30, 2025	Dialogue GenerationDiversity	—Unverified
A Simple Linear Patch Revives Layer-Pruned Large Language Models	May 30, 2025	Knowledge DistillationQuestion Answering	—Unverified
Soft Reasoning: Navigating Solution Spaces in Large Language Models through Controlled Embedding Exploration	May 30, 2025	Bayesian OptimisationDiversity	—Unverified
AlphaOne: Reasoning Models Thinking Slow and Fast at Test Time	May 30, 2025	Answer Generation	—Unverified
Reflect, Retry, Reward: Self-Improving LLMs via Reinforcement Learning	May 30, 2025	Mathreinforcement-learning	—Unverified