The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

474,278 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 20551–20600 of 474278 papers

Title	Date	Tasks	Status	Hype
My Answer Is NOT 'Fair': Mitigating Social Bias in Vision-Language Models via Fair and Biased Residuals	May 26, 2025	EthicsFairness	—Unverified	0
SEMFED: Semantic-Aware Resource-Efficient Federated Learning for Heterogeneous NLP Tasks	May 26, 2025	Feature CompressionFederated Learning	—Unverified	0
Zero-Trust Foundation Models: A New Paradigm for Secure and Collaborative Artificial Intelligence for Internet of Things	May 26, 2025	Anomaly DetectionFederated Learning	—Unverified	0
Emergent LLM behaviors are observationally equivalent to data leakage	May 26, 2025	Memorization	CodeCode Available	0
USB: A Comprehensive and Unified Safety Evaluation Benchmark for Multimodal Large Language Models	May 26, 2025		CodeCode Available	0
MetaWriter: Personalized Handwritten Text Recognition Using Meta-Learned Prompt Tuning	May 26, 2025	Handwritten Text RecognitionHTR	—Unverified	0
Emotion Classification In-Context in Spanish	May 26, 2025	ClassificationEmotion Classification	—Unverified	0
Retrieval Visual Contrastive Decoding to Mitigate Object Hallucinations in Large Vision-Language Models	May 26, 2025	HallucinationObject Hallucination	CodeCode Available	0
Risk-aware Direct Preference Optimization under Nested Risk Measure	May 26, 2025		CodeCode Available	0
CCL-LGS: Contrastive Codebook Learning for 3D Language Gaussian Splatting	May 26, 2025	3D ReconstructionAutonomous Driving	—Unverified	0
The NaijaVoices Dataset: Cultivating Large-Scale, High-Quality, Culturally-Rich Speech Data for African Languages	May 26, 2025	Automatic Speech RecognitionDiversity	—Unverified	0
ReaMOT: A Benchmark and Framework for Reasoning-based Multi-Object Tracking	May 26, 2025	Multi-Object TrackingObject	CodeCode Available	1
Kernel Quantile Embeddings and Associated Probability Metrics	May 26, 2025		CodeCode Available	0
Prot2Token: A Unified Framework for Protein Modeling via Next-Token Prediction	May 26, 2025	DecoderMulti-Task Learning	CodeCode Available	1
Learning with Expected Signatures: Theory and Applications	May 26, 2025	Time Series	—Unverified	0
Ctrl-DNA: Controllable Cell-Type-Specific Regulatory DNA Design via Constrained RL	May 26, 2025	Reinforcement Learning (RL)Specificity	CodeCode Available	1
OpenNIRScap: An Open-Source, Low-Cost Wearable Near-Infrared Spectroscopy-based Brain Interfacing Cap	May 26, 2025		CodeCode Available	1
FastCache: Fast Caching for Diffusion Transformer Through Learnable Linear Approximation	May 26, 2025		CodeCode Available	1
Covariate-Adjusted Deep Causal Learning for Heterogeneous Panel Data Models	May 26, 2025	counterfactualImputation	—Unverified	0
A Characterization of Reny's Weakly Sequentially Rational Equilibrium through -Perfect γ-Weakly Sequentially Rational Equilibrium	May 26, 2025	Form	—Unverified	0
DuRep: Dual-Mode Speech Representation Learning via ASR-Aware Distillation	May 26, 2025	Representation LearningSpeech Representation Learning	—Unverified	0
Leveraging Cascaded Binary Classification and Multimodal Fusion for Dementia Detection through Spontaneous Speech	May 26, 2025	Binary ClassificationClassification	—Unverified	0
Beyond Manual Transcripts: The Potential of Automated Speech Recognition Errors in Improving Alzheimer's Disease Detection	May 26, 2025	Alzheimer's Disease DetectionAutomatic Speech Recognition	—Unverified	0
ReverbFX: A Dataset of Room Impulse Responses Derived from Reverb Effect Plugins for Singing Voice Dereverberation	May 26, 2025	Room Impulse Response (RIR)	—Unverified	0
Holes in Latent Space: Topological Signatures Under Adversarial Influence	May 26, 2025	DiversityTopological Data Analysis	—Unverified	0
Avoid Forgetting by Preserving Global Knowledge Gradients in Federated Learning with Non-IID Data	May 26, 2025	Federated LearningTransfer Learning	—Unverified	0
Stochastic Preconditioning for Neural Field Optimization	May 26, 2025	Surface Reconstruction	—Unverified	0
ART-DECO: Arbitrary Text Guidance for 3D Detailizer Construction	May 26, 2025	Text to 3D	—Unverified	0
The challenge of hidden gifts in multi-agent reinforcement learning	May 26, 2025	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Reconceptualizing Smart Microscopy: From Data Collection to Knowledge Creation by Multi-Agent Integration	May 26, 2025	Multi-agent Integration	—Unverified	0
The Impact of a Chatbot's Ephemerality-Framing on Self-Disclosure Perceptions	May 26, 2025	Chatbot	—Unverified	0
Streamlining Resilient Kubernetes Autoscaling with Multi-Agent Systems via an Automated Online Design Framework	May 26, 2025	Blocking	—Unverified	0
What Changed? Detecting and Evaluating Instruction-Guided Image Edits with Multimodal Large Language Models	May 26, 2025	Language ModelingLanguage Modelling	—Unverified	0
MetaSTNet: Multimodal Meta-learning for Cellular Traffic Conformal Prediction	May 26, 2025	Conformal PredictionMeta-Learning	—Unverified	0
ControlTac: Force- and Position-Controlled Tactile Data Augmentation with a Single Reference Image	May 26, 2025	Data AugmentationPosition	—Unverified	0
Collision- and Reachability-Aware Multi-Robot Control with Grounded LLM Planners	May 26, 2025	MuJoCovalid	—Unverified	0
Embodied AI with Foundation Models for Mobile Service Robots: A Systematic Review	May 26, 2025	Decision Making Under UncertaintySensor Fusion	—Unverified	0
Vision-Based Risk Aware Emergency Landing for UAVs in Complex Urban Environments	May 26, 2025	Semantic Segmentation	—Unverified	0
In-context learning capabilities of Large Language Models to detect suicide risk among adolescents from speech transcripts	May 26, 2025	In-Context LearningPrompt Engineering	—Unverified	0
Robust fine-tuning of speech recognition models via model merging: application to disordered speech	May 26, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Large Language Models for IT Automation Tasks: Are We There Yet?	May 26, 2025	AttributeCode Generation	—Unverified	0
Synergising Hierarchical Data Centers and Power Networks: A Privacy-Preserving Approach	May 26, 2025	Privacy Preserving	—Unverified	0
Byzantine-Resilient Distributed P2P Energy Trading via Spatial-Temporal Anomaly Detection	May 26, 2025	Anomaly DetectionComputational Efficiency	—Unverified	0
Algorithmic Control Improves Residential Building Energy and EV Management when PV Capacity is High but Battery Capacity is Low	May 26, 2025	Deep Reinforcement Learningenergy management	—Unverified	0
AstroVisBench: A Code Benchmark for Scientific Computing and Visualization in Astronomy	May 26, 2025	Astronomy	—Unverified	0
CardioPatternFormer: Pattern-Guided Attention for Interpretable ECG Classification with Transformer Architecture	May 26, 2025	DiagnosticECG Classification	—Unverified	0
BrainStratify: Coarse-to-Fine Disentanglement of Intracranial Neural Dynamics	May 26, 2025	Brain Computer InterfaceDisentanglement	—Unverified	0
Federated Learning-Distillation Alternation for Resource-Constrained IoT	May 26, 2025	Federated Learning	—Unverified	0
WeatherEdit: Controllable Weather Editing with 4D Gaussian Field	May 26, 2025	3D Generation3DGS	CodeCode Available	2
Intraday Functional PCA Forecasting of Cryptocurrency Returns	May 26, 2025	Time Series Analysis	—Unverified	0