The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

474,278 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 13651–13700 of 474278 papers

Title	Date	Tasks	Status	Hype
Deception Detection in Dyadic Exchanges Using Multimodal Machine Learning: A Study on a Swedish Cohort	Jun 26, 2025	Deception Detection	—Unverified	0
SMMILE: An Expert-Driven Benchmark for Multimodal Medical In-Context Learning	Jun 26, 2025	In-Context LearningMedical Visual Question Answering	—Unverified	0
Distributed Cross-Channel Hierarchical Aggregation for Foundation Models	Jun 26, 2025	Computational Efficiencyscientific discovery	—Unverified	0
Where to find Grokking in LLM Pretraining? Monitor Memorization-to-Generalization without Test	Jun 26, 2025	Code GenerationLarge Language Model	—Unverified	0
Predictive Maintenance Optimization for Smart Vending Machines Using IoT and Machine Learning	Jun 26, 2025	Fault DetectionScheduling	—Unverified	0
Graph-Structured Feedback Multimodel Ensemble Online Conformal Prediction	Jun 26, 2025	Conformal PredictionPrediction	—Unverified	0
KaLM-Embedding-V2: Superior Training Techniques and Data Inspire A Versatile Embedding Model	Jun 26, 2025	Representation LearningRetrieval	CodeCode Available	2
ComRAG: Retrieval-Augmented Generation with Dynamic Vector Stores for Real-time Community Question Answering in Industry	Jun 26, 2025	Community Question AnsweringQuestion Answering	—Unverified	0
TableMoE: Neuro-Symbolic Routing for Structured Expert Reasoning in Multimodal Table Understanding	Jun 26, 2025		CodeCode Available	0
FineWeb2: One Pipeline to Scale Them All -- Adapting Pre-Training Data Processing to Every Language	Jun 26, 2025	All	CodeCode Available	3
Can "consciousness" be observed from large language model (LLM) internal states? Dissecting LLM representations obtained from Theory of Mind test with Integrated Information Theory and Span Representation analysis	Jun 26, 2025	Explainable Artificial Intelligence (XAI)Interpretable Machine Learning	—Unverified	0
ODE_t (ODE_l ): Shortcutting the Time and Length in Diffusion and Flow Models for Faster Sampling	Jun 26, 2025	Image Generation	CodeCode Available	0
Complexity-aware fine-tuning	Jun 26, 2025		CodeCode Available	0
Agent-RewardBench: Towards a Unified Benchmark for Reward Modeling across Perception, Planning, and Safety in Real-World Multimodal Agents	Jun 26, 2025		CodeCode Available	0
Model State Arithmetic for Machine Unlearning	Jun 26, 2025	Machine Unlearningmodel	CodeCode Available	0
Asymmetric Dual Self-Distillation for 3D Self-Supervised Representation Learning	Jun 26, 2025	3D Point Cloud ClassificationRepresentation Learning	CodeCode Available	0
CaloHadronic: a diffusion model for the generation of hadronic showers	Jun 26, 2025		CodeCode Available	0
Domain Knowledge-Enhanced LLMs for Fraud and Concept Drift Detection	Jun 26, 2025	Drift Detection	—Unverified	0
Scalable Bayesian Low-Rank Adaptation of Large Language Models via Stochastic Variational Subspace Inference	Jun 26, 2025	Bayesian InferenceUncertainty Quantification	CodeCode Available	0
Mind2Web 2: Evaluating Agentic Search with Agent-as-a-Judge	Jun 26, 2025	Benchmarking	—Unverified	0
Distilling Normalizing Flows	Jun 26, 2025	Density EstimationKnowledge Distillation	—Unverified	0
Large Language Models Acing Chartered Accountancy	Jun 26, 2025	Legal ReasoningRetrieval-augmented Generation	—Unverified	0
Process mining-driven modeling and simulation to enhance fault diagnosis in cyber-physical systems	Jun 26, 2025	Anomaly DetectionFault Diagnosis	—Unverified	0
rQdia: Regularizing Q-Value Distributions With Image Augmentation	Jun 26, 2025	continuous-controlContinuous Control	—Unverified	0
Optimising Language Models for Downstream Tasks: A Post-Training Perspective	Jun 26, 2025	parameter-efficient fine-tuningSpatial Reasoning	—Unverified	0
Strict Subgoal Execution: Reliable Long-Horizon Planning in Hierarchical Reinforcement Learning	Jun 26, 2025	Decision MakingHierarchical Reinforcement Learning	—Unverified	0
Efficient Skill Discovery via Regret-Aware Optimization	Jun 26, 2025	DiversityRepresentation Learning	—Unverified	0
Compressed and Smooth Latent Space for Text Diffusion Modeling	Jun 26, 2025	Question GenerationQuestion-Generation	—Unverified	0
Enhancing LLM Tool Use with High-quality Instruction Data from Knowledge Graph	Jun 26, 2025	Knowledge Graphs	—Unverified	0
Antibody Design and Optimization with Multi-scale Equivariant Graph Diffusion Models for Accurate Complex Antigen Binding	Jun 26, 2025	Computational EfficiencyDiagnostic	CodeCode Available	0
Detecting Referring Expressions in Visually Grounded Dialogue with Autoregressive Language Models	Jun 26, 2025	Language ModelingLanguage Modelling	CodeCode Available	0
mTSBench: Benchmarking Multivariate Time Series Anomaly Detection and Model Selection at Scale	Jun 26, 2025	Anomaly DetectionBenchmarking	CodeCode Available	0
TopK Language Models	Jun 26, 2025	Computational Efficiency	—Unverified	0
Zero-Shot Learning for Obsolescence Risk Forecasting	Jun 26, 2025	PredictionZero-Shot Learning	—Unverified	0
Latent Prototype Routing: Achieving Near-Perfect Load Balancing in Mixture-of-Experts	Jun 26, 2025	Mixture-of-Experts	CodeCode Available	0
Discovering multiple antibiotic resistance phenotypes using diverse top-k subgroup list discovery	Jun 26, 2025	Data MiningDecision Making	CodeCode Available	0
FaSTA^*: Fast-Slow Toolpath Agent with Subroutine Mining for Efficient Multi-turn Image Editing	Jun 26, 2025		CodeCode Available	1
IPFormer-VideoLLM: Enhancing Multi-modal Video Understanding for Multi-shot Scenes	Jun 26, 2025	AttributeQuestion Answering	—Unverified	0
DeOcc-1-to-3: 3D De-Occlusion from a Single Image via Self-Supervised Multi-View Diffusion	Jun 26, 2025	3D Reconstruction	CodeCode Available	1
HumanOmniV2: From Understanding to Omni-Modal Reasoning with Context	Jun 26, 2025	Large Language ModelMultimodal Reasoning	CodeCode Available	2
Detection of Breast Cancer Lumpectomy Margin with SAM-incorporated Forward-Forward Contrastive Learning	Jun 26, 2025	Contrastive Learning	CodeCode Available	0
Video Virtual Try-on with Conditional Diffusion Transformer Inpainter	Jun 26, 2025	Video GenerationVideo Inpainting	—Unverified	0
Boosting Domain Generalized and Adaptive Detection with Diffusion Models: Fitness, Generalization, and Transferability	Jun 26, 2025	Domain GeneralizationRobust Object Detection	CodeCode Available	1
Active Learning for Manifold Gaussian Process Regression	Jun 26, 2025	Active LearningDimensionality Reduction	CodeCode Available	0
MedPrompt: LLM-CNN Fusion with Weight Routing for Medical Image Segmentation and Classification	Jun 26, 2025	Image SegmentationLarge Language Model	—Unverified	0
Analysis of Null Related Beampattern Measures and Signal Quantization Effects for Linear Differential Microphone Arrays	Jun 26, 2025	Quantization	—Unverified	0
Forecasting Geopolitical Events with a Sparse Temporal Fusion Transformer and Gaussian Process Hybrid: A Case Study in Middle Eastern and U.S. Conflict Dynamics	Jun 26, 2025	Uncertainty Quantification	—Unverified	0
Linearity-based neural network compression	Jun 26, 2025	Efficient Neural NetworkNeural Network Compression	—Unverified	0
A Semi-supervised Scalable Unified Framework for E-commerce Query Classification	Jun 26, 2025	ClassificationWorld Knowledge	—Unverified	0
Enhancing Automatic Term Extraction with Large Language Models via Syntactic Retrieval	Jun 26, 2025	Information RetrievalMachine Translation	—Unverified	0