The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

474,278 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 15301–15350 of 474278 papers

Title	Date	Tasks	Status	Hype
Contrastive Self-Supervised Learning As Neural Manifold Packing	Jun 16, 2025	Contrastive LearningLinear evaluation	—Unverified	0
Calibrated Predictive Lower Bounds on Time-to-Unsafe-Sampling in LLMs	Jun 16, 2025	Conformal PredictionLarge Language Model	—Unverified	0
X-Scene: Large-Scale Driving Scene Generation with High Fidelity and Flexible Controllability	Jun 16, 2025	3DGSAutonomous Driving	—Unverified	0
Bi-directional Context-Enhanced Speech Large Language Models for Multilingual Conversational ASR	Jun 16, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Atomizer: Generalizing to new modalities by breaking satellite images down to a set of scalars	Jun 16, 2025	Earth Observation	—Unverified	0
A Semantically-Aware Relevance Measure for Content-Based Medical Image Retrieval Evaluation	Jun 16, 2025	Content-Based Image RetrievalDescriptive	—Unverified	0
BUT System for the MLC-SLM Challenge	Jun 16, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
OTFusion: Bridging Vision-only and Vision-Language Models via Optimal Transport for Transductive Zero-Shot Learning	Jun 16, 2025	Zero-Shot Learning	—Unverified	0
DualEdit: Dual Editing for Knowledge Updating in Vision-Language Models	Jun 16, 2025	Model Editing	—Unverified	0
Hierarchical Multi-Positive Contrastive Learning for Patent Image Retrieval	Jun 16, 2025	Contrastive LearningDomain Adaptation	—Unverified	0
AdaVideoRAG: Omni-Contextual Adaptive Retrieval-Augmented Efficient Long Video Understanding	Jun 16, 2025	Optical Character Recognition (OCR)RAG	CodeCode Available	0
Sharpness-Aware Machine Unlearning	Jun 16, 2025	DenoisingMachine Unlearning	—Unverified	0
A Two-stage Optimization Method for Wide-range Single-electron Quantum Magnetic Sensing	Jun 16, 2025	geo-localization	—Unverified	0
A Memetic Walrus Algorithm with Expert-guided Strategy for Adaptive Curriculum Sequencing	Jun 16, 2025	Computational Efficiency	—Unverified	0
Evolution of ReID: From Early Methods to LLM Integration	Jun 16, 2025	Person Re-IdentificationSurvey	—Unverified	0
ESRPCB: an Edge guided Super-Resolution model and Ensemble learning for tiny Printed Circuit Board Defect detection	Jun 16, 2025	Defect DetectionEnsemble Learning	—Unverified	0
Brain Imaging Foundation Models, Are We There Yet? A Systematic Review of Foundation Models for Brain Imaging and Biomedical Research	Jun 16, 2025	Data Integration	—Unverified	0
Equitable Electronic Health Record Prediction with FAME: Fairness-Aware Multimodal Embedding	Jun 16, 2025	Fairness	—Unverified	0
FinLMM-R1: Enhancing Financial Reasoning in LMM through Scalable Data and Reward Design	Jun 16, 2025	Answer GenerationArithmetic Reasoning	—Unverified	0
PRISM2: Unlocking Multi-Modal General Pathology AI with Clinical Dialogue	Jun 16, 2025	DiagnosticLanguage Modeling	—Unverified	0
CFBenchmark-MM: Chinese Financial Assistant Benchmark for Multimodal Large Language Model	Jun 16, 2025	Decision MakingFinancial Analysis	—Unverified	0
Deep Diffusion Models and Unsupervised Hyperspectral Unmixing for Realistic Abundance Map Synthesis	Jun 16, 2025	BenchmarkingData Augmentation	—Unverified	0
Balancing Knowledge Delivery and Emotional Comfort in Healthcare Conversational Systems	Jun 16, 2025	Large Language Model	—Unverified	0
Assessing the Limits of In-Context Learning beyond Functions using Partially Ordered Relation	Jun 16, 2025	In-Context LearningRelation	—Unverified	0
Understand the Implication: Learning to Think for Pragmatic Understanding	Jun 16, 2025	Transfer Learning	—Unverified	0
Sparse Convolutional Recurrent Learning for Efficient Event-based Neuromorphic Object Detection	Jun 16, 2025	Computational EfficiencyObject	—Unverified	0
WildCAT3D: Appearance-Aware Multi-View Diffusion in the Wild	Jun 16, 2025	Novel View Synthesis	—Unverified	0
Hybrid Polynomial Zonotopes: A Set Representation for Reachability Analysis in Hybrid Nonaffine Systems	Jun 16, 2025	Computational Efficiency	—Unverified	0
RL-Guided MPC for Autonomous Greenhouse Control	Jun 16, 2025	Model Predictive ControlReinforcement Learning (RL)	—Unverified	0
Language Agents for Hypothesis-driven Clinical Decision Making with Reinforcement Learning	Jun 16, 2025	Decision MakingDiagnostic	—Unverified	0
Efficient Medical VIE via Reinforcement Learning	Jun 16, 2025	DiversityOptical Character Recognition (OCR)	—Unverified	0
Fair Generation without Unfair Distortions: Debiasing Text-to-Image Generation with Entanglement-Free Attention	Jun 16, 2025	AttributeImage Generation	—Unverified	0
xbench: Tracking Agents Productivity Scaling with Profession-Aligned Real-World Evaluations	Jun 16, 2025	AI AgentInformation Retrieval	—Unverified	0
MultiViT2: A Data-augmented Multimodal Neuroimaging Prediction Framework via Latent Diffusion Model	Jun 16, 2025	Data AugmentationPrediction	—Unverified	0
Forecast-Then-Optimize Deep Learning Methods	Jun 16, 2025	Decision MakingDeep Learning	—Unverified	0
TR2M: Transferring Monocular Relative Depth to Metric Depth with Language Descriptions and Scale-Oriented Contrast	Jun 16, 2025	Contrastive LearningDepth Estimation	CodeCode Available	1
Steering LLM Thinking with Budget Guidance	Jun 16, 2025	Math	CodeCode Available	1
Test3R: Learning to Reconstruct 3D at Test Time	Jun 16, 2025	3D ReconstructionDepth Estimation	CodeCode Available	2
Mitigating Safety Fallback in Editing-based Backdoor Injection on LLMs	Jun 16, 2025	DiversityModel Editing	CodeCode Available	0
Gradient-Normalized Smoothness for Optimization with Approximate Hessians	Jun 16, 2025		CodeCode Available	0
EvolvTrip: Enhancing Literary Character Understanding with Temporal Theory-of-Mind Graphs	Jun 16, 2025		CodeCode Available	0
Imaging at the quantum limit with convolutional neural networks	Jun 16, 2025	DenoisingImage Reconstruction	CodeCode Available	0
Enhancing Omics Cohort Discovery for Research on Neurodegeneration through Ontology-Augmented Embedding Models	Jun 16, 2025	Question Answering	CodeCode Available	0
Discrete Diffusion in Large Language and Multimodal Models: A Survey	Jun 16, 2025	Denoising	CodeCode Available	3
LTRR: Learning To Rank Retrievers for LLMs	Jun 16, 2025	Learning-To-RankRAG	CodeCode Available	0
What Happens During the Loss Plateau? Understanding Abrupt Learning in Transformers	Jun 16, 2025		CodeCode Available	0
Enforcing tail calibration when training probabilistic forecast models	Jun 16, 2025	scoring rule	CodeCode Available	0
Federated ADMM from Bayesian Duality	Jun 16, 2025		CodeCode Available	0
Align-then-Unlearn: Embedding Alignment for LLM Unlearning	Jun 16, 2025		CodeCode Available	0
C-TLSAN: Content-Enhanced Time-Aware Long- and Short-Term Attention Network for Personalized Recommendation	Jun 16, 2025	BenchmarkingRecommendation Systems	CodeCode Available	0