The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9851–9900 of 661570 papers

Title	Date	Status	Hype
GS-2M: Material-aware Gaussian Splatting for High-fidelity Mesh Reconstruction	Mar 7, 2026	—Unverified	0
Interpretable Maximum Margin Deep Anomaly Detection	Mar 7, 2026	—Unverified	0
Looking Back and Forth: Cross-Image Attention Calibration and Attentive Preference Learning for Multi-Image Hallucination Mitigation	Mar 7, 2026	—Unverified	0
Conditional Rank-Rank Regression via Deep Conditional Transformation Models	Mar 7, 2026	—Unverified	0
Idiom Understanding as a Tool to Measure the Dialect Gap	Mar 7, 2026	—Unverified	0
Adaptive Discovery of Interpretable Audio Attributes with Multimodal LLMs for Low-Resource Classification	Mar 7, 2026	—Unverified	0
Retrieval-Augmented Multi-scale Framework for County-Level Crop Yield Prediction Across Large Regions	Mar 7, 2026	—Unverified	0
Human-Centered LLM-Agent System for Detecting Anomalous Digital Asset Transactions	Mar 7, 2026	—Unverified	0
Bi-directional digital twin prototype anchoring with multi-periodicity learning for few-shot fault diagnosis	Mar 7, 2026	—Unverified	0
Retinex Meets Language: A Physics-Semantics-Guided Underwater Image Enhancement Network	Mar 7, 2026	—Unverified	0
Fast and Flexible Audio Bandwidth Extension via Vocos	Mar 7, 2026	—Unverified	0
Retrieval-Augmented Generation for Predicting Cellular Responses to Gene Perturbation	Mar 7, 2026	CodeCode Available	0
ECHO: Frequency-aware Hierarchical Encoding for Variable-length Signals	Mar 7, 2026	CodeCode Available	0
S^2Q-VDiT: Accurate Quantized Video Diffusion Transformer with Salient Data and Sparse Token Distillation	Mar 7, 2026	CodeCode Available	0
QuantSparse: Comprehensively Compressing Video Diffusion Transformer with Model Quantization and Attention Sparsification	Mar 7, 2026	CodeCode Available	0
Self-Supervised Multi-Modal World Model with 4D Space-Time Embedding	Mar 7, 2026	CodeCode Available	0
Countdown-Code: A Testbed for Studying The Emergence and Generalization of Reward Hacking in RLVR	Mar 7, 2026	CodeCode Available	0
The Model Knows Which Tokens Matter: Automatic Token Selection via Noise Gating	Mar 7, 2026	CodeCode Available	0
To Predict or Not to Predict? Towards reliable uncertainty estimation in the presence of noise	Mar 7, 2026	CodeCode Available	0
Learning Concept Bottleneck Models from Mechanistic Explanations	Mar 7, 2026	CodeCode Available	0
Empowering Microscopic Traffic Simulators with Realistic Perception using Surrogate Sensor Models	Mar 7, 2026	CodeCode Available	0
CyclicReflex: Improving Reasoning Models via Cyclical Reflection Token Scheduling	Mar 7, 2026	CodeCode Available	0
Benchmark Leakage Trap: Can We Trust LLM-based Recommendation?	Mar 7, 2026	CodeCode Available	0
Can a Lightweight Automated AI Pipeline Solve Research-Level Mathematical Problems?	Mar 7, 2026	CodeCode Available	0
PHASE-Net: Physics-Grounded Harmonic Attention System for Efficient Remote Photoplethysmography Measurement	Mar 7, 2026	CodeCode Available	0
Batch-of-Thought: Cross-Instance Learning for Enhanced LLM Reasoning	Mar 7, 2026	CodeCode Available	0
From Static Inference to Dynamic Interaction: A Survey of Streaming Large Language Models	Mar 7, 2026	CodeCode Available	0
AutoChecklist: Composable Pipelines for Checklist Generation and Scoring with LLM-as-a-Judge	Mar 7, 2026	CodeCode Available	0
OV-DEIM: Real-time DETR-Style Open-Vocabulary Object Detection with GridSynthetic Augmentation	Mar 7, 2026	CodeCode Available	0
MedSteer: Counterfactual Endoscopic Synthesis via Training-Free Activation Steering	Mar 7, 2026	CodeCode Available	0
Combining Adam and its Inverse Counterpart to Enhance Generalization of Deep Learning Optimizers	Mar 7, 2026	CodeCode Available	0
Emotion Transcription in Conversation: A Benchmark for Capturing Subtle and Complex Emotional States through Natural Language	Mar 7, 2026	CodeCode Available	0
PDD: Manifold-Prior Diverse Distillation for Medical Anomaly Detection	Mar 7, 2026	CodeCode Available	0
CanoVerse: 3D Object Scalable Canonicalization and Dataset for Generation and Pose	Mar 7, 2026	CodeCode Available	0
Variational Flow Maps: Make Some Noise for One-Step Conditional Generation	Mar 7, 2026	CodeCode Available	0
A Component-Based Survey of Interactions between Large Language Models and Multi-Armed Bandits	Mar 7, 2026	CodeCode Available	0
MipSLAM: Alias-Free Gaussian Splatting SLAM	Mar 7, 2026	CodeCode Available	0
Rethinking Driving World Model as Synthetic Data Generator for Perception Tasks	Mar 7, 2026	CodeCode Available	0
WISER: Wider Search, Deeper Thinking, and Adaptive Fusion for Training-Free Zero-Shot Composed Image Retrieval	Mar 7, 2026	CodeCode Available	0
Quantized Visual Geometry Grounded Transformer	Mar 7, 2026	CodeCode Available	0
HY-WU (Part I): An Extensible Functional Neural Memory Framework and An Instantiation in Text-Guided Image Editing	Mar 7, 2026	—Unverified	3
DrivingGen: A Comprehensive Benchmark for Generative Video World Models in Autonomous Driving	Mar 7, 2026	—Unverified	1
ARLArena: A Unified Framework for Stable Agentic Reinforcement Learning	Mar 7, 2026	—Unverified	2
FinSheet-Bench: From Simple Lookups to Complex Reasoning, Where LLMs Break on Financial Spreadsheets	Mar 7, 2026	—Unverified	0
Traffic-MLLM: Curiosity-Regularized Supervised Learning for Traffic Scenario Case-Based Reasoning	Mar 7, 2026	—Unverified	0
Yo'City: Personalized and Boundless 3D Realistic City Scene Generation via Self-Critic Expansion	Mar 7, 2026	—Unverified	0
How Much Noise Can BERT Handle? Insights from Multilingual Sentence Difficulty Detection	Mar 7, 2026	CodeCode Available	0
Evaluating Human-AI Safety: A Framework for Measuring Harmful Capability Uplift	Mar 6, 2026	—Unverified	0
Model2Kernel: Model-Aware Symbolic Execution For Safe CUDA Kernels	Mar 6, 2026	—Unverified	0
MedMT-Bench: Can LLMs Memorize and Understand Long Multi-Turn Conversations in Medical Scenarios?	Mar 6, 2026	—Unverified	0