The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10301–10350 of 661570 papers

Title	Date	Status
Agentified Assessment of Logical Reasoning Agents	Mar 6, 2026	—Unverified
Whisper-CD: Accurate Long-Form Speech Recognition using Multi-Negative Contrastive Decoding	Mar 6, 2026	—Unverified
Stress-Testing Alignment Audits With Prompt-Level Strategic Deception	Mar 6, 2026	—Unverified
DataChef: Cooking Up Optimal Data Recipes for LLM Adaptation via Reinforcement Learning	Mar 6, 2026	—Unverified
Bilateral Trade Under Heavy-Tailed Valuations: Minimax Regret with Infinite Variance	Mar 6, 2026	—Unverified
EgoReasoner: Learning Egocentric 4D Reasoning via Task-Adaptive Structured Thinking	Mar 6, 2026	—Unverified
RoboPocket: Improve Robot Policies Instantly with Your Phone	Mar 6, 2026	—Unverified
Spatial Calibration of Diffuse LiDARs	Mar 6, 2026	—Unverified
Physics-Informed Diffusion Model for Generating Synthetic Extreme Rare Weather Events Data	Mar 6, 2026	—Unverified
Calibrated Credit Intelligence: Shift-Robust and Fair Risk Scoring with Bayesian Uncertainty and Gradient Boosting	Mar 6, 2026	—Unverified
Facial Expression Recognition Using Residual Masking Network	Mar 6, 2026	CodeCode Available
From Tokenizer Bias to Backbone Capability: A Controlled Study of LLMs for Time Series Forecasting	Mar 6, 2026	CodeCode Available
ExDD: Explicit Dual Distribution Learning for Surface Defect Detection via Diffusion Synthesis	Mar 6, 2026	CodeCode Available
Diffusion Fine-Tuning via Reparameterized Policy Gradient of the Soft Q-Function	Mar 6, 2026	CodeCode Available
Fast-BEV++: Fast by Algorithm, Deployable by Design	Mar 6, 2026	CodeCode Available
Restoring Exploration after Post-Training: Latent Exploration Decoding for Large Reasoning Models	Mar 6, 2026	CodeCode Available
Reparameterized Tensor Ring Functional Decomposition for Multi-Dimensional Data Recovery	Mar 6, 2026	CodeCode Available
Think-as-You-See: Streaming Chain-of-Thought Reasoning for Large Vision-Language Models	Mar 6, 2026	CodeCode Available
Imagine How To Change: Explicit Procedure Modeling for Change Captioning	Mar 6, 2026	CodeCode Available
NOVA: Next-step Open-Vocabulary Autoregression for 3D Multi-Object Tracking in Autonomous Driving	Mar 6, 2026	CodeCode Available
WorldCache: Accelerating World Models for Free via Heterogeneous Token Caching	Mar 6, 2026	CodeCode Available
From Prompting to Preference Optimization: A Comparative Study of LLM-based Automated Essay Scoring	Mar 6, 2026	CodeCode Available
Modeling and Measuring Redundancy in Multisource Multimodal Data for Autonomous Driving	Mar 6, 2026	CodeCode Available
xaitimesynth: A Python Package for Evaluating Attribution Methods for Time Series with Synthetic Ground Truth	Mar 6, 2026	CodeCode Available
EarthBridge: A Solution for 4th Multi-modal Aerial View Image Challenge Translation Track	Mar 6, 2026	CodeCode Available
Contextual Counterfactual Credit Assignment for Multi-Agent Reinforcement Learning in LLM Collaboration	Mar 6, 2026	CodeCode Available
How Private Are DNA Embeddings? Inverting Foundation Model Representations of Genomic Sequences	Mar 6, 2026	CodeCode Available
Better Late Than Never: Meta-Evaluation of Latency Metrics for Simultaneous Speech-to-Text Translation	Mar 6, 2026	CodeCode Available
MASFactory: A Graph-centric Framework for Orchestrating LLM-Based Multi-Agent Systems with Vibe Graphing	Mar 6, 2026	CodeCode Available
Spectral and Trajectory Regularization for Diffusion Transformer Super-Resolution	Mar 6, 2026	CodeCode Available
Validating Interpretability in siRNA Efficacy Prediction: A Perturbation-Based, Dataset-Aware Protocol	Mar 6, 2026	CodeCode Available
Can we Trust Unreliable Voxels? Exploring 3D Semantic Occupancy Prediction under Label Noise	Mar 6, 2026	CodeCode Available
VisualPrompter: Semantic-Aware Prompt Optimization with Visual Feedback for Text-to-Image Synthesis	Mar 6, 2026	CodeCode Available
SGDFuse: SAM-Guided Diffusion Model for High-Fidelity Infrared and Visible Image Fusion	Mar 6, 2026	CodeCode Available
PepEDiff: Zero-Shot Peptide Binder Design via Protein Embedding Diffusion	Mar 6, 2026	CodeCode Available
Neural Signals Generate Clinical Notes in the Wild	Mar 6, 2026	CodeCode Available
From Features to Actions: Explainability in Traditional and Agentic AI Systems	Mar 6, 2026	CodeCode Available
Kiwi-Edit: Versatile Video Editing via Instruction and Reference Guidance	Mar 6, 2026	CodeCode Available
FontUse: A Data-Centric Approach to Style- and Use-Case-Conditioned In-Image Typography	Mar 6, 2026	CodeCode Available
Devil is in Narrow Policy: Unleashing Exploration in Driving VLA Models	Mar 6, 2026	CodeCode Available
LIT-RAGBench: Benchmarking Generator Capabilities of Large Language Models in Retrieval-Augmented Generation	Mar 6, 2026	CodeCode Available
Adaptive Language-Aware Image Reflection Removal Network	Mar 6, 2026	CodeCode Available
Cut to the Chase: Training-free Multimodal Summarization via Chain-of-Events	Mar 6, 2026	CodeCode Available
REACT++: Efficient Cross-Attention for Real-Time Scene Graph Generation	Mar 6, 2026	CodeCode Available
Don't Freeze, Don't Crash: Extending the Safe Operating Range of Neural Navigation in Dense Crowds	Mar 6, 2026	CodeCode Available
SpatialMAGIC: A Hybrid Framework Integrating Graph Diffusion and Spatial Attention for Spatial Transcriptomics Imputation	Mar 6, 2026	CodeCode Available
NEST: Network- and Memory-Aware Device Placement For Distributed Deep Learning	Mar 6, 2026	CodeCode Available
Reforming the Mechanism: Editing Reasoning Patterns in LLMs with Circuit Reshaping	Mar 6, 2026	CodeCode Available
Extracting and analyzing 3D histomorphometric features related to perineural and lymphovascular invasion in prostate cancer	Mar 6, 2026	CodeCode Available
Diffusion Alignment as Variational Expectation-Maximization	Mar 6, 2026	CodeCode Available