The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11701–11750 of 661570 papers

Title	Date	Status	Hype
Maximizing Generalization: The Effect of Different Augmentation Techniques on Lightweight Vision Transformer for Bengali Character Classification	Mar 3, 2026	—Unverified	0
Low-Degree Method Fails to Predict Robust Subspace Recovery	Mar 3, 2026	—Unverified	0
Lightweight Transformer for EEG Classification via Balanced Signed Graph Algorithm Unrolling	Mar 3, 2026	—Unverified	0
Characterizing the Multiclass Learnability of Forgiving 0-1 Loss Functions	Mar 3, 2026	—Unverified	0
Model Already Knows the Best Noise: Bayesian Active Noise Selection via Attention in Video Diffusion Model	Mar 3, 2026	—Unverified	0
Robust Weight Imprinting: Insights from Neural Collapse and Proxy-Based Aggregation	Mar 3, 2026	CodeCode Available	0
Optimizing Data Augmentation through Bayesian Model Selection	Mar 3, 2026	—Unverified	0
CLEAR: Calibrated Learning for Epistemic and Aleatoric Risk	Mar 3, 2026	—Unverified	0
Interaction Field Matching: Overcoming Limitations of Electrostatic Models	Mar 3, 2026	CodeCode Available	0
You Only Fine-tune Once: Many-Shot In-Context Fine-Tuning for Large Language Models	Mar 3, 2026	—Unverified	0
SceneStreamer: Continuous Scenario Generation as Next Token Group Prediction	Mar 3, 2026	—Unverified	0
Psychometric Item Validation Using Virtual Respondents with Trait-Response Mediators	Mar 3, 2026	—Unverified	0
CoBELa: Steering Transparent Generation via Concept Bottlenecks on Energy Landscapes	Mar 3, 2026	—Unverified	0
InstructVLA: Vision-Language-Action Instruction Tuning from Understanding to Manipulation	Mar 3, 2026	—Unverified	2
Not All Errors Are Created Equal: ASCoT Addresses Late-Stage Fragility in Efficient LLM Reasoning	Mar 3, 2026	—Unverified	0
Nonparametric Reaction Coordinate Optimization with Histories: A Framework for Rare Event Dynamics	Mar 3, 2026	—Unverified	0
Link Prediction for Event Logs in the Process Industry	Mar 3, 2026	—Unverified	0
SiNGER: A Clearer Voice Distills Vision Transformers Further	Mar 3, 2026	—Unverified	0
Zero-shot CT Super-Resolution using Diffusion-based 2D Projection Priors and Signed 3D Gaussians	Mar 3, 2026	—Unverified	0
ConEQsA: Concurrent and Asynchronous Embodied Questions Scheduling and Answering	Mar 3, 2026	—Unverified	0
Learning Acrobatic Flight from Preferences	Mar 3, 2026	—Unverified	0
No Answer Needed: Predicting LLM Answer Accuracy from Question-Only Linear Probes	Mar 3, 2026	—Unverified	0
ScaleDoc: Scaling LLM-based Predicates over Large Document Collections	Mar 3, 2026	—Unverified	0
Enhancing Generative Auto-bidding with Offline Reward Evaluation and Policy Search	Mar 3, 2026	—Unverified	0
Are VLMs Ready for Lane Topology Awareness in Autonomous Driving?	Mar 3, 2026	—Unverified	0
Fast Estimation of Wasserstein Distances via Regression on Sliced Wasserstein Distances	Mar 3, 2026	—Unverified	0
Benefits and Pitfalls of Reinforcement Learning for Language Model Planning: A Theoretical Perspective	Mar 3, 2026	—Unverified	0
Death of the Novel(ty): Beyond n-Gram Novelty as a Metric for Textual Creativity	Mar 3, 2026	—Unverified	0
Are Language Models Borrowing-Blind? A Multilingual Evaluation of Loanword Identification across 10 Languages	Mar 3, 2026	—Unverified	0
MedLA: A Logic-Driven Multi-Agent Framework for Complex Medical Reasoning with Large Language Models	Mar 3, 2026	—Unverified	0
Proxy-GS: Unified Occlusion Priors for Training and Inference in Structured 3D Gaussian Splatting	Mar 3, 2026	—Unverified	0
BindWeave: Subject-Consistent Video Generation via Cross-Modal Integration	Mar 3, 2026	—Unverified	0
Arbitrary Generative Video Interpolation	Mar 3, 2026	—Unverified	0
ManagerBench: Evaluating the Safety-Pragmatism Trade-off in Autonomous LLMs	Mar 3, 2026	—Unverified	0
Audio-sync Video Instance Editing with Granularity-Aware Mask Refiner	Mar 3, 2026	—Unverified	0
Fine-Tuning Diffusion Models via Intermediate Distribution Shaping	Mar 3, 2026	—Unverified	0
LaDiR: Latent Diffusion Enhances LLMs for Text Reasoning	Mar 3, 2026	—Unverified	0
Spectrum Tuning: Post-Training for Distributional Coverage and In-Context Steerability	Mar 3, 2026	—Unverified	0
Mitigating Over-Refusal in Aligned Large Language Models via Inference-Time Activation Energy	Mar 3, 2026	—Unverified	0
MIRAGE: Runtime Scheduling for Multi-Vector Image Retrieval with Hierarchical Decomposition	Mar 3, 2026	—Unverified	0
Reasoning as Representation: Rethinking Visual Reinforcement Learning in Image Quality Assessment	Mar 3, 2026	—Unverified	0
Reducing Belief Deviation in Reinforcement Learning for Active Reasoning	Mar 3, 2026	—Unverified	0
Are We Asking the Right Questions? On Ambiguity in Natural Language Queries for Tabular Data Analysis	Mar 3, 2026	—Unverified	0
The Implicit Bias of Adam and Muon on Smooth Homogeneous Neural Networks	Mar 3, 2026	—Unverified	0
Secure Sparse Matrix Multiplications and their Applications to Privacy-Preserving Machine Learning	Mar 3, 2026	—Unverified	0
Policy Transfer for Continuous-Time Reinforcement Learning: A (Rough) Differential Equation Approach	Mar 3, 2026	—Unverified	0
Online Data Curation for Object Detection via Marginal Contributions to Dataset-level Average Precision	Mar 3, 2026	—Unverified	0
Kinematify: Open-Vocabulary Synthesis of High-DoF Articulated Objects	Mar 3, 2026	—Unverified	0
Echoing: Identity Failures when LLM Agents Talk to Each Other	Mar 3, 2026	—Unverified	0
Markovian Scale Prediction: A New Era of Visual Autoregressive Generation	Mar 3, 2026	—Unverified	0