The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9301–9350 of 661570 papers

Title	Date	Status	Hype
SiMO: Single-Modality-Operable Multimodal Collaborative Perception	Mar 9, 2026	CodeCode Available	0
ΔVLA: Prior-Guided Vision-Language-Action Models via World Knowledge Variation	Mar 9, 2026	CodeCode Available	0
Spherical-GOF: Geometry-Aware Panoramic Gaussian Opacity Fields for 3D Scene Reconstruction	Mar 9, 2026	CodeCode Available	0
Latent Speech-Text Transformer	Mar 9, 2026	CodeCode Available	0
Infusion: Shaping Model Behavior by Editing Training Data via Influence Functions	Mar 9, 2026	CodeCode Available	0
SoftJAX & SoftTorch: Empowering Automatic Differentiation Libraries with Informative Gradients	Mar 9, 2026	CodeCode Available	0
BiCLIP: Domain Canonicalization via Structured Geometric Transformation	Mar 9, 2026	CodeCode Available	0
FVG-PT: Adaptive Foreground View-Guided Prompt Tuning for Vision-Language Models	Mar 9, 2026	CodeCode Available	0
RedSage: A Cybersecurity Generalist LLM	Mar 9, 2026	—Unverified	1
CARE-Edit: Condition-Aware Routing of Experts for Contextual Image Editing	Mar 9, 2026	—Unverified	1
VLM-SubtleBench: How Far Are VLMs from Human-Level Subtle Comparative Reasoning?	Mar 9, 2026	—Unverified	1
NaviDriveVLM: Decoupling High-Level Reasoning and Motion Planning for Autonomous Driving	Mar 9, 2026	—Unverified	1
HiAR: Efficient Autoregressive Long Video Generation via Hierarchical Denoising	Mar 9, 2026	—Unverified	2
In-Context Reinforcement Learning for Tool Use in Large Language Models	Mar 9, 2026	—Unverified	1
Adaptation of Agentic AI: A Survey of Post-Training, Memory, and Skills	Mar 9, 2026	—Unverified	4
π-StepNFT: Wider Space Needs Finer Steps in Online RL for Flow-based VLAs	Mar 9, 2026	—Unverified	1
LatentMem: Customizing Latent Memory for Multi-Agent Systems	Mar 9, 2026	—Unverified	1
\$OneMillion-Bench: How Far are Language Agents from Human Experts?	Mar 9, 2026	—Unverified	1
WildActor: Unconstrained Identity-Preserving Video Generation	Mar 9, 2026	—Unverified	2
OfficeQA Pro: An Enterprise Benchmark for End-to-End Grounded Reasoning	Mar 9, 2026	—Unverified	2
Beyond ReinMax: Low-Variance Gradient Estimators for Discrete Latent Variables	Mar 9, 2026	—Unverified	0
Light of Normals: Unified Feature Representation for Universal Photometric Stereo	Mar 9, 2026	—Unverified	3
SYNAPSE: Framework for Neuron Analysis and Perturbation in Sequence Encoding	Mar 9, 2026	—Unverified	0
See and Switch: Vision-Based Branching for Interactive Robot-Skill Programming	Mar 9, 2026	—Unverified	0
DualFlexKAN: Dual-stage Kolmogorov-Arnold Networks with Independent Function Control	Mar 9, 2026	—Unverified	0
R2F: Repurposing Ray Frontiers for LLM-free Object Navigation	Mar 9, 2026	—Unverified	0
Beyond Benchmarks: Dynamic, Automatic And Systematic Red-Teaming Agents For Trustworthy Medical Language Models	Mar 9, 2026	—Unverified	0
Detecting AI-Generated Images via Diffusion Snap-Back Reconstruction: A Forensic Approach	Mar 9, 2026	—Unverified	0
Are We Winning the Wrong Game? Revisiting Evaluation Practices for Long-Term Time Series Forecasting	Mar 9, 2026	—Unverified	0
Power Couple? AI Growth and Renewable Energy Investment	Mar 8, 2026	—Unverified	0
Generating Hierarchical JSON Representations of Scientific Sentences Using LLMs	Mar 8, 2026	—Unverified	0
MDKeyChunker: Single-Call LLM Enrichment with Rolling Keys and Key-Based Restructuring for High-Accuracy RAG	Mar 8, 2026	—Unverified	0
Not All Pretraining are Created Equal: Threshold Tuning and Class Weighting for Imbalanced Polarization Tasks in Low-Resource Settings	Mar 8, 2026	—Unverified	0
Beyond Hard Constraints: Budget-Conditioned Reachability For Safe Offline Reinforcement Learning	Mar 8, 2026	—Unverified	0
Emergency Lane-Change Simulation: A Behavioral Guidance Approach for Risky Scenario Generation	Mar 8, 2026	—Unverified	0
Writing literature reviews with AI: principles, hurdles and some lessons learned	Mar 8, 2026	—Unverified	0
CDEoH: Category-Driven Automatic Algorithm Design With Large Language Models	Mar 8, 2026	—Unverified	0
Beam-aware Kernelized Contextual Bandits for User Association and Beamforming in mmWave Vehicular Networks	Mar 8, 2026	—Unverified	0
Generalized Stock Price Prediction for Multiple Stocks Combined with News Fusion	Mar 8, 2026	—Unverified	0
Engineering Verifiable Modularity in Transformers via Per-Layer Supervision	Mar 8, 2026	—Unverified	0
Quine: Realizing LLM Agents as Native POSIX Processes	Mar 8, 2026	—Unverified	0
InfoMamba: An Attention-Free Hybrid Mamba-Transformer Model	Mar 8, 2026	—Unverified	0
What on Earth is AlphaEarth? Hierarchical structure and functional interpretability for global land cover	Mar 8, 2026	—Unverified	0
Did You Check the Right Pocket? Cost-Sensitive Store Routing for Memory-Augmented Agents	Mar 8, 2026	—Unverified	0
Machine Learning Based Identification of Solvents from Post-Desiccation Patterns	Mar 8, 2026	—Unverified	0
Attribution-Guided Model Rectification of Unreliable Neural Network Behaviors	Mar 8, 2026	—Unverified	0
Local Precise Refinement: A Dual-Gated Mixture-of-Experts for Enhancing Foundation Model Generalization against Spectral Shifts	Mar 8, 2026	—Unverified	0
Optimizing LLM Annotation of Classroom Discourse through Multi-Agent Orchestration	Mar 8, 2026	—Unverified	0
Context-Enriched Natural Language Descriptions of Vessel Trajectories	Mar 8, 2026	—Unverified	0
From Garbage to Gold: A Data-Architectural Theory of Predictive Robustness	Mar 8, 2026	—Unverified	0