The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 12151–12200 of 661570 papers

Title	Date	Status	Hype
Towards Improved Sentence Representations using Token Graphs	Mar 3, 2026	CodeCode Available	0
Think, But Don't Overthink: Reproducing Recursive Language Models	Mar 3, 2026	CodeCode Available	0
Privacy Risk Predictions Based on Fundamental Understanding of Personal Data and an Evolving Threat Landscape	Mar 3, 2026	CodeCode Available	0
An Effective Data Augmentation Method by Asking Questions about Scene Text Images	Mar 3, 2026	CodeCode Available	0
The Choice of Divergence: A Neglected Key to Mitigating Diversity Collapse in Reinforcement Learning with Verifiable Reward	Mar 3, 2026	—Unverified	1
Geometry-Guided Reinforcement Learning for Multi-view Consistent 3D Scene Editing	Mar 3, 2026	—Unverified	2
UniG2U-Bench: Do Unified Models Advance Multimodal Understanding?	Mar 3, 2026	—Unverified	1
WristMIR: Coarse-to-Fine Region-Aware Retrieval of Pediatric Wrist Radiographs with Radiology Report-Driven Learning	Mar 3, 2026	CodeCode Available	0
NOVA: Sparse Control, Dense Synthesis for Pair-Free Video Editing	Mar 3, 2026	—Unverified	1
D2E: Scaling Vision-Action Pretraining on Desktop Data for Transfer to Embodied AI	Mar 3, 2026	—Unverified	2
DREAM: Where Visual Understanding Meets Text-to-Image Generation	Mar 3, 2026	—Unverified	1
SimRecon: SimReady Compositional Scene Reconstruction from Real Videos	Mar 3, 2026	—Unverified	2
LoGeR: Long-Context Geometric Reconstruction with Hybrid Memory	Mar 3, 2026	—Unverified	3
Map the Flow: Revealing Hidden Pathways of Information in VideoLLMs	Mar 3, 2026	—Unverified	1
Comparing AI Agents to Cybersecurity Professionals in Real-World Penetration Testing	Mar 3, 2026	—Unverified	3
Proact-VL: A Proactive VideoLLM for Real-Time AI Companions	Mar 3, 2026	—Unverified	2
Human3R: Everyone Everywhere All at Once	Mar 3, 2026	—Unverified	3
Shuffle-R1: Efficient RL framework for Multimodal Large Language Models via Data-centric Dynamic Shuffle	Mar 3, 2026	—Unverified	2
MemSifter: Offloading LLM Memory Retrieval via Outcome-Driven Proxy Reasoning	Mar 3, 2026	—Unverified	2
CASR-Net: An Image Processing-focused Deep Learning-based Coronary Artery Segmentation and Refinement Network for X-ray Coronary Angiogram	Mar 3, 2026	—Unverified	0
A Short Note on a Variant of the Squint Algorithm	Mar 3, 2026	—Unverified	0
EchoGen: Generating Visual Echoes in Any Scene via Feed-Forward Subject-Driven Auto-Regressive Model	Mar 3, 2026	CodeCode Available	0
AccurateRAG: A Framework for Building Accurate Retrieval-Augmented Question-Answering Applications	Mar 3, 2026	—Unverified	0
Super Research: Answering Highly Complex Questions with Large Language Models through Super Deep and Super Wide Research	Mar 3, 2026	—Unverified	0
When Small Variations Become Big Failures: Reliability Challenges in Compute-in-Memory Neural Accelerators	Mar 3, 2026	—Unverified	0
Zono-Conformal Prediction: Zonotope-Based Uncertainty Quantification for Regression and Classification Tasks	Mar 3, 2026	—Unverified	0
E2E-GNet: An End-to-End Skeleton-based Geometric Deep Neural Network for Human Motion Recognition	Mar 3, 2026	—Unverified	0
Self-Aug: Query and Entropy Adaptive Decoding for Large Vision-Language Models	Mar 3, 2026	—Unverified	0
PRISM: Pushing the Frontier of Deep Think via Process Reward Model-Guided Inference	Mar 3, 2026	—Unverified	0
ModalPatch: A Plug-and-Play Module for Robust Multi-Modal 3D Object Detection under Modality Drop	Mar 3, 2026	—Unverified	0
MUSE: A Run-Centric Platform for Multimodal Unified Safety Evaluation of Large Language Models	Mar 3, 2026	—Unverified	0
Optimizing Orbital Parameters of Satellites for a Global Quantum Network	Mar 3, 2026	—Unverified	0
Viability-Preserving Passive Torque Control	Mar 2, 2026	—Unverified	0
Exploring Teacher-Chatbot Interaction and Affect in Block-Based Programming	Mar 2, 2026	—Unverified	0
Fast-Slow Thinking RM: Efficient Integration of Scalar and Generative Reward Models	Mar 2, 2026	—Unverified	0
AgenticGEO: A Self-Evolving Agentic System for Generative Engine Optimization	Mar 2, 2026	—Unverified	0
Beyond Detection: Governing GenAI in Academic Peer Review as a Sociotechnical Challenge	Mar 2, 2026	—Unverified	0
RedacBench: Can AI Erase Your Secrets?	Mar 2, 2026	—Unverified	0
URAG: A Benchmark for Uncertainty Quantification in Retrieval-Augmented Large Language Models	Mar 2, 2026	—Unverified	0
Framing Effects in Independent-Agent Large Language Models: A Cross-Family Behavioral Analysis	Mar 2, 2026	—Unverified	0
One Operator to Rule Them All? On Boundary-Indexed Operator Families in Neural PDE Solvers	Mar 2, 2026	—Unverified	0
Machine Learning Models to Identify Promising Nested Antiresonance Nodeless Fiber Designs	Mar 2, 2026	—Unverified	0
PolyMon: A Unified Framework for Polymer Property Prediction	Mar 2, 2026	CodeCode Available	0
Safety-Guided Flow (SGF): A Unified Framework for Negative Guidance in Safe Generation	Mar 2, 2026	—Unverified	0
Not All Queries Need Rewriting: When Prompt-Only LLM Refinement Helps and Hurts Dense Retrieval	Mar 2, 2026	—Unverified	0
DreamReader: An Interpretability Toolkit for Text-to-Image Models	Mar 2, 2026	—Unverified	0
FusionCast: Enhancing Precipitation Nowcasting with Asymmetric Cross-Modal Fusion and Future Radar Priors	Mar 2, 2026	—Unverified	0
VL-KGE: Vision-Language Models Meet Knowledge Graph Embeddings	Mar 2, 2026	—Unverified	0
MuFlex: A Scalable, Physics-based Platform for Multi-Building Flexibility Analysis and Coordination	Mar 2, 2026	—Unverified	0
TriageSim: A Conversational Emergency Triage Simulation Framework from Structured Electronic Health Records	Mar 2, 2026	—Unverified	0