The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9651–9700 of 661570 papers

Title	Date	Status	Hype
AMB-DSGDN: Adaptive Modality-Balanced Dynamic Semantic Graph Differential Network for Multimodal Emotion Recognition	Mar 7, 2026	—Unverified	0
Targeted Bit-Flip Attacks on LLM-Based Agents	Mar 7, 2026	—Unverified	0
Permutation-Equivariant 2D State Space Models: Theory and Canonical Architecture for Multivariate Time Series	Mar 7, 2026	—Unverified	0
Hindsight Credit Assignment for Long-Horizon LLM Agents	Mar 7, 2026	—Unverified	0
Turn: A Language for Agentic Computation	Mar 7, 2026	CodeCode Available	0
DevBench: A Realistic, Developer-Informed Benchmark for Code Generation Models	Mar 7, 2026	—Unverified	0
CoTJudger: A Graph-Driven Framework for Automatic Evaluation of Chain-of-Thought Efficiency and Redundancy in LRMs	Mar 7, 2026	—Unverified	0
Tokenizing Semantic Segmentation with RLE	Mar 7, 2026	—Unverified	0
Reallocating Attention Across Layers to Reduce Multimodal Hallucination	Mar 7, 2026	—Unverified	0
N-Tree Diffusion for Long-Horizon Wildfire Risk Forecasting	Mar 7, 2026	—Unverified	0
Data-Driven Hints in Intelligent Tutoring Systems	Mar 7, 2026	—Unverified	0
Rethinking Deep Research from the Perspective of Web Content Distribution Matching	Mar 7, 2026	—Unverified	0
MoE-GS: Mixture of Experts for Dynamic Gaussian Splatting	Mar 7, 2026	—Unverified	0
The Partition Principle Revisited: Non-Equal Volume Designs Achieve Minimal Expected Star Discrepancy	Mar 7, 2026	—Unverified	0
Explainable and Hardware-Efficient Jamming Detection for 5G Networks Using the Convolutional Tsetlin Machine	Mar 7, 2026	—Unverified	0
INDUCTION: Finite-Structure Concept Synthesis in First-Order Logic	Mar 7, 2026	—Unverified	0
Foundational World Models Accurately Detect Bimanual Manipulator Failures	Mar 7, 2026	—Unverified	0
ACD-U: Asymmetric co-teaching with machine unlearning for robust learning with noisy labels	Mar 7, 2026	CodeCode Available	0
Mathematicians in the age of AI	Mar 7, 2026	—Unverified	0
Task learning increases information redundancy of neural responses in macaque visual cortex	Mar 7, 2026	—Unverified	0
Towards Objective Gastrointestinal Auscultation: Automated Segmentation and Annotation of Bowel Sound Patterns	Mar 7, 2026	—Unverified	0
A Distributed Gaussian Process Model for Multi-Robot Mapping	Mar 7, 2026	—Unverified	0
ShakyPrepend: A Multi-Group Learner with Improved Sample Complexity	Mar 7, 2026	—Unverified	0
A Systematic Investigation of Document Chunking Strategies and Embedding Sensitivity	Mar 7, 2026	—Unverified	0
Shutdown Safety Valves for Advanced AI	Mar 7, 2026	—Unverified	0
Efficient Personalized Reranking with Semi-Autoregressive Generation and Online Knowledge Distillation	Mar 7, 2026	—Unverified	0
Enhancing low energy reconstruction and classification in KM3NeT/ORCA with transformers	Mar 7, 2026	—Unverified	0
Margin in Abstract Spaces	Mar 7, 2026	—Unverified	0
Unlocking Data Value in Finance: A Study on Distillation and Difficulty-Aware Training	Mar 7, 2026	—Unverified	0
The Talking Robot: Distortion-Robust Acoustic Models for Robot-Robot Communication	Mar 7, 2026	—Unverified	0
DINOv3 Visual Representations for Blueberry Perception Toward Robotic Harvesting	Mar 7, 2026	—Unverified	0
The Third Ambition: Artificial Intelligence and the Science of Human Behavior	Mar 7, 2026	—Unverified	0
A Single Model Ensemble Framework for Neural Machine Translation using Pivot Translation	Mar 7, 2026	—Unverified	0
Prototype Perturbation for Relaxing Alignment Constraints in Backward-Compatible Learning	Mar 7, 2026	—Unverified	0
Weak-to-Strong Generalization with Failure Trajectories: A Tree-based Approach to Elicit Optimal Policy in Strong Models	Mar 7, 2026	—Unverified	0
GraphProp: Training the Graph Foundation Models using Graph Properties	Mar 7, 2026	—Unverified	0
3D Gaussian Splatting with Fisheye Images: Field of View Analysis and Depth-Based Initialization	Mar 7, 2026	—Unverified	0
IAG: Input-aware Backdoor Attack on VLM-based Visual Grounding	Mar 7, 2026	—Unverified	0
Synthetic Homes: An Accessible Multimodal Pipeline for Producing Residential Building Data with Generative AI	Mar 7, 2026	—Unverified	0
Stealth Fine-Tuning: Efficiently Breaking Alignment in RVLMs Using Self-Generated CoT	Mar 7, 2026	—Unverified	0
Generative Evolutionary Meta-Solver (GEMS): Scalable Surrogate-Free Multi-Agent Reinforcement Learning	Mar 7, 2026	—Unverified	0
Automated Pest Counting in Water Traps through Active Robotic Stirring for Occlusion Handling	Mar 7, 2026	—Unverified	0
SwiftTS: A Swift Selection Framework for Time Series Pre-trained Models via Multi-task Meta-Learning	Mar 7, 2026	—Unverified	0
HatePrototypes: Interpretable and Transferable Representations for Implicit and Explicit Hate Speech Detection	Mar 7, 2026	—Unverified	0
Counting Through Occlusion: Framework for Open World Amodal Counting	Mar 7, 2026	—Unverified	0
Video2Layout: Recall and Reconstruct Metric-Grounded Cognitive Map for Spatial Reasoning	Mar 7, 2026	—Unverified	1
Towards Realistic Guarantees: A Probabilistic Certificate for SmoothLLM	Mar 7, 2026	—Unverified	0
Automating Deception: Scalable Multi-Turn LLM Jailbreaks	Mar 7, 2026	—Unverified	0
Shortcut Invariance: Targeted Jacobian Regularization in Disentangled Latent Space	Mar 7, 2026	—Unverified	0
Process-Centric Analysis of Agentic Software Systems	Mar 7, 2026	—Unverified	0