The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9951–10000 of 661570 papers

Title	Date	Status
Fine-Tuning and Evaluating Conversational AI for Agricultural Advisory	Mar 6, 2026	—Unverified
OD-RASE: Ontology-Driven Risk Assessment and Safety Enhancement for Autonomous Driving	Mar 6, 2026	—Unverified
Latent Diffusion-Based 3D Molecular Recovery from Vibrational Spectra	Mar 6, 2026	—Unverified
Prompt Group-Aware Training for Robust Text-Guided Nuclei Segmentation	Mar 6, 2026	—Unverified
SurgFormer: Scalable Learning of Organ Deformation with Resection Support and Real-Time Inference	Mar 6, 2026	—Unverified
XMACNet: An Explainable Lightweight Attention based CNN with Multi Modal Fusion for Chili Disease Classification	Mar 6, 2026	—Unverified
PICS: Pairwise Image Compositing with Spatial Interactions	Mar 6, 2026	CodeCode Available
FedARKS: Federated Aggregation via Robust and Discriminative Knowledge Selection and Integration for Person Re-identification	Mar 6, 2026	—Unverified
Measuring AI R&D Automation	Mar 6, 2026	—Unverified
Classroom AI: Large Language Models as Grade-Specific Teachers	Mar 6, 2026	—Unverified
Chain-of-Thought Reasoning Improves Context-Aware Translation with Large Language Models	Mar 6, 2026	—Unverified
A Geometric Perspective on the Difficulties of Learning GNN-based SAT Solvers	Mar 6, 2026	—Unverified
LiveSense: A Real-Time Wi-Fi Sensing Platform for Range-Doppler on COTS Laptop	Mar 6, 2026	—Unverified
KCLarity at SemEval-2026 Task 6: Encoder and Zero-Shot Approaches to Political Evasion Detection	Mar 6, 2026	—Unverified
Agri-Query: A Case Study on RAG vs. Long-Context LLMs for Cross-Lingual Technical Question Answering	Mar 6, 2026	—Unverified
CAReDiO: Cultural Alignment via Representativeness and Distinctiveness Guided Data Optimization	Mar 6, 2026	—Unverified
Instance Data Condensation for Image Super-Resolution	Mar 6, 2026	—Unverified
Sysformer: Safeguarding Frozen Large Language Models with Adaptive System Prompts	Mar 6, 2026	—Unverified
NarrLV: Towards a Comprehensive Narrative-Centric Evaluation for Long Video Generation	Mar 6, 2026	—Unverified
Gaussian Set Surface Reconstruction through Per-Gaussian Optimization	Mar 6, 2026	—Unverified
Diverse and Adaptive Behavior Curriculum for Autonomous Driving: A Student-Teacher Framework with Multi-Agent RL	Mar 6, 2026	—Unverified
A Multi-Agent System Enables Versatile Information Extraction from the Chemical Literature	Mar 6, 2026	—Unverified
MAP: Mitigating Hallucinations in Large Vision-Language Models with Map-Level Attention Processing	Mar 6, 2026	—Unverified
TIC-GRPO: Provable and Efficient Optimization for Reinforcement Learning from Human Feedback	Mar 6, 2026	—Unverified
VLMQ: Token Saliency-Driven Post-Training Quantization for Vision-language Models	Mar 6, 2026	—Unverified
DianJin-OCR-R1: Enhancing OCR Capabilities via a Reasoning-and-Tool Interleaved Vision-Language Model	Mar 6, 2026	—Unverified
SSL-SLR: Self-Supervised Representation Learning for Sign Language Recognition	Mar 6, 2026	—Unverified
RED: Robust Event-Guided Motion Deblurring with Modality-Specific Disentanglement	Mar 6, 2026	—Unverified
VEGA: Electric Vehicle Navigation Agent via Physics-Informed Neural Operator and Proximal Policy Optimization	Mar 6, 2026	—Unverified
Spectral/Spatial Tensor Atomic Cluster Expansion with Universal Embeddings in Cartesian Space	Mar 6, 2026	—Unverified
Auto-Regressive U-Net for Full-Field Prediction of Shrinkage-Induced Damage in Concrete	Mar 6, 2026	—Unverified
Decision-Driven Semantic Object Exploration for Legged Robots via Confidence-Calibrated Perception and Topological Subgoal Selection	Mar 6, 2026	—Unverified
Taxonomy-aware Dynamic Motion Generation on Hyperbolic Manifolds	Mar 6, 2026	—Unverified
Online Minimization of Polarization and Disagreement via Low-Rank Matrix Bandits	Mar 6, 2026	—Unverified
Self-Speculative Masked Diffusions	Mar 6, 2026	—Unverified
Decoding Partial Differential Equations: Cross-Modal Adaptation of Decoder-only Models to PDEs	Mar 6, 2026	—Unverified
How Reliable is Language Model Micro-Benchmarking?	Mar 6, 2026	—Unverified
Do LLMs Really Know What They Don't Know? Internal States Mainly Reflect Knowledge Recall Rather Than Truthfulness	Mar 6, 2026	—Unverified
Beyond Flat Unknown Labels in Open-World Object Detection	Mar 6, 2026	—Unverified
CanvasMAR: Improving Masked Autoregressive Video Prediction With Canvas	Mar 6, 2026	—Unverified
Shoot First, Ask Questions Later? Building Rational Agents that Explore and Act Like People	Mar 6, 2026	—Unverified
OnlineSI: Taming Large Language Model for Online 3D Understanding and Grounding	Mar 6, 2026	—Unverified
Co-Layout: LLM-driven Co-optimization for Interior Layout	Mar 6, 2026	—Unverified
DETECT: Determining Ease and Textual Clarity of German Text Simplifications	Mar 6, 2026	—Unverified
Culture in Action: Evaluating Text-to-Image Models through Social Activities	Mar 6, 2026	—Unverified
LaxMotion: Rethinking Supervision Granularity for 3D Human Motion Generation	Mar 6, 2026	—Unverified
MRIQT: Physics-Aware Diffusion Model for Image Quality Transfer in Neonatal Ultra-Low-Field MRI	Mar 6, 2026	—Unverified
A method for tissue-mask supported whole-body image registration in the UK Biobank	Mar 6, 2026	—Unverified
Whatever Remains Must Be True: Filtering Drives Reasoning in LLMs, Shaping Diversity	Mar 6, 2026	—Unverified
DFIR-DETR: Frequency-Domain Iterative Refinement and Dynamic Feature Aggregation for Small Object Detection	Mar 6, 2026	—Unverified