The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

474,278 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 20151–20200 of 474278 papers

Title	Date	Tasks	Status	Hype
FALCON: An ML Framework for Fully Automated Layout-Constrained Analog Circuit Design	May 28, 2025	Graph Neural Network	CodeCode Available	1
UniTalk: Towards Universal Active Speaker Detection in Real World Scenarios	May 28, 2025	Active Speaker Detection	CodeCode Available	1
CSI-Bench: A Large-Scale In-the-Wild Dataset for Multi-task WiFi Sensing	May 28, 2025	Multi-Task LearningPrivacy Preserving	CodeCode Available	1
Analysis and Evaluation of Synthetic Data Generation in Speech Dysfluency Detection	May 28, 2025	DiversitySynthetic Data Generation	CodeCode Available	1
Synonymous Variational Inference for Perceptual Image Compression	May 28, 2025	Image CompressionVariational Inference	CodeCode Available	0
HDDLGym: A Tool for Studying Multi-Agent Hierarchical Problems Defined in HDDL with OpenAI Gym	May 28, 2025	OpenAI GymReinforcement Learning (RL)	CodeCode Available	0
Towards Efficient Key-Value Cache Management for Prefix Prefilling in LLM Inference	May 28, 2025	ManagementRAG	—Unverified	0
Multipath cycleGAN for harmonization of paired and unpaired low-dose lung computed tomography reconstruction kernels	May 28, 2025	AnatomyComputed Tomography (CT)	—Unverified	0
Data-Driven Control of Continuous-Time LTI Systems via Non-Minimal Realizations	May 28, 2025		CodeCode Available	0
A Human-Centric Approach to Explainable AI for Personalized Education	May 28, 2025	Autonomous DrivingMixture-of-Experts	CodeCode Available	0
Improving Respiratory Sound Classification with Architecture-Agnostic Knowledge Distillation from Ensembles	May 28, 2025	Knowledge DistillationSound Classification	CodeCode Available	0
DORAEMON: Decentralized Ontology-aware Reliable Agent with Enhanced Memory Oriented Navigation	May 28, 2025	Autonomous NavigationRAG	—Unverified	0
ARiSE: Auto-Regressive Multi-Channel Speech Enhancement	May 28, 2025	Speech Enhancement	—Unverified	0
Operator-Splitting Methods for Neuromorphic Circuit Simulation	May 28, 2025	Numerical Integration	—Unverified	0
Subspecialty-Specific Foundation Model for Intelligent Gastrointestinal Pathology	May 28, 2025	DiagnosticPrognosis	—Unverified	0
Advancing Hearing Assessment: An ASR-Based Frequency-Specific Speech Test for Diagnosing Presbycusis	May 28, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
A Synthetic Business Cycle Approach to Counterfactual Analysis with Nonstationary Macroeconomic Data	May 28, 2025	Causal Inferencecounterfactual	—Unverified	0
Causal Inference for Experiments with Latent Outcomes: Key Results and Their Implications for Design and Analysis	May 28, 2025	Causal InferenceExperimental Design	—Unverified	0
Risk-Sensitive Conformal Prediction for Catheter Placement Detection in Chest X-rays	May 28, 2025	Conformal PredictionMulti-Task Learning	—Unverified	0
Algorithm Unrolling-based Denoising of Multimodal Graph Signals	May 28, 2025	DenoisingGraph Learning	—Unverified	0
Online Fair Division for Personalized 2-Value Instances	May 28, 2025	Fairness	—Unverified	0
Target Localization with Coprime Multistatic MIMO Radar via Coupled Canonical Polyadic Decomposition Based on Joint Eigenvalue Decomposition	May 28, 2025	Computational Efficiency	—Unverified	0
SimProcess: High Fidelity Simulation of Noisy ICS Physical Processes	May 28, 2025		CodeCode Available	0
ChatPD: An LLM-driven Paper-Dataset Networking System	May 28, 2025	Entity ResolutionOpen Information Extraction	CodeCode Available	0
On data usage and predictive behavior of data-driven predictive control with 1-norm regularization	May 28, 2025		CodeCode Available	0
ChatVLA-2: Vision-Language-Action Model with Open-World Embodied Reasoning from Pretrained Knowledge	May 28, 2025	Imitation LearningMath	CodeCode Available	1
GitGoodBench: A Novel Benchmark For Evaluating Agentic Performance On Git	May 28, 2025	AI Agent	CodeCode Available	0
Voice Adaptation for Swiss German	May 28, 2025	Voice Cloning	—Unverified	0
LiDAR Based Semantic Perception for Forklifts in Outdoor Environments	May 28, 2025	Scene UnderstandingSegmentation	—Unverified	0
Surf2CT: Cascaded 3D Flow Matching Models for Torso 3D CT Synthesis from Skin Surface	May 28, 2025	AnatomyComputed Tomography (CT)	—Unverified	0
Visual Cues Support Robust Turn-taking Prediction in Noise	May 28, 2025		CodeCode Available	0
On the performance of machine-learning-assisted Monte Carlo in sampling from simple statistical physics models	May 28, 2025		CodeCode Available	0
A memristive model of spatio-temporal excitability	May 28, 2025	model	—Unverified	0
Practical Adversarial Attacks on Stochastic Bandits via Fake Data Injection	May 28, 2025	Thompson Sampling	—Unverified	0
AudioTurbo: Fast Text-to-Audio Generation with Rectified Diffusion	May 28, 2025	AudioCapsAudio Generation	—Unverified	0
Articulatory modeling of the S-shaped F2 trajectories observed in Öhman's spectrographic analysis of VCV syllables	May 28, 2025	Trajectory Planning	—Unverified	0
Aspects of density approximation by tensor trains	May 28, 2025	State Estimation	—Unverified	0
Zero-Shot Vision Encoder Grafting via LLM Surrogates	May 28, 2025	DecoderLanguage Modeling	CodeCode Available	2
Spatial Knowledge Graph-Guided Multimodal Synthesis	May 28, 2025	Common Sense ReasoningKnowledge Graphs	—Unverified	0
Evaluation of LLMs in Speech is Often Flawed: Test Set Contamination in Large Language Models for Speech Recognition	May 28, 2025	speech-recognitionSpeech Recognition	—Unverified	0
MAMBO-NET: Multi-Causal Aware Modeling Backdoor-Intervention Optimization for Medical Image Segmentation Network	May 28, 2025	Causal InferenceImage Segmentation	—Unverified	0
Reference-Guided Identity Preserving Face Restoration	May 28, 2025	Image Restoration	—Unverified	0
Characterizing Bias: Benchmarking Large Language Models in Simplified versus Traditional Chinese	May 28, 2025	Benchmarking	CodeCode Available	0
B-XAIC Dataset: Benchmarking Explainable AI for Graph Neural Networks Using Chemical Data	May 28, 2025	BenchmarkingDrug Discovery	CodeCode Available	0
SVRPBench: A Realistic Benchmark for Stochastic Vehicle Routing Problem	May 28, 2025	Benchmarking	CodeCode Available	1
GeoDrive: 3D Geometry-Informed Driving World Model with Precise Action Control	May 28, 2025	3D geometryAutonomous Driving	CodeCode Available	2
Hybrid Batch Normalisation: Resolving the Dilemma of Batch Normalisation in Federated Learning	May 28, 2025	Federated Learning	CodeCode Available	1
RenderFormer: Transformer-based Neural Rendering of Triangle Meshes with Global Illumination	May 28, 2025	Neural Rendering	CodeCode Available	4
ReSCORE: Label-free Iterative Retriever Training for Multi-hop Question Answering with Relevance-Consistency Supervision	May 27, 2025		—Unverified	0
Evaluation of LLMs in Medical Text Summarization: The Role of Vocabulary Adaptation in High OOV Settings	May 27, 2025		CodeCode Available	0