The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

474,278 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 20451–20500 of 474278 papers

Title	Date	Tasks	Status	Hype
Is Your LLM Overcharging You? Tokenization, Transparency, and Incentives	May 27, 2025	Chatbot	CodeCode Available	0
A Structured Unplugged Approach for Foundational AI Literacy in Primary Education	May 27, 2025	Logical ReasoningMisconceptions	CodeCode Available	0
Learning Individual Behavior in Agent-Based Models with Graph Diffusion Networks	May 27, 2025	Graph Learning	CodeCode Available	0
Visual Cues Enhance Predictive Turn-Taking for Two-Party Human Interaction	May 27, 2025		CodeCode Available	0
Efficient Identity and Position Graph Embedding via Spectral-Based Random Feature Aggregation	May 27, 2025	Graph EmbeddingPosition	CodeCode Available	0
Fedivertex: a Graph Dataset based on Decentralized Social Networks for Trustworthy Machine Learning	May 27, 2025	Benchmarking	CodeCode Available	0
Laparoscopic Image Desmoking Using the U-Net with New Loss Function and Integrated Differentiable Wiener Filter	May 27, 2025	Benchmarking	CodeCode Available	0
Taylor expansion-based Kolmogorov-Arnold network for blind image quality assessment	May 27, 2025	Blind Image Quality AssessmentComputational Efficiency	CodeCode Available	1
Paper2Poster: Towards Multimodal Poster Automation from Scientific Papers	May 27, 2025		CodeCode Available	7
Wideband RF Radiance Field Modeling Using Frequency-embedded 3D Gaussian Splatting	May 27, 2025	3DGSSSIM	CodeCode Available	0
Towards Pretraining Robust ASR Foundation Model with Acoustic-Aware Data Augmentation	May 27, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Loquacious Set: 25,000 Hours of Transcribed and Diverse English Speech Recognition Data for Research and Commercial Use	May 27, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Physics-Informed Neural Network for Cross-Domain Predictive Control of Tapered Amplifier Thermal Stabilization	May 27, 2025	Model Predictive Control	—Unverified	0
MRSD: Multi-Resolution Skill Discovery for HRL Agents	May 27, 2025	Hierarchical Reinforcement Learning	—Unverified	0
Debiased Ill-Posed Regression	May 27, 2025	Causal Inferenceregression	—Unverified	0
Generative Image Compression by Estimating Gradients of the Rate-variable Feature Distribution	May 27, 2025	Image Compression	—Unverified	0
Multi-VQC: A Novel QML Approach for Enhancing Healthcare Classification	May 27, 2025	Diagnostic	—Unverified	0
AgriFM: A Multi-source Temporal Remote Sensing Foundation Model for Crop Mapping	May 27, 2025		CodeCode Available	1
Research Community Perspectives on "Intelligence" and Large Language Models	May 27, 2025	Survey	—Unverified	0
Humble AI in the real-world: the case of algorithmic hiring	May 27, 2025	FairnessUncertainty Quantification	—Unverified	0
Efficient and Microphone-Fault-Tolerant 3D Sound Source Localization	May 27, 2025	PositionSound Source Localization	—Unverified	0
Dissecting Physics Reasoning in Small Language Models: A Multi-Dimensional Analysis from an Educational Perspective	May 27, 2025	Computational EfficiencyHigh School Physics	—Unverified	0
Towards Robust Assessment of Pathological Voices via Combined Low-Level Descriptors and Foundation Model Representations	May 27, 2025	Sentence	—Unverified	0
Hume: Introducing System-2 Thinking in Visual-Language-Action Model	May 27, 2025	DenoisingVision-Language-Action	—Unverified	0
REWIND: Speech Time Reversal for Enhancing Speaker Representations in Diffusion-based Voice Conversion	May 27, 2025	DisentanglementSpeaker Identification	—Unverified	0
SOSBENCH: Benchmarking Safety Alignment on Scientific Knowledge	May 27, 2025	BenchmarkingMultiple-choice	—Unverified	0
Memorization to Generalization: Emergence of Diffusion Models from Associative Memory	May 27, 2025	MemorizationRetrieval	—Unverified	0
Semantic Communication meets System 2 ML: How Abstraction, Compositionality and Emergent Languages Shape Intelligence	May 27, 2025	Semantic Communication	—Unverified	0
VoiceMark: Zero-Shot Voice Cloning-Resistant Watermarking Approach Leveraging Speaker-Specific Latents	May 27, 2025	Voice Cloning	—Unverified	0
Structure from Collision	May 27, 2025	3DGSNeRF	—Unverified	0
Network classification through random walks	May 27, 2025	Classification	—Unverified	0
VideoMarkBench: Benchmarking Robustness of Video Watermarking	May 27, 2025	Benchmarking	CodeCode Available	0
SV-TrustEval-C: Evaluating Structure and Semantic Reasoning in Large Language Models for Source Code Vulnerability Analysis	May 27, 2025	Logical ReasoningVulnerability Detection	CodeCode Available	0
REAL-Prover: Retrieval Augmented Lean Prover for Mathematical Reasoning	May 27, 2025	Language ModelingLanguage Modelling	CodeCode Available	1
Learning Where to Learn: Training Distribution Selection for Provable OOD Performance	May 27, 2025	Bilevel OptimizationGeneralization Bounds	CodeCode Available	0
AdInject: Real-World Black-Box Attacks on Web Agents via Advertising Delivery	May 27, 2025		CodeCode Available	0
AITEE -- Agentic Tutor for Electrical Engineering	May 27, 2025	Electrical EngineeringRetrieval-augmented Generation	CodeCode Available	0
Hybrid Disagreement-Diversity Active Learning for Bioacoustic Sound Event Detection	May 27, 2025	Active LearningDiversity	CodeCode Available	0
A Physics-Augmented GraphGPS Framework for the Reconstruction of 3D Riemann Problems from Sparse Data	May 27, 2025	Physics-informed machine learning	CodeCode Available	0
AMSFL: Adaptive Multi-Step Federated Learning via Gradient Difference-Based Error Modeling	May 27, 2025	Federated Learning	—Unverified	0
Respond to Change with Constancy: Instruction-tuning with LLM for Non-I.I.D. Network Traffic Classification	May 27, 2025	Robust classificationTraffic Classification	—Unverified	0
CogAD: Cognitive-Hierarchy Guided End-to-End Autonomous Driving	May 27, 2025	Autonomous DrivingBench2Drive	—Unverified	0
OmniIndoor3D: Comprehensive Indoor 3D Reconstruction	May 27, 2025	3DGS3D Reconstruction	—Unverified	0
Multitemporal Latent Dynamical Framework for Hyperspectral Images Unmixing	May 27, 2025	Hyperspectral Unmixing	—Unverified	0
Intelligent Incident Hypertension Prediction in Obstructive Sleep Apnea	May 27, 2025	PredictionTransfer Learning	—Unverified	0
VoxAging: Continuously Tracking Speaker Aging with a Large-Scale Longitudinal Dataset in English and Mandarin	May 27, 2025	Speaker Verification	—Unverified	0
Recognition of Physiological Patterns during Activities of Daily Living Using Wearable Biosignal Sensors	May 27, 2025	Activity RecognitionPrediction	—Unverified	0
Expert Survey: AI Reliability & Security Research Priorities	May 27, 2025	Survey	—Unverified	0
Streamlining Knowledge Graph Creation with PyRML	May 27, 2025	Data IntegrationKnowledge Graphs	—Unverified	0
Algorithms and SQ Lower Bounds for Robustly Learning Real-valued Multi-index Models	May 27, 2025	PAC learning	—Unverified	0