The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

474,278 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 16501–16550 of 474278 papers

Title	Date	Tasks	Status	Hype
HyperCore: The Core Framework for Building Hyperbolic Foundation Models with Comprehensive Modules	Apr 11, 2025	RAG	CodeCode Available	1
A Strategic Coordination Framework of Small LLMs Matches Large LLMs in Data Synthesis	Apr 11, 2025		CodeCode Available	1
ProtoECGNet: Case-Based Interpretable Deep Learning for Multi-Label ECG Classification with Contrastive Learning	Apr 11, 2025	Contrastive LearningDeep Learning	CodeCode Available	1
PhaseGen: A Diffusion-Based Approach for Complex-Valued MRI Data Generation	Apr 10, 2025	DiagnosticMRI Reconstruction	CodeCode Available	1
C3PO: Critical-Layer, Core-Expert, Collaborative Pathway Optimization for Test-Time Expert Re-Mixing	Apr 10, 2025	In-Context LearningMixture-of-Experts	CodeCode Available	1
Zero-Shot Cross-Domain Code Search without Fine-Tuning	Apr 10, 2025	Code SearchNatural Language Queries	CodeCode Available	1
ClimateBench-M: A Multi-Modal Climate Data Benchmark with a Simple Generative Method	Apr 10, 2025	Time SeriesWeather Forecasting	CodeCode Available	1
LauraTSE: Target Speaker Extraction using Auto-Regressive Decoder-Only Language Models	Apr 10, 2025	DecoderLanguage Modeling	CodeCode Available	1
Harnessing Equivariance: Modeling Turbulence with Graph Neural Networks	Apr 10, 2025	Reinforcement Learning (RL)	CodeCode Available	1
Model Utility Law: Evaluating LLMs beyond Performance through Mechanism Interpretable Metric	Apr 10, 2025	FairnessLarge Language Model	CodeCode Available	1
Pychop: Emulating Low-Precision Arithmetic in Numerical Methods and Neural Networks	Apr 10, 2025	image-classificationImage Classification	CodeCode Available	1
Apt-Serve: Adaptive Request Scheduling on Hybrid Cache for Scalable LLM Inference Serving	Apr 10, 2025	GPULarge Language Model	CodeCode Available	1
The KL3M Data Project: Copyright-Clean Training Resources for Large Language Models	Apr 10, 2025		CodeCode Available	1
Enhancing Time Series Forecasting via Multi-Level Text Alignment with LLMs	Apr 10, 2025	Multimodal Large Language ModelTime Series	CodeCode Available	1
ColorBench: Can VLMs See and Understand the Colorful World? A Comprehensive Benchmark for Color Perception, Reasoning, and Robustness	Apr 10, 2025	Visual Reasoning	CodeCode Available	1
CCMNet: Leveraging Calibrated Color Correction Matrices for Cross-Camera Color Constancy	Apr 10, 2025	Color ConstancyData Augmentation	CodeCode Available	1
MRD-RAG: Enhancing Medical Diagnosis with Multi-Round Retrieval-Augmented Generation	Apr 10, 2025	DiagnosticMedical Diagnosis	CodeCode Available	1
Heart Failure Prediction using Modal Decomposition and Masked Autoencoders for Scarce Echocardiography Databases	Apr 10, 2025	Data AugmentationSelf-Supervised Learning	CodeCode Available	1
PIDSR: Complementary Polarized Image Demosaicing and Super-Resolution	Apr 10, 2025	DemosaickingImage Super-Resolution	CodeCode Available	1
Diffusion Transformers for Tabular Data Time Series Generation	Apr 10, 2025	Tabular Data GenerationTime Series	CodeCode Available	1
LAPIS: A novel dataset for personalized image aesthetic assessment	Apr 10, 2025		CodeCode Available	1
ID-Booth: Identity-consistent Face Generation with Diffusion Models	Apr 10, 2025	DenoisingDiversity	CodeCode Available	1
STeP: A General and Scalable Framework for Solving Video Inverse Problems with Spatiotemporal Diffusion Priors	Apr 10, 2025		CodeCode Available	1
AI-Slop to AI-Polish? Aligning Language Models through Edit-Based Writing Rewards and Test-time Computation	Apr 10, 2025	ArticlesMarketing	CodeCode Available	1
Echo Chamber: RL Post-training Amplifies Behaviors Learned in Pretraining	Apr 10, 2025	Mathematical ReasoningReinforcement Learning (RL)	CodeCode Available	1
AgentAda: Skill-Adaptive Data Analytics for Tailored Insight Discovery	Apr 10, 2025	RAGRetrieval-augmented Generation	CodeCode Available	1
Task-Circuit Quantization: Leveraging Knowledge Localization and Interpretability for Compression	Apr 10, 2025	MathMMLU	CodeCode Available	1
SVG-IR: Spatially-Varying Gaussian Splatting for Inverse Rendering	Apr 9, 2025	3DGSInverse Rendering	CodeCode Available	1
Inducing Programmatic Skills for Agentic Tasks	Apr 9, 2025		CodeCode Available	1
Uni-PrevPredMap: Extending PrevPredMap to a Unified Framework of Prior-Informed Modeling for Online Vectorized HD Map Construction	Apr 9, 2025	Autonomous DrivingOnline Vectorized HD Map Construction	CodeCode Available	1
Diffusion Factor Models: Generating High-Dimensional Returns with Factor Structure	Apr 9, 2025	EconometricsPortfolio Optimization	CodeCode Available	1
MoEDiff-SR: Mixture of Experts-Guided Diffusion Model for Region-Adaptive MRI Super-Resolution	Apr 9, 2025	Computational EfficiencyDenoising	CodeCode Available	1
Evolutionary Generation of Random Surreal Numbers for Benchmarking	Apr 9, 2025	Benchmarking	CodeCode Available	1
Neural Motion Simulator: Pushing the Limit of World Models in Reinforcement Learning	Apr 9, 2025	reinforcement-learningReinforcement Learning	CodeCode Available	1
Detect All-Type Deepfake Audio: Wavelet Prompt Tuning for Enhanced Auditory Perception	Apr 9, 2025	AllAudio Deepfake Detection	CodeCode Available	1
GraspClutter6D: A Large-scale Real-world Dataset for Robust Perception and Grasping in Cluttered Scenes	Apr 9, 2025	Pose Estimation	CodeCode Available	1
Missing Premise exacerbates Overthinking: Are Reasoning Models losing Critical Thinking Skill?	Apr 9, 2025		CodeCode Available	1
Wheat3DGS: In-field 3D Reconstruction, Instance Segmentation and Phenotyping of Wheat Heads with Gaussian Splatting	Apr 9, 2025	3DGS3D Instance Segmentation	CodeCode Available	1
Alice: Proactive Learning with Teacher's Demonstrations for Weak-to-Strong Generalization	Apr 9, 2025	Logical ReasoningMathematical Reasoning	CodeCode Available	1
A Digital Twin of an Electrical Distribution Grid: SoCal 28-Bus Dataset	Apr 9, 2025	State Estimation	CodeCode Available	1
A Unified Agentic Framework for Evaluating Conditional Image Generation	Apr 9, 2025	Conditional Image GenerationImage Generation	CodeCode Available	1
Masked Scene Modeling: Narrowing the Gap Between Supervised and Self-Supervised Learning in 3D Scene Understanding	Apr 9, 2025	Scene UnderstandingSelf-Supervised Learning	CodeCode Available	1
DyDiT++: Dynamic Diffusion Transformers for Efficient Visual Generation	Apr 9, 2025	Image GenerationText to Image Generation	CodeCode Available	1
Sculpting Subspaces: Constrained Full Fine-Tuning in LLMs for Continual Learning	Apr 9, 2025	Continual LearningDecoder	CodeCode Available	1
Are We Done with Object-Centric Learning?	Apr 9, 2025	ObjectObject Discovery	CodeCode Available	1
FamilyTool: A Multi-hop Personalized Tool Use Benchmark	Apr 9, 2025		CodeCode Available	1
CAFE-AD: Cross-Scenario Adaptive Feature Enhancement for Trajectory Planning in Autonomous Driving	Apr 9, 2025	Autonomous DrivingFeature Importance	CodeCode Available	1
MESA: Text-Driven Terrain Generation Using Latent Diffusion and Global Copernicus Data	Apr 9, 2025		CodeCode Available	1
Leanabell-Prover: Posttraining Scaling in Formal Reasoning	Apr 8, 2025	Automated Theorem Provingreinforcement-learning	CodeCode Available	1
Mind the Trojan Horse: Image Prompt Adapter Enabling Scalable and Deceptive Jailbreaking	Apr 8, 2025	Image Generation	CodeCode Available	1