The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

474,278 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8901–8925 of 474278 papers

Title	Date	Tasks	Status	Hype
Vibe-Eval: A hard evaluation suite for measuring progress of multimodal language models	May 3, 2024		CodeCode Available	2
Automating the Enterprise with Foundation Models	May 3, 2024	Management	CodeCode Available	2
On the test-time zero-shot generalization of vision-language models: Do we really need prompt learning?	May 3, 2024	Computational EfficiencyPrompt Learning	CodeCode Available	2
A Survey of Time Series Foundation Models: Generalizing Time Series Representation with Large Language Model	May 3, 2024	Decision MakingFew-Shot Learning	CodeCode Available	2
SynFlowNet: Design of Diverse and Novel Molecules with Synthesis Constraints	May 2, 2024	DiversityDrug Design	CodeCode Available	2
Part-aware Shape Generation with Latent 3D Diffusion of Neural Voxel Fields	May 2, 2024	Decoder	CodeCode Available	2
MiniGPT-3D: Efficiently Aligning 3D Point Clouds with Large Language Models using 2D Priors	May 2, 2024	3D Object Captioning3D Object Classification	CodeCode Available	2
Multi-Space Alignments Towards Universal LiDAR Segmentation	May 2, 2024	Autonomous DrivingDiversity	CodeCode Available	2
Benchmarking Representations for Speech, Music, and Acoustic Events	May 2, 2024	Audio ClassificationBenchmarking	CodeCode Available	2
SSUMamba: Spatial-Spectral Selective State Space Model for Hyperspectral Image Denoising	May 2, 2024	Computational EfficiencyDenoising	CodeCode Available	2
A Survey on Large Language Models for Critical Societal Domains: Finance, Healthcare, and Law	May 2, 2024	DiagnosticEthics	CodeCode Available	2
EchoScene: Indoor Scene Generation via Information Echo over Scene Graph Diffusion	May 2, 2024	3D Object RetrievalDenoising	CodeCode Available	2
SATO: Stable Text-to-Motion Framework	May 2, 2024		CodeCode Available	2
FeNNol: an Efficient and Flexible Library for Building Force-field-enhanced Neural Network Potentials	May 2, 2024	GPU	CodeCode Available	2
LocInv: Localization-aware Inversion for Text-Guided Image Editing	May 2, 2024	Denoisingtext-guided-image-editing	CodeCode Available	2
Torch2Chip: An End-to-end Customizable Deep Neural Network Compression and Deployment Toolkit for Prototype Hardware Accelerator Design	May 2, 2024	Model CompressionNeural Network Compression	CodeCode Available	2
ASAM: Boosting Segment Anything Model with Adversarial Tuning	May 1, 2024	Image Segmentationmodel	CodeCode Available	2
TFPred: Learning Discriminative Representations from Unlabeled Data for Few-Label Rotating Machinery Fault Diagnosis	May 1, 2024	Fault DetectionFault Diagnosis	CodeCode Available	2
Model Quantization and Hardware Acceleration for Vision Transformers: A Comprehensive Survey	May 1, 2024	Quantization	CodeCode Available	2
Causal Evaluation of Language Models	May 1, 2024	Causal DiscoveryCausal Inference	CodeCode Available	2
WorkBench: a Benchmark Dataset for Agents in a Realistic Workplace Setting	May 1, 2024	Scheduling	CodeCode Available	2
Toward Unified Practices in Trajectory Prediction Research on Bird's-Eye-View Datasets	May 1, 2024	Autonomous VehiclesMotion Forecasting	CodeCode Available	2
Adaptive Bidirectional Displacement for Semi-Supervised Medical Image Segmentation	May 1, 2024	Image SegmentationMedical Image Segmentation	CodeCode Available	2
GraCo: Granularity-Controllable Interactive Segmentation	May 1, 2024	Interactive SegmentationSegmentation	CodeCode Available	2
Spectrally Pruned Gaussian Fields with Neural Compensation	May 1, 2024		CodeCode Available	2