The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

474,278 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7651–7675 of 474278 papers

Title	Date	Tasks	Status	Hype
CustomCrafter: Customized Video Generation with Preserving Motion and Concept Composition Abilities	Aug 23, 2024	DenoisingMotion Generation	CodeCode Available	2
Image Segmentation in Foundation Model Era: A Survey	Aug 23, 2024	Image SegmentationInstance Segmentation	CodeCode Available	2
Towards Evaluating and Building Versatile Large Language Models for Medicine	Aug 22, 2024	Multiple-choicenamed-entity-recognition	CodeCode Available	2
Scalable Autoregressive Image Generation with Mamba	Aug 22, 2024	Image GenerationMamba	CodeCode Available	2
MuMA-ToM: Multi-modal Multi-Agent Theory of Mind	Aug 22, 2024		CodeCode Available	2
ConflictBank: A Benchmark for Evaluating the Influence of Knowledge Conflicts in LLM	Aug 22, 2024	Misinformation	CodeCode Available	2
UMERegRobust -- Universal Manifold Embedding Compatible Features for Robust Point Cloud Registration	Aug 22, 2024	Point Cloud Registration	CodeCode Available	2
UNetMamba: An Efficient UNet-Like Mamba for Semantic Segmentation of High-Resolution Remote Sensing Images	Aug 21, 2024	MambaSegmentation	CodeCode Available	2
Critique-out-Loud Reward Models	Aug 21, 2024	Language ModellingLarge Language Model	CodeCode Available	2
RaNDT SLAM: Radar SLAM Based on Intensity-Augmented Normal Distributions Transform	Aug 21, 2024	Indoor LocalizationSimultaneous Localization and Mapping	CodeCode Available	2
HMT-UNet: A hybird Mamba-Transformer Vision UNet for Medical Image Segmentation	Aug 21, 2024	Image SegmentationMamba	CodeCode Available	2
biorecap: an R package for summarizing bioRxiv preprints with a local LLM	Aug 21, 2024	Language ModellingLarge Language Model	CodeCode Available	2
BearLLM: A Prior Knowledge-Enhanced Bearing Health Management Framework with Unified Vibration Signal Representation	Aug 21, 2024	Fault DiagnosisManagement	CodeCode Available	2
Pano2Room: Novel View Synthesis from a Single Indoor Panorama	Aug 21, 2024	Novel View Synthesis	CodeCode Available	2
KAN4TSF: Are KAN and KAN-based models Effective for Time Series Forecasting?	Aug 21, 2024	Mixture-of-ExpertsTime Series	CodeCode Available	2
VE-Bench: Subjective-Aligned Benchmark Suite for Text-Driven Video Editing Quality Assessment	Aug 21, 2024	Video AlignmentVideo Editing	CodeCode Available	2
Personality Alignment of Large Language Models	Aug 21, 2024	Personality Alignment	CodeCode Available	2
PRformer: Pyramidal Recurrent Transformer for Multivariate Time Series Forecasting	Aug 20, 2024	Multivariate Time Series ForecastingTemporal Sequences	CodeCode Available	2
BEYOND DIALOGUE: A Profile-Dialogue Alignment Framework Towards General Role-Playing Language Model	Aug 20, 2024	Language ModelingLanguage Modelling	CodeCode Available	2
MegaFusion: Extend Diffusion Models towards Higher-resolution Image Generation without Further Tuning	Aug 20, 2024	DenoisingImage Generation	CodeCode Available	2
MagicDec: Breaking the Latency-Throughput Tradeoff for Long Context Generation with Speculative Decoding	Aug 20, 2024		CodeCode Available	2
deepmriprep: Voxel-based Morphometry (VBM) Preprocessing via Deep Neural Networks	Aug 20, 2024	GPUImage Registration	CodeCode Available	2
PerturBench: Benchmarking Machine Learning Models for Cellular Perturbation Analysis	Aug 20, 2024	Benchmarking	CodeCode Available	2
FLAME: Learning to Navigate with Multimodal LLM in Urban Environments	Aug 20, 2024	NavigateVision and Language Navigation	CodeCode Available	2
ConFIG: Towards Conflict-free Training of Physics Informed Neural Networks	Aug 20, 2024		CodeCode Available	2