The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

474,278 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 19251–19300 of 474278 papers

Title	Date	Tasks	Status	Hype
Reversible molecular simulation for training classical and machine learning force fields	Dec 5, 2024		CodeCode Available	1
MISR: Measuring Instrumental Self-Reasoning in Frontier Models	Dec 5, 2024	Language ModelingLanguage Modelling	CodeCode Available	1
Graph Neural Networks Need Cluster-Normalize-Activate Modules	Dec 5, 2024	Node ClassificationProperty Prediction	CodeCode Available	1
HEAL: Hierarchical Embedding Alignment Loss for Improved Retrieval and Representation Learning	Dec 5, 2024	Contrastive LearningDocument Classification	CodeCode Available	1
M2PDE: Compositional Generative Multiphysics and Multi-component PDE Simulation	Dec 5, 2024		CodeCode Available	1
Pre-train, Align, and Disentangle: Empowering Sequential Recommendation with Large Language Models	Dec 5, 2024	Recommendation SystemsSequential Recommendation	CodeCode Available	1
MIND: Effective Incorrect Assignment Detection through a Multi-Modal Structure-Enhanced Language Model	Dec 5, 2024	AttributeLanguage Modeling	CodeCode Available	1
WinTSR: A Windowed Temporal Saliency Rescaling Method for Interpreting Time Series Deep Learning Models	Dec 5, 2024	Feature ImportanceTime Series	CodeCode Available	1
Retrieval-Augmented Machine Translation with Unstructured Knowledge	Dec 5, 2024	Knowledge GraphsMachine Translation	CodeCode Available	1
Bench-CoE: a Framework for Collaboration of Experts from Benchmark	Dec 5, 2024		CodeCode Available	1
Dual-Branch Subpixel-Guided Network for Hyperspectral Image Classification	Dec 5, 2024	ClassificationDiagnostic	CodeCode Available	1
Integrating Various Software Artifacts for Better LLM-based Bug Localization and Program Repair	Dec 5, 2024	Fault localizationProgram Repair	CodeCode Available	1
TransAdapter: Vision Transformer for Feature-Centric Unsupervised Domain Adaptation	Dec 5, 2024	Domain AdaptationUnsupervised Domain Adaptation	CodeCode Available	1
Cross-Self KV Cache Pruning for Efficient Vision-Language Inference	Dec 5, 2024		CodeCode Available	1
Hidden in the Noise: Two-Stage Robust Watermarking for Images	Dec 5, 2024		CodeCode Available	1
Mind the Gap: Towards Generalizable Autonomous Penetration Testing via Domain Randomization and Meta-Reinforcement Learning	Dec 5, 2024	Large Language ModelMeta Reinforcement Learning	CodeCode Available	1
HumanEdit: A High-Quality Human-Rewarded Dataset for Instruction-based Image Editing	Dec 5, 2024		CodeCode Available	1
Samudra: An AI Global Ocean Emulator for Climate	Dec 5, 2024		CodeCode Available	1
MageBench: Bridging Large Multimodal Models to Agents	Dec 5, 2024	Sokoban	CodeCode Available	1
TASR: Timestep-Aware Diffusion Model for Image Super-Resolution	Dec 4, 2024	DenoisingImage Super-Resolution	CodeCode Available	1
Is JPEG AI going to change image forensics?	Dec 4, 2024	Face SwappingImage Compression	CodeCode Available	1
Chatting with Logs: An exploratory study on Finetuning LLMs for LogQL	Dec 4, 2024		CodeCode Available	1
Point-GN: A Non-Parametric Network Using Gaussian Positional Encoding for Point Cloud Classification	Dec 4, 2024	3D Point Cloud ClassificationClassification	CodeCode Available	1
AI-Driven Day-to-Day Route Choice	Dec 4, 2024	Decision MakingReinforcement Learning (RL)	CodeCode Available	1
Robust Multi-bit Text Watermark with LLM-based Paraphrasers	Dec 4, 2024	DecoderSentence	CodeCode Available	1
Measure Anything: Real-time, Multi-stage Vision-based Dimensional Measurement using Segment Anything	Dec 4, 2024	Keypoint DetectionRobotic Grasping	CodeCode Available	1
Nonparametric Filtering, Estimation and Classification using Neural Jump ODEs	Dec 4, 2024		CodeCode Available	1
Interpreting single-cell and spatial omics data using deep neural network training dynamics	Dec 4, 2024	DiversityGraph Embedding	CodeCode Available	1
RFSR: Improving ISR Diffusion Models via Reward Feedback Learning	Dec 4, 2024	Blind Super-ResolutionImage Super-Resolution	CodeCode Available	1
gghic: A Versatile R Package for Exploring and Visualizing 3D Genome Organization	Dec 4, 2024		CodeCode Available	1
U-MATH: A University-Level Benchmark for Evaluating Mathematical Skills in LLMs	Dec 4, 2024	DiversityMath	CodeCode Available	1
BIMCaP: BIM-based AI-supported LiDAR-Camera Pose Refinement	Dec 4, 2024	Decision MakingManagement	CodeCode Available	1
PrefixKV: Adaptive Prefix KV Cache is What Vision Instruction-Following Models Need for Efficient Generation	Dec 4, 2024	Instruction Following	CodeCode Available	1
ASIGN: An Anatomy-aware Spatial Imputation Graphic Network for 3D Spatial Transcriptomics	Dec 4, 2024	AnatomyDiagnostic	CodeCode Available	1
Composed Image Retrieval for Training-Free Domain Conversion	Dec 4, 2024	Image RetrievalLanguage Modeling	CodeCode Available	1
EchoONE: Segmenting Multiple echocardiography Planes in One Model	Dec 4, 2024	model	CodeCode Available	1
Expanding Event Modality Applications through a Robust CLIP-Based Encoder	Dec 4, 2024	Few-Shot LearningObject Recognition	CodeCode Available	1
Inst-IT: Boosting Multimodal Instance Understanding via Explicit Visual Prompt Instruction Tuning	Dec 4, 2024	Multimodal Large Language ModelVideo Understanding	CodeCode Available	1
Revolve: Optimizing AI Systems by Tracking Response Evolution in Textual Optimization	Dec 4, 2024	Prompt Engineering	CodeCode Available	1
Evaluating Language Models as Synthetic Data Generators	Dec 4, 2024	Language ModelingLanguage Modelling	CodeCode Available	1
MRGen: Diffusion-based Controllable Data Engine for MRI Segmentation towards Unannotated Modalities	Dec 4, 2024	Image GenerationImage Segmentation	CodeCode Available	1
How Many Ratings per Item are Necessary for Reliable Significance Testing?	Dec 4, 2024		CodeCode Available	1
Beyond [cls]: Exploring the true potential of Masked Image Modeling representations	Dec 4, 2024	GPUSelf-Supervised Learning	CodeCode Available	1
SGSST: Scaling Gaussian Splatting StyleTransfer	Dec 4, 2024	3DGSNeural Rendering	CodeCode Available	1
Scaling Inference-Time Search with Vision Value Model for Improved Visual Comprehension	Dec 4, 2024	DescriptiveLanguage Modeling	CodeCode Available	1
Testing Neural Network Verifiers: A Soundness Benchmark with Hidden Counterexamples	Dec 4, 2024		CodeCode Available	1
ClusterKV: Manipulating LLM KV Cache in Semantic Space for Recallable Compression	Dec 4, 2024	2kLogical Reasoning	CodeCode Available	1
NeRF and Gaussian Splatting SLAM in the Wild	Dec 4, 2024	3DGSComputational Efficiency	CodeCode Available	1
Frequency-Guided Diffusion Model with Perturbation Training for Skeleton-Based Video Anomaly Detection	Dec 4, 2024	Anomaly DetectionVideo Anomaly Detection	CodeCode Available	1
A Stitch in Time Saves Nine: Small VLM is a Precise Guidance for Accelerating Large VLMs	Dec 4, 2024	Visual Question Answering	CodeCode Available	1