The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

474,278 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 18051–18100 of 474278 papers

Title	Date	Tasks	Status	Hype
Accurate Pocket Identification for Binding-Site-Agnostic Docking	Feb 4, 2025	Blind DockingDrug Design	CodeCode Available	1
CITER: Collaborative Inference for Efficient Large Language Model Decoding with Token-Level Routing	Feb 4, 2025	Collaborative InferenceLanguage Modeling	CodeCode Available	1
SurvHive: a package to consistently access multiple survival-analysis packages	Feb 4, 2025	Survival Analysis	CodeCode Available	1
UNIP: Rethinking Pre-trained Attention Patterns for Infrared Semantic Segmentation	Feb 4, 2025	SegmentationSemantic Segmentation	CodeCode Available	1
Hier-EgoPack: Hierarchical Egocentric Video Understanding with Diverse Task Perspectives	Feb 4, 2025	Video Understanding	CodeCode Available	1
From Uncertain to Safe: Conformal Fine-Tuning of Diffusion Models for Safe PDE Control	Feb 4, 2025	Conformal PredictionUncertainty Quantification	CodeCode Available	1
Mind the Gap: Evaluating Patch Embeddings from General-Purpose and Histopathology Foundation Models for Cell Segmentation and Classification	Feb 4, 2025	Cell SegmentationDecoder	CodeCode Available	1
Developing multilingual speech synthesis system for Ojibwe, Mi'kmaq, and Maliseet	Feb 4, 2025	Speech Synthesistext-to-speech	CodeCode Available	1
MATCNN: Infrared and Visible Image Fusion Method Based on Multi-scale CNN with Attention Transformer	Feb 4, 2025	Infrared And Visible Image Fusion	CodeCode Available	1
IncepFormerNet: A multi-scale multi-head attention network for SSVEP classification	Feb 4, 2025	EEGSSVEP	CodeCode Available	1
Unified Spatial-Temporal Edge-Enhanced Graph Networks for Pedestrian Trajectory Prediction	Feb 4, 2025	Pedestrian Trajectory PredictionTrajectory Prediction	CodeCode Available	1
SimBEV: A Synthetic Multi-Task Multi-Sensor Driving Data Generation Tool and Dataset	Feb 4, 2025	3D Object DetectionAutonomous Driving	CodeCode Available	1
Adaptive Self-improvement LLM Agentic System for ML Library Development	Feb 4, 2025		CodeCode Available	1
From Words to Collisions: LLM-Guided Evaluation and Adversarial Generation of Safety-Critical Driving Scenarios	Feb 4, 2025	Autonomous DrivingAutonomous Vehicles	CodeCode Available	1
FinRLlama: A Solution to LLM-Engineered Signals Challenge at FinRL Contest 2024	Feb 4, 2025	Sentiment Analysis	CodeCode Available	1
Analytical Lyapunov Function Discovery: An RL-based Generative Approach	Feb 4, 2025	Reinforcement Learning (RL)valid	CodeCode Available	1
deCIFer: Crystal Structure Prediction from Powder Diffraction Data using Autoregressive Language Models	Feb 4, 2025		CodeCode Available	1
Activation-Informed Merging of Large Language Models	Feb 4, 2025	Computational EfficiencyContinual Learning	CodeCode Available	1
Combinatorial Optimization Perspective based Framework for Multi-behavior Recommendation	Feb 4, 2025	Combinatorial OptimizationMulti-Task Learning	CodeCode Available	1
Transformers Boost the Performance of Decision Trees on Tabular Data across Sample Sizes	Feb 4, 2025	In-Context LearningNatural Language Understanding	CodeCode Available	1
Improved Training Technique for Latent Consistency Models	Feb 3, 2025	Video Generation	CodeCode Available	1
AdaSVD: Adaptive Singular Value Decomposition for Large Language Models	Feb 3, 2025		CodeCode Available	1
VILP: Imitation Learning with Latent Video Planning	Feb 3, 2025	Imitation LearningVideo Generation	CodeCode Available	1
Simulating Rumor Spreading in Social Networks using LLM Agents	Feb 3, 2025	Language ModelingLanguage Modelling	CodeCode Available	1
Efficient and Scalable Density Functional Theory Hamiltonian Prediction through Adaptive Sparsity	Feb 3, 2025	Computational chemistryPrediction	CodeCode Available	1
Progressive Binarization with Semi-Structured Pruning for LLMs	Feb 3, 2025	Binarization	CodeCode Available	1
ML-Dev-Bench: Comparative Analysis of AI Agents on ML development workflows	Feb 3, 2025		CodeCode Available	1
Detecting Backdoor Samples in Contrastive Language Image Pretraining	Feb 3, 2025		CodeCode Available	1
Adversarial Reasoning at Jailbreaking Time	Feb 3, 2025	Adversarial Robustness	CodeCode Available	1
UASTHN: Uncertainty-Aware Deep Homography Estimation for UAV Satellite-Thermal Geo-localization	Feb 3, 2025	geo-localizationHomography Estimation	CodeCode Available	1
Joint Localization and Activation Editing for Low-Resource Fine-Tuning	Feb 3, 2025	Natural Language Understandingparameter-efficient fine-tuning	CodeCode Available	1
C codegen considered unnecessary: go directly to binary, do not pass C. Compilation of Julia code for deployment in model-based engineering	Feb 3, 2025	C++ codeCode Generation	CodeCode Available	1
Logits are All We Need to Adapt Closed Models	Feb 3, 2025	AllPrompt Engineering	CodeCode Available	1
Fine-Tuning Discrete Diffusion Models with Policy Gradient Methods	Feb 3, 2025	Language ModelingLanguage Modelling	CodeCode Available	1
A Wearable Device Dataset for Mental Health Assessment Using Laser Doppler Flowmetry and Fluorescence Spectroscopy Sensors	Feb 3, 2025	Explainable artificial intelligenceExplainable Artificial Intelligence (XAI)	CodeCode Available	1
VidSketch: Hand-drawn Sketch-Driven Video Generation with Diffusion Control	Feb 3, 2025	Video Generation	CodeCode Available	1
Robust-LLaVA: On the Effectiveness of Large-Scale Robust Image Encoders for Multi-modal Large Language Models	Feb 3, 2025	Adversarial RobustnessImage Captioning	CodeCode Available	1
Learning to Generate Unit Tests for Automated Debugging	Feb 3, 2025	HumanEvalLarge Language Model	CodeCode Available	1
FastKV: KV Cache Compression for Fast Long-Context Processing with Token-Selective Propagation	Feb 3, 2025	Computational Efficiency	CodeCode Available	1
A Probabilistic Inference Approach to Inference-Time Scaling of LLMs using Particle-Based Monte Carlo Methods	Feb 3, 2025	MathMathematical Reasoning	CodeCode Available	1
Trajectory World Models for Heterogeneous Environments	Feb 3, 2025	DiversityModel Predictive Control	CodeCode Available	1
SeizeIT2: Wearable Dataset Of Patients With Focal Epilepsy	Feb 3, 2025	Seizure Detection	CodeCode Available	1
GNN-DT: Graph Neural Network Enhanced Decision Transformer for Efficient Optimization in Dynamic Environments	Feb 3, 2025	Efficient ExplorationGraph Neural Network	CodeCode Available	1
Polynomial, trigonometric, and tropical activations	Feb 3, 2025	image-classificationImage Classification	CodeCode Available	1
COVE: COntext and VEracity prediction for out-of-context images	Feb 3, 2025	Fact CheckingMisinformation	CodeCode Available	1
Partial Channel Network: Compute Fewer, Perform Better	Feb 3, 2025		CodeCode Available	1
Evolving Symbolic 3D Visual Grounder with Weakly Supervised Reflection	Feb 3, 2025	3D visual groundingVisual Grounding	CodeCode Available	1
Learning Efficient Positional Encodings with Graph Neural Networks	Feb 3, 2025	Graph RegressionGraph Representation Learning	CodeCode Available	1
FSPGD: Rethinking Black-box Attacks on Semantic Segmentation	Feb 3, 2025	Semantic Segmentation	CodeCode Available	1
SimPER: A Minimalist Approach to Preference Alignment without Hyperparameters	Feb 2, 2025		CodeCode Available	1