The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3051–3075 of 661570 papers

Title	Date	Tasks	Status	Hype
An Evolved Universal Transformer Memory	Oct 17, 2024		CodeCode Available	3
FiTv2: Scalable and Improved Flexible Vision Transformer for Diffusion Model	Oct 17, 2024	Computational EfficiencyImage Cropping	CodeCode Available	3
Automatically Interpreting Millions of Features in Large Language Models	Oct 17, 2024	Semantic SimilaritySemantic Textual Similarity	CodeCode Available	3
3DIS: Depth-Driven Decoupled Instance Synthesis for Text-to-Image Generation	Oct 16, 2024	AttributeImage Generation	CodeCode Available	3
Meta-Chunking: Learning Text Segmentation and Semantic Completion via Logical Perception	Oct 16, 2024	Binary ClassificationChunking	CodeCode Available	3
The Curse of Multi-Modalities: Evaluating Hallucinations of Large Multimodal Models across Language, Visual, and Audio	Oct 16, 2024	Hallucination	CodeCode Available	3
PRefLexOR: Preference-based Recursive Language Modeling for Exploratory Optimization of Reasoning and Agentic Thinking	Oct 16, 2024	Language ModelingLanguage Modelling	CodeCode Available	3
MMed-RAG: Versatile Multimodal RAG System for Medical Vision Language Models	Oct 16, 2024	DiagnosticHallucination	CodeCode Available	3
Graph-constrained Reasoning: Faithful Reasoning on Knowledge Graphs with Large Language Models	Oct 16, 2024	HallucinationKnowledge Graphs	CodeCode Available	3
Learning Smooth Humanoid Locomotion through Lipschitz-Constrained Policies	Oct 15, 2024		CodeCode Available	3
Latent Action Pretraining from Videos	Oct 15, 2024	QuantizationRobot Manipulation	CodeCode Available	3
UniMatch V2: Pushing the Limit of Semi-Supervised Semantic Segmentation	Oct 14, 2024	Semantic SegmentationSemi-supervised Change Detection	CodeCode Available	3
LoLCATs: On Low-Rank Linearizing of Large Language Models	Oct 14, 2024	MMLU	CodeCode Available	3
Predicting from Strings: Language Model Embeddings for Bayesian Optimization	Oct 14, 2024	Bayesian OptimizationExperimental Design	CodeCode Available	3
GIFT-Eval: A Benchmark For General Time Series Forecasting Model Evaluation	Oct 14, 2024	Time SeriesTime Series Forecasting	CodeCode Available	3
LongMemEval: Benchmarking Chat Assistants on Long-Term Interactive Memory	Oct 14, 2024	BenchmarkingLarge Language Model	CodeCode Available	3
Large-Scale 3D Medical Image Pre-training with Geometric Context Priors	Oct 13, 2024	Contrastive LearningMedical Image Analysis	CodeCode Available	3
CtrLoRA: An Extensible and Efficient Framework for Controllable Image Generation	Oct 12, 2024	Conditional Image GenerationGPU	CodeCode Available	3
MMAD: The First-Ever Comprehensive Benchmark for Multimodal Large Language Models in Industrial Anomaly Detection	Oct 12, 2024	Anomaly Detection	CodeCode Available	3
C-Adapter: Adapting Deep Classifiers for Efficient Conformal Prediction Sets	Oct 12, 2024	Conformal PredictionPrediction	CodeCode Available	3
FlatQuant: Flatness Matters for LLM Quantization	Oct 12, 2024	Quantization	CodeCode Available	3
SceneCraft: Layout-Guided 3D Scene Generation	Oct 11, 2024	3D GenerationImage Generation	CodeCode Available	3
Baichuan-Omni Technical Report	Oct 11, 2024	Language ModelingLanguage Modelling	CodeCode Available	3
Meissonic: Revitalizing Masked Generative Transformers for Efficient High-Resolution Text-to-Image Synthesis	Oct 10, 2024	Feature CompressionImage Generation	CodeCode Available	3
Parameter-Efficient Fine-Tuning in Spectral Domain for Point Cloud Learning	Oct 10, 2024	3D Parameter-Efficient Fine-Tuning for Classification3D Point Cloud Classification	CodeCode Available	3