The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

474,278 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 19651–19700 of 474278 papers

Title	Date	Tasks	Status	Hype
MetaKG: Meta-learning on Knowledge Graph for Cold-start Recommendation	Feb 8, 2022	Meta-Learning	CodeCode Available	1
Can Compressed LLMs Truly Act? An Empirical Evaluation of Agentic Capabilities in LLM Compression	May 26, 2025	Language ModelingLanguage Modelling	CodeCode Available	1
Evaluating GPT-4's Vision Capabilities on Brazilian University Admission Exams	Nov 23, 2023		CodeCode Available	1
GenTKG: Generative Forecasting on Temporal Knowledge Graph with Large Language Models	Oct 11, 2023	RetrievalRetrieval-augmented Generation	CodeCode Available	1
MonoUNI: A Unified Vehicle and Infrastructure-side Monocular 3D Object Detection Network with Sufficient Depth Clues	Sep 21, 2023	3D Object DetectionAutonomous Driving	CodeCode Available	1
Deconstructing the Inductive Biases of Hamiltonian Neural Networks	Feb 10, 2022	MuJoCo	CodeCode Available	1
Improving Visual Grounding by Encouraging Consistent Gradient-based Explanations	Jun 30, 2022	Language ModelingLanguage Modelling	CodeCode Available	1
Classifying Sequences of Extreme Length with Constant Memory Applied to Malware Detection	Dec 17, 2020	Malware DetectionTime Series	CodeCode Available	1
CoProNN: Concept-based Prototypical Nearest Neighbors for Explaining Vision Models	Apr 23, 2024	image-classificationImage Classification	CodeCode Available	1
Stable and Safe Human-aligned Reinforcement Learning through Neural Ordinary Differential Equations	Jan 23, 2024	Reinforcement Learning (RL)Safe Reinforcement Learning	CodeCode Available	1
Counterfactual Token Generation in Large Language Models	Sep 25, 2024	Bias Detectioncounterfactual	CodeCode Available	1
Distilling Autoregressive Models to Obtain High-Performance Non-Autoregressive Solvers for Vehicle Routing Problems with Faster Inference Speed	Dec 19, 2023	Knowledge Distillation	CodeCode Available	1
Neuron Activation Coverage: Rethinking Out-of-distribution Detection and Generalization	Jun 5, 2023	Out-of-Distribution Detection	CodeCode Available	1
DeFIX: Detecting and Fixing Failure Scenarios with Reinforcement Learning in Imitation Learning Based Autonomous Driving	Oct 29, 2022	Autonomous DrivingCARLA MAP Leaderboard	CodeCode Available	1
GLObal Building heights for Urban Studies (UT-GLOBUS) for city- and street- scale urban simulations: Development and first applications	May 24, 2022		CodeCode Available	1
Compositional Exemplars for In-context Learning	Feb 11, 2023	Code GenerationContrastive Learning	CodeCode Available	1
Decentralized Social Navigation with Non-Cooperative Robots via Bi-Level Optimization	Jun 15, 2023	Collision AvoidanceMulti-agent Reinforcement Learning	CodeCode Available	1
ML-Dev-Bench: Comparative Analysis of AI Agents on ML development workflows	Feb 3, 2025		CodeCode Available	1
The Sound of Water: Inferring Physical Properties from Pouring Liquids	Nov 18, 2024	Physical Attribute Prediction	CodeCode Available	1
Progressive End-to-End Object Detection in Crowded Scenes	Mar 15, 2022	Objectobject-detection	CodeCode Available	1
Manga109Dialog: A Large-scale Dialogue Dataset for Comics Speaker Detection	Jun 30, 2023	Graph GenerationScene Graph Generation	CodeCode Available	1
eclingo: A solver for Epistemic Logic Programs	Aug 5, 2020		CodeCode Available	1
SimROD: A Simple Baseline for Raw Object Detection with Global and Local Enhancements	Mar 10, 2025	Objectobject-detection	CodeCode Available	1
PandaSkill -- Player Performance and Skill Rating in Esports: Application to League of Legends	Jan 17, 2025		CodeCode Available	1
Jaccard Metric Losses: Optimizing the Jaccard Index with Soft Labels	Feb 11, 2023	Knowledge DistillationSemantic Segmentation	CodeCode Available	1
Universal NER: A Gold-Standard Multilingual Named Entity Recognition Benchmark	Nov 15, 2023	Cross-Lingual NERMultilingual Named Entity Recognition	CodeCode Available	1
Triad: A Framework Leveraging a Multi-Role LLM-based Agent to Solve Knowledge Base Question Answering	Feb 22, 2024	Knowledge Base Question AnsweringQuestion Answering	CodeCode Available	1
When to Learn What: Model-Adaptive Data Augmentation Curriculum	Sep 9, 2023	Data AugmentationFairness	CodeCode Available	1
Robust Object Detection in Remote Sensing Imagery with Noisy and Sparse Geo-Annotations (Full Version)	Oct 24, 2022	Objectobject-detection	CodeCode Available	1
Hyperbolic Random Forests	Aug 25, 2023		CodeCode Available	1
Revisiting and Improving Scoring Fusion for Spoofing-aware Speaker Verification Using Compositional Data Analysis	Jun 16, 2024	Speaker Verification	CodeCode Available	1
Is ChatGPT Fair for Recommendation? Evaluating Fairness in Large Language Model Recommendation	May 12, 2023	FairnessLanguage Modeling	CodeCode Available	1
DuplexMamba: Enhancing Real-time Speech Conversations with Duplex and Streaming Capabilities	Feb 16, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
Complementary Pseudo Multimodal Feature for Point Cloud Anomaly Detection	Mar 23, 2023	3D Anomaly Detection and SegmentationAnomaly Detection	CodeCode Available	1
ViTAE: Vision Transformer Advanced by Exploring Intrinsic Inductive Bias	Jun 7, 2021	Image ClassificationInductive Bias	CodeCode Available	1
A Bi-directional Transformer for Musical Chord Recognition	Jul 5, 2019	Chord RecognitionDescriptive	CodeCode Available	1
SQLFixAgent: Towards Semantic-Accurate Text-to-SQL Parsing via Consistency-Enhanced Multi-Agent Collaboration	Jun 19, 2024	SQL ParsingText to SQL	CodeCode Available	1
Fingerspelling recognition in the wild with iterative visual attention	Aug 28, 2019	Hand DetectionSegmentation	CodeCode Available	1
An Unsupervised Framework for Comparing Graph Embeddings	May 29, 2019	Graph Embedding	CodeCode Available	1
Generating Diverse High-Fidelity Images with VQ-VAE-2	Jun 2, 2019	DecoderDiversity	CodeCode Available	1
U-Net vs Transformer: Is U-Net Outdated in Medical Image Registration?	Aug 7, 2022	Image RegistrationLong-range modeling	CodeCode Available	1
Point-DAE: Denoising Autoencoders for Self-supervised Point Cloud Learning	Nov 13, 2022	3D Object DetectionDecoder	CodeCode Available	1
MCF: Mutual Correction Framework for Semi-Supervised Medical Image Segmentation	Jan 1, 2023	Image SegmentationMedical Image Segmentation	CodeCode Available	1
Enabling Mixed Effects Neural Networks for Diverse, Clustered Data Using Monte Carlo Methods	Jul 1, 2024	ClusteringMulti-class Classification	CodeCode Available	1
MVREC: A General Few-shot Defect Classification Model Using Multi-View Region-Context	Dec 22, 2024	ClassificationFew-Shot Instance Classification	CodeCode Available	1
Diffusion-Driven Data Replay: A Novel Approach to Combat Forgetting in Federated Class Continual Learning	Sep 2, 2024	Continual LearningContrastive Learning	CodeCode Available	1
Multi-label Node Classification On Graph-Structured Data	Apr 20, 2023	ClassificationMulti-class Classification	CodeCode Available	1
WDC Products: A Multi-Dimensional Entity Matching Benchmark	Jan 23, 2023	Contrastive LearningData Integration	CodeCode Available	1
DQ-BART: Efficient Sequence-to-Sequence Model via Joint Distillation and Quantization	Mar 21, 2022	Knowledge DistillationModel Compression	CodeCode Available	1
Learning Neural Volumetric Field for Point Cloud Geometry Compression	Dec 11, 2022		CodeCode Available	1