The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

474,278 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 17351–17400 of 474278 papers

Title	Date	Tasks	Status	Hype
Deepfake-Eval-2024: A Multi-Modal In-the-Wild Benchmark of Deepfakes Circulated in 2024	Mar 4, 2025	DeepFake DetectionFace Swapping	CodeCode Available	1
Unveiling the Potential of Segment Anything Model 2 for RGB-Thermal Semantic Segmentation with Language Guidance	Mar 4, 2025	DecoderSemantic Segmentation	CodeCode Available	1
DQO-MAP: Dual Quadrics Multi-Object mapping with Gaussian Splatting	Mar 4, 2025	Computational EfficiencyCPU	CodeCode Available	1
Generating Novel Brain Morphology by Deforming Learned Templates	Mar 4, 2025	AttributeDecoder	CodeCode Available	1
RACNN: Residual Attention Convolutional Neural Network for Near-Field Channel Estimation in 6G Wireless Communications	Mar 4, 2025		CodeCode Available	1
Q-Filters: Leveraging QK Geometry for Efficient KV Cache Compression	Mar 4, 2025	Text Generation	CodeCode Available	1
Federated nnU-Net for Privacy-Preserving Medical Image Segmentation	Mar 4, 2025	Federated LearningImage Segmentation	CodeCode Available	1
Disentangled Knowledge Tracing for Alleviating Cognitive Bias	Mar 4, 2025	Knowledge Tracing	CodeCode Available	1
Q-Eval-100K: Evaluating Visual Quality and Alignment Level for Text-to-Vision Content	Mar 4, 2025		CodeCode Available	1
Reconciling Stochastic and Deterministic Strategies for Zero-shot Image Restoration using Diffusion Model in Dual	Mar 3, 2025	DenoisingImage Restoration	CodeCode Available	1
SVDC: Consistent Direct Time-of-Flight Video Depth Completion with Frequency Selective Fusion	Mar 3, 2025	Depth Completion	CodeCode Available	1
Linear Representations of Political Perspective Emerge in Large Language Models	Mar 3, 2025		CodeCode Available	1
ToLo: A Two-Stage, Training-Free Layout-To-Image Generation Framework For High-Overlap Layouts	Mar 3, 2025	AttributeImage Generation	CodeCode Available	1
InversionGNN: A Dual Path Network for Multi-Property Molecular Optimization	Mar 3, 2025	Drug DiscoveryGraph Neural Network	CodeCode Available	1
How simple can you go? An off-the-shelf transformer approach to molecular dynamics	Mar 3, 2025		CodeCode Available	1
KoWit-24: A Richly Annotated Dataset of Wordplay in News Headlines	Mar 3, 2025		CodeCode Available	1
MRI super-resolution reconstruction using efficient diffusion probabilistic model with residual shifting	Mar 3, 2025	Computational EfficiencyDenoising	CodeCode Available	1
What do Large Language Models Say About Animals? Investigating Risks of Animal Harm in Generated Text	Mar 3, 2025		CodeCode Available	1
Nature-Inspired Population-Based Evolution of Large Language Models	Mar 3, 2025	GPUZero-shot Generalization	CodeCode Available	1
CrowdSelect: Synthetic Instruction Data Selection with Multi-LLM Wisdom	Mar 3, 2025	Instruction Following	CodeCode Available	1
When Can You Get Away with Low Memory Adam?	Mar 3, 2025		CodeCode Available	1
WeGen: A Unified Model for Interactive Multimodal Generation as We Chat	Mar 3, 2025	multimodal generation	CodeCode Available	1
RSQ: Learning from Important Tokens Leads to Better Quantized LLMs	Mar 3, 2025	Quantization	CodeCode Available	1
From Claims to Evidence: A Unified Framework and Critical Analysis of CNN vs. Transformer vs. Mamba in Medical Image Segmentation	Mar 3, 2025	BenchmarkingComputational Efficiency	CodeCode Available	1
One-Shot Affordance Grounding of Deformable Objects in Egocentric Organizing Scenes	Mar 3, 2025	Deformable Object Manipulation	CodeCode Available	1
Superscopes: Amplifying Internal Feature Representations for Language Model Interpretation	Mar 3, 2025	Language ModelingLanguage Modelling	CodeCode Available	1
m4: A Learned Flow-level Network Simulator	Mar 3, 2025		CodeCode Available	1
Recurrence-Enhanced Vision-and-Language Transformers for Robust Multimodal Document Retrieval	Mar 3, 2025	Cross-Modal RetrievalRetrieval	CodeCode Available	1
AutoAdvExBench: Benchmarking autonomous exploitation of adversarial example defenses	Mar 3, 2025	Benchmarking	CodeCode Available	1
POPGym Arcade: Parallel Pixelated POMDPs	Mar 3, 2025	counterfactualImitation Learning	CodeCode Available	1
Convex Hull-based Algebraic Constraint for Visual Quadric SLAM	Mar 3, 2025	ObjectObject Reconstruction	CodeCode Available	1
One ruler to measure them all: Benchmarking multilingual long-context language models	Mar 3, 2025	8kAll	CodeCode Available	1
MultiAgentBench: Evaluating the Collaboration and Competition of LLM agents	Mar 3, 2025		CodeCode Available	1
Generalized Diffusion Detector: Mining Robust Features from Diffusion Models for Domain-Generalized Detection	Mar 3, 2025	Domain AdaptationDomain Generalization	CodeCode Available	1
Measuring the Validity of Clustering Validation Datasets	Mar 3, 2025	Clustering	CodeCode Available	1
A General Neural Network Potential for Energetic Materials with C, H, N, and O elements	Mar 3, 2025	Transfer Learning	CodeCode Available	1
Trajectory-Class-Aware Multi-Agent Reinforcement Learning	Mar 3, 2025	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
SePer: Measure Retrieval Utility Through The Lens Of Semantic Perplexity Reduction	Mar 3, 2025	RAGRetrieval	CodeCode Available	1
Improve Representation for Imbalanced Regression through Geometric Constraints	Mar 2, 2025	Operator learningregression	CodeCode Available	1
Underdamped Diffusion Bridges with Applications to Sampling	Mar 2, 2025	Numerical Integration	CodeCode Available	1
Extrapolating and Decoupling Image-to-Video Generation Models: Motion Modeling is Easier Than You Think	Mar 2, 2025	DenoisingImage to Video Generation	CodeCode Available	1
Delving into Out-of-Distribution Detection with Medical Vision-Language Models	Mar 2, 2025	Benchmarkingimage-classification	CodeCode Available	1
Molecule Generation for Target Protein Binding with Hierarchical Consistency Diffusion Model	Mar 2, 2025	Drug DesignDrug Discovery	CodeCode Available	1
DEAL: Data-Efficient Adversarial Learning for High-Quality Infrared Imaging	Mar 2, 2025		CodeCode Available	1
DuoDecoding: Hardware-aware Heterogeneous Speculative Decoding with Dynamic Multi-Sequence Drafting	Mar 2, 2025	CPUGPU	CodeCode Available	1
STAR-Edge: Structure-aware Local Spherical Curve Representation for Thin-walled Edge Extraction from Unstructured Point Clouds	Mar 2, 2025	Edge Detection	CodeCode Available	1
GPIoT: Tailoring Small Language Models for IoT Program Synthesis and Development	Mar 2, 2025	Code GenerationProgram Synthesis	CodeCode Available	1
LesionDiffusion: Towards Text-controlled General Lesion Synthesis	Mar 2, 2025		CodeCode Available	1
Dur360BEV: A Real-world 360-degree Single Camera Dataset and Benchmark for Bird-Eye View Mapping in Autonomous Driving	Mar 2, 2025	Autonomous DrivingBEV Segmentation	CodeCode Available	1
ALinFiK: Learning to Approximate Linearized Future Influence Kernel for Scalable Third-Party LLM Data Valuation	Mar 2, 2025	Data Valuation	CodeCode Available	1