The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

474,278 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 12301–12350 of 474278 papers

Title	Date	Tasks	Status	Hype
Is This Just Fantasy? Language Model Representations Reflect Human Judgments of Event Plausibility	Jul 16, 2025	Language ModelingLanguage Modelling	—Unverified	0
Vision-based Perception for Autonomous Vehicles in Obstacle Avoidance Scenarios	Jul 16, 2025	Autonomous NavigationAutonomous Vehicles	—Unverified	0
BRUM: Robust 3D Vehicle Reconstruction from 360 Sparse Images	Jul 16, 2025	3D ReconstructionCamera Pose Estimation	—Unverified	0
Dark-EvGS: Event Camera as an Eye for Radiance Field in the Dark	Jul 16, 2025	Triplet	—Unverified	0
Towards Autonomous Riding: A Review of Perception, Planning, and Control in Intelligent Two-Wheelers	Jul 16, 2025	Autonomous Driving	—Unverified	0
Context-Aware Search and Retrieval Over Erasure Channels	Jul 16, 2025	DecoderRetrieval	—Unverified	0
A Survey of Deep Learning for Geometry Problem Solving	Jul 16, 2025	Deep LearningGeometry Problem Solving	CodeCode Available	0
Analytic estimation of parameters of stochastic volatility diffusion models with exponential-affine characteristic function for currency option pricing	Jul 16, 2025	parameter estimation	CodeCode Available	0
Distributional Reinforcement Learning on Path-dependent Options	Jul 16, 2025	Distributional Reinforcement Learningreinforcement-learning	—Unverified	0
Self-Adaptive and Robust Federated Spectrum Sensing without Benign Majority for Cellular Networks	Jul 16, 2025	Data PoisoningFederated Learning	—Unverified	0
Site-Level Fine-Tuning with Progressive Layer Freezing: Towards Robust Prediction of Bronchopulmonary Dysplasia from Day-1 Chest Radiographs in Extremely Preterm Infants	Jul 16, 2025	Federated LearningPrognosis	—Unverified	0
FADE: Adversarial Concept Erasure in Flow Models	Jul 16, 2025	FairnessImage Generation	—Unverified	0
Language-Guided Contrastive Audio-Visual Masked Autoencoder with Automatically Generated Audio-Visual-Text Triplets from Videos	Jul 16, 2025	Image CaptioningRepresentation Learning	—Unverified	0
MERA Code: A Unified Framework for Evaluating Code Generation Across Tasks	Jul 16, 2025	Code Generation	—Unverified	0
Trustworthy Tree-based Machine Learning by MoS_2 Flash-based Analog CAM with Inherent Soft Boundaries	Jul 16, 2025	Diagnostic	—Unverified	0
Distributed Resilient State Estimation and Control with Strategically Implemented Security Measures	Jul 16, 2025	State Estimation	—Unverified	0
SEPose: A Synthetic Event-based Human Pose Estimation Dataset for Pedestrian Monitoring	Jul 16, 2025	Multi-Person Pose EstimationPose Estimation	—Unverified	0
Novel Approach to Dual-Channel Estimation in Integrated Sensing and Communications for 6G	Jul 16, 2025	Integrated sensing and communicationISAC	—Unverified	0
Xiangqi-R1: Enhancing Spatial Strategic Reasoning in LLMs for Chinese Chess via Reinforcement Learning	Jul 16, 2025	Board Games	—Unverified	0
Kevin: Multi-Turn RL for Generating CUDA Kernels	Jul 16, 2025	GPUReinforcement Learning (RL)	—Unverified	0
Looking for Fairness in Recommender Systems	Jul 16, 2025	FairnessRecommendation Systems	—Unverified	0
FORTRESS: Function-composition Optimized Real-Time Resilient Structural Segmentation via Kolmogorov-Arnold Enhanced Spatial Attention Networks	Jul 16, 2025	Computational EfficiencySegmentation	CodeCode Available	0
Imbalanced Regression Pipeline Recommendation	Jul 16, 2025	AutoMLMeta-Learning	CodeCode Available	0
PROL : Rehearsal Free Continual Learning in Streaming Data via Prompt Online Learning	Jul 16, 2025	Continual LearningGeneral Knowledge	CodeCode Available	0
CLID-MU: Cross-Layer Information Divergence Based Meta Update Strategy for Learning with Noisy Labels	Jul 16, 2025	Learning with noisy labelsMeta-Learning	CodeCode Available	0
Unsupervised Part Discovery via Descriptor-Based Masked Image Restoration with Optimized Constraints	Jul 16, 2025	Image RestorationUnsupervised Part Discovery	CodeCode Available	0
InstructFLIP: Exploring Unified Vision-Language Model for Face Anti-spoofing	Jul 16, 2025	Domain GeneralizationFace Anti-Spoofing	CodeCode Available	1
Integrated Switched Capacitor Array and Synchronous Charge Extraction with Adaptive Hybrid MPPT for Piezoelectric Harvesters	Jul 16, 2025	Point Tracking	—Unverified	0
AFPM: Alignment-based Frame Patch Modeling for Cross-Dataset EEG Decoding	Jul 16, 2025	EEGEeg Decoding	—Unverified	0
Similarity-Guided Diffusion for Contrastive Sequential Recommendation	Jul 16, 2025	Contrastive LearningData Augmentation	—Unverified	0
MGFFD-VLM: Multi-Granularity Prompt Learning for Face Forgery Detection with VLM	Jul 16, 2025	AttributeFace Swapping	—Unverified	0
RegCL: Continual Adaptation of Segment Anything Model via Model Merging	Jul 16, 2025	Continual Learningmodel	—Unverified	0
SAMST: A Transformer framework based on SAM pseudo label filtering for remote sensing semi-supervised semantic segmentation	Jul 16, 2025	Boundary DetectionPseudo Label	—Unverified	0
A Fuzzy Approach to Project Success: Measuring What Matters	Jul 16, 2025		CodeCode Available	0
MindJourney: Test-Time Scaling with World Models for Spatial Reasoning	Jul 16, 2025	Spatial Reasoning	—Unverified	0
Catching Bid-rigging Cartels with Graph Attention Neural Networks	Jul 16, 2025	Graph AttentionGraph Neural Network	—Unverified	0
Developing Visual Augmented Q&A System using Scalable Vision Embedding Retrieval & Late Interaction Re-ranker	Jul 16, 2025	RAGRetrieval	CodeCode Available	0
DAC: A Dynamic Attention-aware Approach for Task-Agnostic Prompt Compression	Jul 16, 2025	GSM8K	CodeCode Available	0
Efficient Calisthenics Skills Classification through Foreground Instance Selection and Depth Estimation	Jul 16, 2025	ClassificationDepth Estimation	CodeCode Available	0
Simplifications are Absolutists: How Simplified Language Reduces Word Sense Awareness in LLM-Generated Definitions	Jul 16, 2025		CodeCode Available	0
DVFL-Net: A Lightweight Distilled Video Focal Modulation Network for Spatio-Temporal Action Recognition	Jul 16, 2025	BenchmarkingKnowledge Distillation	CodeCode Available	0
Arctic Inference with Shift Parallelism: Fast and Efficient Open Source Inference System for Enterprise AI	Jul 16, 2025	GPU	CodeCode Available	3
Best Practices for Large-Scale, Pixel-Wise Crop Mapping and Transfer Learning Workflows	Jul 16, 2025	Transfer Learning	CodeCode Available	0
Watch, Listen, Understand, Mislead: Tri-modal Adversarial Attacks on Short Videos for Content Appropriateness Evaluation	Jul 16, 2025		—Unverified	0
Learning What Matters: Probabilistic Task Selection via Mutual Information for Model Finetuning	Jul 16, 2025	DiversityMMLU	—Unverified	0
Choosing the Better Bandit Algorithm under Data Sharing: When Do A/B Experiments Work?	Jul 16, 2025		CodeCode Available	0
SpatialTrackerV2: 3D Point Tracking Made Easy	Jul 16, 2025	3D ReconstructionCamera Pose Estimation	CodeCode Available	4
Assay2Mol: large language model-based drug design using BioAssay context	Jul 16, 2025	DescriptiveDrug Design	CodeCode Available	0
Describe Anything Model for Visual Question Answering on Text-rich Images	Jul 16, 2025	DescriptiveLanguage Modeling	CodeCode Available	1
PhysX: Physical-Grounded 3D Asset Generation	Jul 16, 2025	3D GenerationImage to 3D	CodeCode Available	3