The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

474,278 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 13851–13900 of 474278 papers

Title	Date	Tasks	Status	Hype
Response Quality Assessment for Retrieval-Augmented Generation via Conditional Conformal Factuality	Jun 26, 2025	Conformal PredictionQuestion Answering	CodeCode Available	0
Boosting Generative Adversarial Transferability with Self-supervised Vision Transformer Features	Jun 26, 2025	Contrastive LearningSelf-Supervised Learning	CodeCode Available	0
DBConformer: Dual-Branch Convolutional Transformer for EEG Decoding	Jun 26, 2025	EEGEeg Decoding	CodeCode Available	2
Curve-Aware Gaussian Splatting for 3D Parametric Curve Reconstruction	Jun 26, 2025	Point cloud reconstruction	CodeCode Available	2
CovDocker: Benchmarking Covalent Drug Design with Tasks, Datasets, and Solutions	Jun 26, 2025	BenchmarkingDrug Design	CodeCode Available	1
How Good Are Synthetic Requirements ? Evaluating LLM-Generated Datasets for AI4RE	Jun 26, 2025	Defect DetectionDiversity	CodeCode Available	0
Learning to Skip the Middle Layers of Transformers	Jun 26, 2025	Mixture-of-Experts	CodeCode Available	1
Patch2Loc: Learning to Localize Patches for Unsupervised Brain Lesion Detection	Jun 25, 2025		CodeCode Available	0
Recursive KalmanNet: Analyse des capacités de généralisation d'un réseau de neurones récurrent guidé par un filtre de Kalman	Jun 25, 2025		CodeCode Available	1
FOCUS: Internal MLLM Representations for Efficient Fine-Grained Visual Question Answering	Jun 25, 2025	Question AnsweringVisual Question Answering	—Unverified	0
IRanker: Towards Ranking Foundation Model	Jun 25, 2025	GSM8Kmodel	CodeCode Available	1
AUTOMATIC ROOM LIGHT CONTROLLER MANAGEMENT SYSTEM.	Jun 25, 2025	4kCPU	—Unverified	0
Visual-Semantic Knowledge Conflicts in Operating Rooms: Synthetic Data Curation for Surgical Risk Perception in Multimodal Large Language Models	Jun 25, 2025	Specificity	CodeCode Available	0
Omniwise: Predicting GPU Kernels Performance with LLMs	Jun 25, 2025	GPU	—Unverified	0
Multi-lingual Functional Evaluation for Large Language Models	Jun 25, 2025	BelebeleInstruction Following	—Unverified	0
Multiple Streams of Relation Extraction: Enriching and Recalling in Transformers	Jun 25, 2025	RelationRelation Extraction	—Unverified	0
Divide, Specialize, and Route: A New Approach to Efficient Ensemble Learning	Jun 25, 2025	Binary ClassificationComputational Efficiency	—Unverified	0
VOICE CONTROL ROBOT USING ARDUINO MANAGEMENT SYSTEM PROJECT.	Jun 25, 2025	Managementspeech-recognition	—Unverified	0
Towards Probabilistic Question Answering Over Tabular Data	Jun 25, 2025	Natural Language QueriesQuestion Answering	—Unverified	0
Stochastic Parameter Decomposition	Jun 25, 2025		CodeCode Available	2
On Context-Content Uncertainty Principle	Jun 25, 2025	Specificity	—Unverified	0
Uncovering Hidden Violent Tendencies in LLMs: A Demographic Analysis via Behavioral Vignettes	Jun 25, 2025	Text Generation	—Unverified	0
Decide less, communicate more: On the construct validity of end-to-end fact-checking in medicine	Jun 25, 2025	Fact CheckingNavigate	CodeCode Available	0
On the Necessity of Output Distribution Reweighting for Effective Class Unlearning	Jun 25, 2025	Machine Unlearning	—Unverified	0
SEZ-HARN: Self-Explainable Zero-shot Human Activity Recognition Network	Jun 25, 2025	Activity RecognitionHuman Activity Recognition	CodeCode Available	0
E-ABIN: an Explainable module for Anomaly detection in BIological Networks	Jun 25, 2025	Anomaly Detection	CodeCode Available	0
Demystifying Distributed Training of Graph Neural Networks for Link Prediction	Jun 25, 2025	graph partitioningLink Prediction	CodeCode Available	0
Learning-Based Resource Management in Integrated Sensing and Communication Systems	Jun 25, 2025	Deep Reinforcement LearningIntegrated sensing and communication	—Unverified	0
FR-CapsNet: Enhancing Low-Resolution Image Classification via Frequency Routed Capsules	Jun 25, 2025	image-classificationImage Classification	CodeCode Available	0
Integrating Pharmacokinetics and Pharmacodynamics Modeling with Quantum Regression for Predicting Herbal Compound Toxicity	Jun 25, 2025	regression	—Unverified	0
Multi-Objective Reinforcement Learning for Cognitive Radar Resource Management	Jun 25, 2025	Deep Reinforcement LearningManagement	—Unverified	0
Predicting Readiness to Engage in Psychotherapy of People with Chronic Pain Based on their Pain-Related Narratives Saar	Jun 25, 2025	Large Language ModelSensitivity	—Unverified	0
Diffusion Tree Sampling: Scalable inference-time alignment of diffusion models	Jun 25, 2025	Image GenerationText to Image Generation	—Unverified	0
AI-Driven MRI-based Brain Tumour Segmentation Benchmarking	Jun 25, 2025	BenchmarkingImage Segmentation	—Unverified	0
Enhancing Ambiguous Dynamic Facial Expression Recognition with Soft Label-based Data Augmentation	Jun 25, 2025	Data AugmentationDynamic Facial Expression Recognition	—Unverified	0
THIRDEYE: Cue-Aware Monocular Depth Estimation via Brain-Inspired Multi-Stage Fusion	Jun 25, 2025	Depth EstimationMonocular Depth Estimation	—Unverified	0
MultiHuman-Testbench: Benchmarking Image Generation for Multiple Humans	Jun 25, 2025	Action DetectionBenchmarking	—Unverified	0
MAGPIE: A dataset for Multi-AGent contextual PrIvacy Evaluation	Jun 25, 2025	Scheduling	—Unverified	0
inMOTIFin: a lightweight end-to-end simulation software for regulatory sequences	Jun 25, 2025	Benchmarking	CodeCode Available	0
Revisiting CHAMPAGNE: Sparse Bayesian Learning as Reweighted Sparse Coding	Jun 25, 2025	Computational Efficiency	—Unverified	0
Brains and language models converge on a shared conceptual space across different languages	Jun 25, 2025		CodeCode Available	0
Differential Transformer-driven 6G Physical Layer for Collaborative Perception Enhancement	Jun 25, 2025	Autonomous DrivingAutonomous Vehicles	—Unverified	0
FixCLR: Negative-Class Contrastive Learning for Semi-Supervised Domain Generalization	Jun 25, 2025	BenchmarkingContrastive Learning	—Unverified	0
Dynamic Context-Aware Prompt Recommendation for Domain-Specific AI Applications	Jun 25, 2025	Few-Shot Learning	—Unverified	0
Joint Quantization and Pruning Neural Networks Approach: A Case Study on FSO Receivers	Jun 25, 2025	Quantization	—Unverified	0
scMamba: A Scalable Foundation Model for Single-Cell Multi-Omics Integration Beyond Highly Variable Feature Selection	Jun 25, 2025	BenchmarkingContrastive Learning	—Unverified	0
Evaluating PDE discovery methods for multiscale modeling of biological signals	Jun 25, 2025	Equation Discovery	—Unverified	0
Empirical estimator of diversification quotient	Jun 25, 2025	Decision MakingPortfolio Optimization	—Unverified	0
Towards Two-Stage Counterfactual Learning to Rank	Jun 25, 2025	counterfactualLearning-To-Rank	—Unverified	0
StereoDiff: Stereo-Diffusion Synergy for Video Depth Estimation	Jun 25, 2025	Depth EstimationStereo Matching	—Unverified	0