The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

474,278 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 16851–16900 of 474278 papers

Title	Date	Tasks	Status	Hype
Detecting Harmful Memes with Decoupled Understanding and Guided CoT Reasoning	Jun 10, 2025	Meme Classification	CodeCode Available	0
Princeton365: A Diverse Dataset with Accurate Camera Pose	Jun 10, 2025	Camera Pose EstimationNovel View Synthesis	CodeCode Available	1
Flow Diverse and Efficient: Learning Momentum Flow Matching via Stochastic Velocity Field Sampling	Jun 10, 2025	Diversity	CodeCode Available	0
FEDTAIL: Federated Long-Tailed Domain Generalization with Sharpness-Guided Gradient Matching	Jun 10, 2025	Domain Generalization	CodeCode Available	0
Transforming Expert Knowledge into Scalable Ontology via Large Language Models	Jun 10, 2025	Prompt Engineering	—Unverified	0
Mic-hackathon 2024: Hackathon on Machine Learning for Electron and Scanning Probe Microscopy	Jun 10, 2025		CodeCode Available	0
Low-resource domain adaptation while minimizing energy and hardware resource consumption	Jun 10, 2025	Domain Adaptation	—Unverified	0
TACTIC: Translation Agents with Cognitive-Theoretic Interactive Collaboration	Jun 10, 2025	Machine TranslationTranslation	CodeCode Available	1
Diversity-Guided MLP Reduction for Efficient Large Vision Transformers	Jun 10, 2025	Diversity	CodeCode Available	1
Vuyko Mistral: Adapting LLMs for Low-Resource Dialectal Translation	Jun 9, 2025		CodeCode Available	0
KokushiMD-10: Benchmark for Evaluating Large Language Models on Ten Japanese National Healthcare Licensing Examinations	Jun 9, 2025	Multimodal ReasoningVisual Reasoning	—Unverified	0
SEED: Enhancing Text-to-SQL Performance and Practical Usability Through Automatic Evidence Generation	Jun 9, 2025	Natural Language QueriesText to SQL	CodeCode Available	1
Automatic Depression Assessment using Machine Learning: A Comprehensive Survey	Jun 9, 2025	Survey	—Unverified	0
Variational Supervised Contrastive Learning	Jun 9, 2025	Contrastive LearningFew-Shot Learning	—Unverified	0
Segment Any Architectural Facades (SAAF):An automatic segmentation model for building facades, walls and windows based on multimodal semantics guidance	Jun 9, 2025	Image SegmentationSegmentation	—Unverified	0
DEBATE: A Dataset for Disentangling Textual Ambiguity in Mandarin Through Speech	Jun 9, 2025		CodeCode Available	0
C3S3: Complementary Competition and Contrastive Selection for Semi-Supervised Medical Image Segmentation	Jun 9, 2025	Contrastive LearningDiagnostic	CodeCode Available	1
HAELT: A Hybrid Attentive Ensemble Learning Transformer Framework for High-Frequency Stock Price Forecasting	Jun 9, 2025	Algorithmic TradingEnsemble Learning	—Unverified	0
Benchmarking Foundation Speech and Language Models for Alzheimer's Disease and Related Dementia Detection from Spontaneous Speech	Jun 9, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Knowledge Compression via Question Generation: Enhancing Multihop Document Retrieval without Fine-tuning	Jun 9, 2025	ChunkingQuestion Generation	—Unverified	0
WebUIBench: A Comprehensive Benchmark for Evaluating Multimodal Large Language Models in WebUI-to-Code	Jun 9, 2025		CodeCode Available	0
A Hybrid GA LLM Framework for Structured Task Optimization	Jun 9, 2025	global-optimizationLanguage Modeling	CodeCode Available	0
Recommendations and Reporting Checklist for Rigorous & Transparent Human Baselines in Model Evaluations	Jun 9, 2025		CodeCode Available	0
Hidden Bias in the Machine: Stereotypes in Text-to-Image Models	Jun 9, 2025	FairnessImage Retrieval	—Unverified	0
Double Low-Rank 4D Tensor Decomposition for Circular RIS-Aided mmWave MIMO-NOMA System Channel Estimation in Mobility Scenarios	Jun 9, 2025	Integrated sensing and communicationISAC	—Unverified	0
Computation Capacity Maximization for Pinching Antennas-Assisted Wireless Powered MEC Systems	Jun 9, 2025	Edge-computing	—Unverified	0
Multipath Component-Enhanced Signal Processing for Integrated Sensing and Communication Systems	Jun 9, 2025	Integrated sensing and communicationISAC	—Unverified	0
Stability of Mean-Field Variational Inference	Jun 9, 2025	Bayesian InferenceVariational Inference	—Unverified	0
Automating Exploratory Multiomics Research via Language Models	Jun 9, 2025	Navigate	—Unverified	0
Refusal-Feature-guided Teacher for Safe Finetuning via Data Filtering and Alignment Distillation	Jun 9, 2025	Safety Alignment	—Unverified	0
The Catechol Benchmark: Time-series Solvent Selection Data for Few-shot Machine Learning	Jun 9, 2025	Active LearningBenchmarking	CodeCode Available	0
Heavy Lasso: sparse penalized regression under heavy-tailed noise via data-augmented soft-thresholding	Jun 9, 2025	Data Augmentation	CodeCode Available	0
Robust Transceiver Design for RIS Enhanced Dual-Functional Radar-Communication with Movable Antenna	Jun 9, 2025	LEMMA	—Unverified	0
Diffusion Sequence Models for Enhanced Protein Representation and Generation	Jun 9, 2025	Language ModelingLanguage Modelling	CodeCode Available	1
Conditional Local Independence Testing with Application to Dynamic Causal Discovery	Jun 9, 2025	Causal Discovery	—Unverified	0
CommSense: A Rapid and Accurate ISAC Paradigm	Jun 9, 2025	Integrated sensing and communicationISAC	—Unverified	0
Real-Time Execution of Action Chunking Flow Policies	Jun 9, 2025	ChunkingVision-Language-Action	CodeCode Available	3
Prompt to Protection: A Comparative Study of Multimodal LLMs in Construction Hazard Recognition	Jun 9, 2025	Prompt Engineering	—Unverified	0
SILK: Smooth InterpoLation frameworK for motion in-betweening A Simplified Computational Approach	Jun 9, 2025	motion in-betweeningMotion Interpolation	—Unverified	0
When Style Breaks Safety: Defending Language Models Against Superficial Style Alignment	Jun 9, 2025		CodeCode Available	0
STREAMINGGS: Voxel-Based Streaming 3D Gaussian Splatting with Memory Optimization and Architectural Support	Jun 9, 2025	3DGS	—Unverified	0
Towards a Small Language Model Lifecycle Framework	Jun 9, 2025	Language ModelingLanguage Modelling	—Unverified	0
SoK: Data Reconstruction Attacks Against Machine Learning Models: Definition, Metrics, and Benchmark	Jun 9, 2025	DiversityMemorization	—Unverified	0
Are Trees Really Green? A Detection Approach of IoT Malware Attacks	Jun 9, 2025	Intrusion DetectionPrivacy Preserving	—Unverified	0
HyColor: An Efficient Heuristic Algorithm for Graph Coloring	Jun 9, 2025	Combinatorial OptimizationComputational Efficiency	—Unverified	0
Diffusion of Responsibility in Collective Decision Making	Jun 9, 2025	Decision Making	—Unverified	0
Mind the Gap: Removing the Discretization Gap in Differentiable Logic Gate Networks	Jun 9, 2025	image-classificationImage Classification	—Unverified	0
Hierarchical Scoring with 3D Gaussian Splatting for Instance Image-Goal Navigation	Jun 9, 2025	3DGSNavigate	—Unverified	0
Speaker-Distinguishable CTC: Learning Speaker Distinction Using CTC for Multi-Talker Speech Recognition	Jun 9, 2025	Automatic Speech RecognitionMulti-Task Learning	—Unverified	0
Slow and Fast Neurons Cooperate in Contextual Working Memory through Timescale Diversity	Jun 9, 2025	Diversity	—Unverified	0