The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

474,278 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 16651–16700 of 474278 papers

Title	Date	Tasks	Status	Hype
POLARON: Precision-aware On-device Learning and Adaptive Runtime-cONfigurable AI acceleration	Jun 10, 2025	Quantization	—Unverified	0
Towards Biosignals-Free Autonomous Prosthetic Hand Control via Imitation Learning	Jun 10, 2025	Imitation Learning	—Unverified	0
FreqPolicy: Efficient Flow-based Visuomotor Policy via Frequency Consistency	Jun 10, 2025	Action GenerationImage Generation	—Unverified	0
Segment Concealed Objects with Incomplete Supervision	Jun 10, 2025	Pseudo LabelSegmentation	—Unverified	0
WIP: Large Language Model-Enhanced Smart Tutor for Undergraduate Circuit Analysis	Jun 10, 2025	Language ModelingLanguage Modelling	—Unverified	0
Propositional Logic for Probing Generalization in Neural Networks	Jun 10, 2025	Negation	—Unverified	0
Edit Flows: Flow Matching with Edit Operations	Jun 10, 2025	Code GenerationImage Captioning	—Unverified	0
mSTEB: Massively Multilingual Evaluation of LLMs on Speech and Text Tasks	Jun 10, 2025	Language IdentificationQuestion Answering	—Unverified	0
Wait, We Don't Need to "Wait"! Removing Thinking Tokens Improves Reasoning Efficiency	Jun 10, 2025	Multimodal Reasoning	—Unverified	0
CC-RAG: Structured Multi-Hop Reasoning via Theme-Based Causal Graphs	Jun 10, 2025	Answer GenerationRAG	—Unverified	0
Neighbors and relatives: How do speech embeddings reflect linguistic connections across the world?	Jun 10, 2025	Language Identification	—Unverified	0
Hateful Person or Hateful Model? Investigating the Role of Personas in Hate Speech Detection by Large Language Models	Jun 10, 2025	FairnessHate Speech Detection	—Unverified	0
Advancing STT for Low-Resource Real-World Speech	Jun 10, 2025	SentenceSpeech-to-Text	—Unverified	0
Learning to Reason Across Parallel Samples for LLM Reasoning	Jun 10, 2025	MathRe-Ranking	—Unverified	0
H^2GFM: Towards unifying Homogeneity and Heterogeneity on Text-Attributed Graphs	Jun 10, 2025	Graph Learning	—Unverified	0
Private Evolution Converges	Jun 10, 2025	Synthetic Data Generation	—Unverified	0
A Simple Analysis of Discretization Error in Diffusion Models	Jun 10, 2025	Denoising	—Unverified	0
AlphaFold Database Debiasing for Robust Inverse Folding	Jun 10, 2025	Protein Design	—Unverified	0
FUSE: Measure-Theoretic Compact Fuzzy Set Representation for Taxonomy Expansion	Jun 10, 2025	Representation LearningTaxonomy Expansion	—Unverified	0
Learning to Hear Broken Motors: Signature-Guided Data Augmentation for Induction-Motor Diagnostics	Jun 10, 2025	Data AugmentationDiagnostic	—Unverified	0
Thermodynamically Consistent Latent Dynamics Identification for Parametric Systems	Jun 10, 2025	Active LearningDimensionality Reduction	—Unverified	0
Semi-gradient DICE for Offline Constrained Reinforcement Learning	Jun 10, 2025	Offline RLOff-policy evaluation	—Unverified	0
Filling in the Blanks: Applying Data Imputation in incomplete Water Metering Data	Jun 10, 2025	ImputationManagement	—Unverified	0
Fusing Cross-modal and Uni-modal Representations: A Kronecker Product Approach	Jun 10, 2025	cross-modal alignment	—Unverified	0
When Simple Model Just Works: Is Network Traffic Classification in Crisis?	Jun 10, 2025	Traffic Classification	—Unverified	0
Towards Fair Representation: Clustering and Consensus	Jun 10, 2025	ClusteringFairness	—Unverified	0
Understanding Task Vectors in In-Context Learning: Emergence, Functionality, and Limitations	Jun 10, 2025	In-Context LearningTriplet	—Unverified	0
Model-Free Kernel Conformal Depth Measures Algorithm for Uncertainty Quantification in Regression Models in Separable Hilbert Spaces	Jun 10, 2025	Conformal PredictionPrediction	—Unverified	0
sparseGeoHOPCA: A Geometric Solution to Sparse Higher-Order PCA Without Covariance Estimation	Jun 10, 2025	Computational EfficiencyImage Reconstruction	—Unverified	0
Flexible and Efficient Drift Detection without Labels	Jun 10, 2025	Drift Detection	—Unverified	0
Superposed Parameterised Quantum Circuits	Jun 10, 2025	Quantum Machine Learning	—Unverified	0
DIsoN: Decentralized Isolation Networks for Out-of-Distribution Detection in Medical Imaging	Jun 10, 2025	Binary ClassificationOut-of-Distribution Detection	—Unverified	0
Enhancing Motion Dynamics of Image-to-Video Models via Adaptive Low-Pass Guidance	Jun 10, 2025	Denoising	—Unverified	0
MARMOT: Masked Autoencoder for Modeling Transient Imaging	Jun 10, 2025	Decoder	—Unverified	0
Context-aware TFL: A Universal Context-aware Contrastive Learning Framework for Temporal Forgery Localization	Jun 10, 2025	Anomaly DetectionContrastive Learning	—Unverified	0
Robust Visual Localization via Semantic-Guided Multi-Scale Transformer	Jun 10, 2025	regressionScene Understanding	—Unverified	0
Towards Cross-Subject EMG Pattern Recognition via Dual-Branch Adversarial Feature Disentanglement	Jun 10, 2025	AnatomyDisentanglement	—Unverified	0
Local MDI+: Local Feature Importances for Tree-Based Models	Jun 10, 2025	Computational EfficiencyFeature Importance	—Unverified	0
A PDE-Based Image Dehazing Method via Atmospheric Scattering Theory	Jun 10, 2025	GPUImage Dehazing	—Unverified	0
Enhancing Synthetic CT from CBCT via Multimodal Fusion: A Study on the Impact of CBCT Quality and Alignment	Jun 10, 2025	Computed Tomography (CT)	—Unverified	0
Safe and Economical UAV Trajectory Planning in Low-Altitude Airspace: A Hybrid DRL-LLM Approach with Compliance Awareness	Jun 10, 2025	Collision AvoidanceDeep Reinforcement Learning	—Unverified	0
Can A Gamer Train A Mathematical Reasoning Model?	Jun 10, 2025	GPUMathematical Reasoning	CodeCode Available	0
SPEED-RL: Faster Training of Reasoning Models via Online Curriculum Learning	Jun 10, 2025	Reinforcement Learning (RL)	CodeCode Available	1
SWE-Flow: Synthesizing Software Engineering Data in a Test-Driven Manner	Jun 10, 2025	test driven development	CodeCode Available	1
DEAL: Disentangling Transformer Head Activations for LLM Steering	Jun 10, 2025	Binary ClassificationZero-shot Generalization	—Unverified	0
ALE-Bench: A Benchmark for Long-Horizon Objective-Driven Algorithm Engineering	Jun 10, 2025	Scheduling	CodeCode Available	2
EDINET-Bench: Evaluating LLMs on Complex Financial Tasks using Japanese Financial Statements	Jun 10, 2025	Binary ClassificationFinancial Analysis	CodeCode Available	1
CounselBench: A Large-Scale Expert Evaluation and Adversarial Benchmark of Large Language Models in Mental Health Counseling	Jun 10, 2025	Benchmarking	CodeCode Available	1
Consistent Paths Lead to Truth: Self-Rewarding Reinforcement Learning for LLM Reasoning	Jun 10, 2025	Large Language Modelreinforcement-learning	CodeCode Available	1
syren-baryon: Analytic emulators for the impact of baryons on the matter power spectrum	Jun 10, 2025	Symbolic Regression	CodeCode Available	1