The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

474,278 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 19301–19350 of 474278 papers

Title	Date	Tasks	Status	Hype
MSDA: Combining Pseudo-labeling and Self-Supervision for Unsupervised Domain Adaptation in ASR	May 30, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Dynamic Context-Aware Streaming Pretrained Language Model For Inverse Text Normalization	May 30, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Improving Multilingual Speech Models on ML-SUPERB 2.0: Fine-tuning with Data Augmentation and LID-Aware CTC	May 30, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
CodeV-R1: Reasoning-Enhanced Verilog Generation	May 30, 2025		—Unverified	0
Probing the Robustness Properties of Neural Speech Codecs	May 30, 2025	Language ModelingLanguage Modelling	CodeCode Available	0
GridRoute: A Benchmark for LLM-Based Route Planning with Cardinal Movement in Grid Environments	May 30, 2025		CodeCode Available	0
Learning to Optimally Dispatch Power: Performance on a Nation-Wide Real-World Dataset	May 30, 2025		CodeCode Available	0
VietMix: A Naturally Occurring Vietnamese-English Code-Mixed Corpus with Iterative Augmentation for Machine Translation	May 30, 2025	Machine TranslationSynthetic Data Generation	—Unverified	0
Should I Share this Translation? Evaluating Quality Feedback for User Reliance on Machine Translation	May 30, 2025	Machine TranslationTranslation	CodeCode Available	0
EXP-Bench: Can AI Conduct AI Research Experiments?	May 30, 2025		CodeCode Available	3
GeoVision Labeler: Zero-Shot Geospatial Classification with Vision and Language Models	May 30, 2025	ClassificationDisaster Response	CodeCode Available	2
Efficient Neural and Numerical Methods for High-Quality Online Speech Spectrogram Inversion via Gradient Theorem	May 30, 2025	8k	—Unverified	0
Multiple LLM Agents Debate for Equitable Cultural Alignment	May 30, 2025		CodeCode Available	0
FinMME: Benchmark Dataset for Financial Multi-Modal Reasoning Evaluation	May 30, 2025	Hallucination	CodeCode Available	2
Bench4KE: Benchmarking Automated Competency Question Generation	May 30, 2025	BenchmarkingQuestion Generation	CodeCode Available	1
Timing is Important: Risk-aware Fund Allocation based on Time-Series Forecasting	May 30, 2025	Time SeriesTime Series Forecasting	CodeCode Available	1
R-KV: Redundancy-aware KV Cache Compression for Training-Free Reasoning Models Acceleration	May 30, 2025	Mathematical Reasoning	CodeCode Available	5
ScienceMeter: Tracking Scientific Knowledge Updates in Language Models	May 30, 2025		CodeCode Available	1
A Perception-Based L2 Speech Intelligibility Indicator: Leveraging a Rater's Shadowing and Sequence-to-sequence Voice Conversion	May 30, 2025	Voice Conversion	—Unverified	0
Towards Effective Code-Integrated Reasoning	May 30, 2025	Mathematical ReasoningReinforcement Learning (RL)	CodeCode Available	1
BPE Stays on SCRIPT: Structured Encoding for Robust Multilingual Pretokenization	May 30, 2025		CodeCode Available	1
Logits-Based Finetuning	May 30, 2025	Out of Distribution (OOD) Detection	CodeCode Available	2
TimeHC-RL: Temporal-aware Hierarchical Cognitive Reinforcement Learning for Enhancing LLMs' Social Intelligence	May 30, 2025		CodeCode Available	1
ProxyThinker: Test-Time Guidance through Small Visual Reasoners	May 30, 2025	Visual Reasoning	CodeCode Available	1
On Symmetric Losses for Robust Policy Optimization with Noisy Preferences	May 30, 2025		CodeCode Available	0
ProRL: Prolonged Reinforcement Learning Expands Reasoning Boundaries in Large Language Models	May 30, 2025	Reinforcement Learning (RL)	CodeCode Available	5
Model Unlearning via Sparse Autoencoder Subspace Guided Projections	May 30, 2025	Adversarial Robustnessfeature selection	—Unverified	0
Learning from Videos for 3D World: Enhancing MLLMs with 3D Vision Geometry Priors	May 30, 2025	3D geometryLarge Language Model	CodeCode Available	0
SEAR: A Multimodal Dataset for Analyzing AR-LLM-Driven Social Engineering Behaviors	May 30, 2025		CodeCode Available	0
Large Language Models are Locally Linear Mappings	May 30, 2025		CodeCode Available	1
INSIGHT: A Survey of In-Network Systems for Intelligent, High-Efficiency AI and Topology Optimization	May 30, 2025	Federated LearningIntrusion Detection	—Unverified	0
Fewer Hallucinations, More Verification: A Three-Stage LLM-Based Framework for ASR Error Correction	May 30, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Harnessing Large Language Models for Scientific Novelty Detection	May 30, 2025	MarketingNovelty Detection	—Unverified	0
NexusSum: Hierarchical LLM Agents for Long-Form Narrative Summarization	May 30, 2025	DescriptiveForm	—Unverified	0
Running Conventional Automatic Speech Recognition on Memristor Hardware: A Simulated Approach	May 30, 2025	Automatic Speech RecognitionQuantization	—Unverified	0
From Invariant Representations to Invariant Data: Provable Robustness to Spurious Correlations via Noisy Counterfactual Matching	May 30, 2025	counterfactualDiversity	CodeCode Available	0
FABLE: A Novel Data-Flow Analysis Benchmark on Procedural Text for Large Language Model Evaluation	May 30, 2025	DiagnosticLanguage Model Evaluation	CodeCode Available	0
AutoChemSchematic AI: A Closed-Loop, Physics-Aware Agentic Framework for Auto-Generating Chemical Process and Instrumentation Diagrams	May 30, 2025	Chemical Process	—Unverified	0
PRISM: A Framework for Producing Interpretable Political Bias Embeddings with Political-Aware Cross-Encoder	May 30, 2025	ArticlesSemantic Similarity	CodeCode Available	0
Seeing is Not Reasoning: MVPBench for Graph-based Evaluation of Multi-path Visual Physical CoT	May 30, 2025	Spatial ReasoningVisual Reasoning	CodeCode Available	1
Chameleon: A MatMul-Free Temporal Convolutional Network Accelerator for End-to-End Few-Shot and Continual Learning from Sequential Data	May 30, 2025	Continual LearningFew-Shot Learning	CodeCode Available	1
RT-X Net: RGB-Thermal cross attention network for Low-Light Image Enhancement	May 30, 2025	Image EnhancementLow-Light Image Enhancement	CodeCode Available	1
Non-collective Calibrating Strategy for Time Series Forecasting	May 29, 2025	Time SeriesTime Series Forecasting	CodeCode Available	0
Dc-EEMF: Pushing depth-of-field limit of photoacoustic microscopy via decision-level constrained learning	May 29, 2025	Multi Focus Image Fusion	—Unverified	0
LLaMA-XR: A Novel Framework for Radiology Report Generation using LLaMA and QLoRA Fine Tuning	May 29, 2025	Computational EfficiencyDiagnostic	—Unverified	0
Why is it easier to predict the epidemic curve than to reconstruct the underlying contact network?	May 29, 2025	LEMMA	—Unverified	0
Super-temporal-resolution Photoacoustic Imaging with Dynamic Reconstruction through Implicit Neural Representation in Sparse-view	May 29, 2025	Dynamic ReconstructionImage Reconstruction	—Unverified	0
Machine Learning-Based Anomaly Detection of Correlated Sensor Data: An Integrated Principal Component Analysis-Autoencoder Approach	May 29, 2025	Anomaly DetectionHybrid Machine Learning	—Unverified	0
Toward Knowledge-Guided AI for Inverse Design in Manufacturing: A Perspective on Domain, Physics, and Human-AI Synergy	May 29, 2025	Physics-informed machine learning	—Unverified	0
Ultrafast High-Flux Single-Photon LiDAR Simulator via Neural Mapping	May 29, 2025	Depth Estimation	—Unverified	0