The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

474,278 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 18601–18650 of 474278 papers

Title	Date	Tasks	Status	Hype
LASPA: Language Agnostic Speaker Disentanglement with Prefix-Tuned Cross-Attention	Jun 2, 2025	AnatomyDisentanglement	—Unverified	0
The Impact of Software Testing with Quantum Optimization Meets Machine Learning	Jun 2, 2025	Defect Detectionsoftware testing	—Unverified	0
unMORE: Unsupervised Multi-Object Segmentation via Center-Boundary Reasoning	Jun 2, 2025	Image ReconstructionObject	CodeCode Available	0
Comparison of spectrogram scaling in multi-label Music Genre Recognition	Jun 2, 2025	Music Genre Recognition	—Unverified	0
Near-Optimal Clustering in Mixture of Markov Chains	Jun 2, 2025	Clustering	—Unverified	0
FinRobot: Generative Business Process AI Agents for Enterprise Resource Planning in Finance	Jun 2, 2025	ERP	—Unverified	0
Zero-Shot Text-to-Speech for Vietnamese	Jun 2, 2025	text-to-speechText to Speech	—Unverified	0
SmolVLA: A Vision-Language-Action Model for Affordable and Efficient Robotics	Jun 2, 2025	Action GenerationGPU	CodeCode Available	12
Towards Machine Unlearning for Paralinguistic Speech Processing	Jun 2, 2025	Depression DetectionEmotion Recognition	—Unverified	0
Cocktail-Party Audio-Visual Speech Recognition	Jun 2, 2025	Audio-Visual Speech Recognitionspeech-recognition	—Unverified	0
Continual Speech Learning with Fused Speech Features	Jun 2, 2025	Decoder	—Unverified	0
Flow2Code: Evaluating Large Language Models for Flowchart-based Code Generation Capability	Jun 2, 2025	Code Generation	CodeCode Available	0
Silence is Golden: Leveraging Adversarial Examples to Nullify Audio Control in LDM-based Talking-Head Generation	Jun 2, 2025	MisinformationTalking Head Generation	CodeCode Available	1
Polishing Every Facet of the GEM: Testing Linguistic Competence of LLMs and Humans in Korean	Jun 2, 2025	Multiple-choice	CodeCode Available	1
Red Teaming AI Policy: A Taxonomy of Avoision and the EU AI Act	Jun 2, 2025	Red Teaming	—Unverified	0
SALAD: Systematic Assessment of Machine Unlearing on LLM-Aided Hardware Design	Jun 2, 2025	Code GenerationMachine Unlearning	—Unverified	0
LAMARL: LLM-Aided Multi-Agent Reinforcement Learning for Cooperative Policy Generation	Jun 2, 2025	Multi-agent Reinforcement Learning	—Unverified	0
Enhancing Speech Emotion Recognition with Graph-Based Multimodal Fusion and Prosodic Features for the Speech Emotion Recognition in Naturalistic Conditions Challenge at Interspeech 2025	Jun 2, 2025	Audio TaggingEmotion Recognition	—Unverified	0
Through a Steerable Lens: Magnifying Neural Network Interpretability via Phase-Based Extrapolation	Jun 2, 2025	Motion Magnification	—Unverified	0
LLM in the Loop: Creating the PARADEHATE Dataset for Hate Speech Detoxification	Jun 2, 2025	8k	—Unverified	0
COALESCE: Economic and Security Dynamics of Skill-Based Task Outsourcing Among Team of Autonomous LLM Agents	Jun 2, 2025	GPULarge Language Model	—Unverified	0
Fingerprinting Deep Learning Models via Network Traffic Patterns in Federated Learning	Jun 2, 2025	Deep LearningFederated Learning	—Unverified	0
SMOTE-DP: Improving Privacy-Utility Tradeoff with Synthetic Data	Jun 2, 2025	Privacy PreservingSynthetic Data Generation	—Unverified	0
Trojan Horse Hunt in Time Series Forecasting for Space Operations	Jun 2, 2025	Model PoisoningTime Series	—Unverified	0
From Street Views to Urban Science: Discovering Road Safety Factors with Multimodal Large Language Models	Jun 2, 2025	Large Language ModelMultimodal Large Language Model	—Unverified	0
Explainable AI Systems Must Be Contestable: Here's How to Make It Happen	Jun 2, 2025	Systematic Literature Review	—Unverified	0
Selecting for Less Discriminatory Algorithms: A Relational Search Framework for Navigating Fairness-Accuracy Trade-offs in Practice	Jun 2, 2025	FairnessHyperparameter Optimization	—Unverified	0
AI Data Development: A Scorecard for the System Card Framework	Jun 2, 2025	Fairness	—Unverified	0
Retrieval-Augmented Generation of Ontologies from Relational Databases	Jun 2, 2025	Knowledge GraphsRAG	—Unverified	0
Feature-aware Hypergraph Generation via Next-Scale Prediction	Jun 2, 2025	Prediction	—Unverified	0
Image Generation from Contextually-Contradictory Prompts	Jun 2, 2025	DenoisingImage Generation	—Unverified	0
WHEN TO ACT, WHEN TO WAIT: Modeling Structural Trajectories for Intent Triggerability in Task-Oriented Dialogue	Jun 2, 2025	Task-Oriented Dialogue Systems	CodeCode Available	1
Automatic Stage Lighting Control: Is it a Rule-Driven Process or Generative Task?	Jun 2, 2025		CodeCode Available	0
scDataset: Scalable Data Loading for Deep Learning on Large-Scale Single-Cell Omics	Jun 2, 2025		CodeCode Available	1
GLoSS: Generative Language Models with Semantic Search for Sequential Recommendation	Jun 2, 2025	Sequential Recommendation	CodeCode Available	1
Dual encoding feature filtering generalized attention UNET for retinal vessel segmentation	Jun 2, 2025	Data AugmentationRetinal Vessel Segmentation	CodeCode Available	0
TimeGraph: Synthetic Benchmark Datasets for Robust Time-Series Causal Discovery	Jun 2, 2025	Causal DiscoveryDataset Generation	CodeCode Available	1
TaxaDiffusion: Progressively Trained Diffusion Model for Fine-Grained Species Generation	Jun 2, 2025	Image GenerationTransfer Learning	CodeCode Available	0
Ridgeformer: Mutli-Stage Contrastive Training For Fine-grained Cross-Domain Fingerprint Recognition	Jun 2, 2025		CodeCode Available	0
ViTA-PAR: Visual and Textual Attribute Alignment with Attribute Prompting for Pedestrian Attribute Recognition	Jun 2, 2025	AttributePedestrian Attribute Recognition	CodeCode Available	0
ReGA: Representation-Guided Abstraction for Model-based Safeguarding of LLMs	Jun 2, 2025		CodeCode Available	0
Mitigating Disparate Impact of Differentially Private Learning through Bounded Adaptive Clipping	Jun 2, 2025	Privacy Preserving	—Unverified	0
Gradient-Based Model Fingerprinting for LLM Similarity Detection and Family Classification	Jun 2, 2025	Clone DetectionClustering	—Unverified	0
A Dynamic Framework for Semantic Grouping of Common Data Elements (CDE) Using Embeddings and Clustering	Jun 2, 2025	Clusteringscientific discovery	—Unverified	0
Align is not Enough: Multimodal Universal Jailbreak Attack against Multimodal Large Language Models	Jun 2, 2025	Safety Alignment	—Unverified	0
AIMSCheck: Leveraging LLMs for AI-Assisted Review of Modern Slavery Statements Across Jurisdictions	Jun 2, 2025		CodeCode Available	1
AgentCPM-GUI: Building Mobile-Use Agents with Reinforcement Fine-Tuning	Jun 2, 2025	AI AgentDiversity	CodeCode Available	5
IF-GUIDE: Influence Function-Guided Detoxification of LLMs	Jun 2, 2025		CodeCode Available	1
VirnyFlow: A Design Space for Responsible Model Development	Jun 2, 2025	AutoMLBayesian Optimization	CodeCode Available	0
Constrained Sliced Wasserstein Embedding	Jun 2, 2025		CodeCode Available	0