The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

474,278 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 14251–14300 of 474278 papers

Title	Date	Tasks	Status	Hype
FlightKooba: A Fast Interpretable FTP Model	Jun 24, 2025	Mambamodel	—Unverified	0
MATER: Multi-level Acoustic and Textual Emotion Representation for Interpretable Speech Emotion Recognition	Jun 24, 2025	AttributeEmotion Recognition	—Unverified	0
Retrieval-Confused Generation is a Good Defender for Privacy Violation Attack of Large Language Models	Jun 24, 2025	Retrieval	—Unverified	0
Orthogonal Soft Pruning for Efficient Class Unlearning	Jun 24, 2025	Inference AttackMachine Unlearning	—Unverified	0
Distillation-Enabled Knowledge Alignment for Generative Semantic Communications in AIGC Provisioning Tasks	Jun 24, 2025	Knowledge DistillationSemantic Communication	—Unverified	0
Inference Scaled GraphRAG: Improving Multi Hop Question Answering on Knowledge Graphs	Jun 24, 2025	Information RetrievalKnowledge Graphs	—Unverified	0
What Matters in LLM-generated Data: Diversity and Its Effect on Model Fine-Tuning	Jun 24, 2025	Diversity	—Unverified	0
Evaluating Rare Disease Diagnostic Performance in Symptom Checkers: A Synthetic Vignette Simulation Approach	Jun 24, 2025	Diagnostic	—Unverified	0
A Comparative Analysis of Reinforcement Learning and Conventional Deep Learning Approaches for Bearing Fault Diagnosis	Jun 24, 2025	DiagnosticFault Diagnosis	—Unverified	0
Neuromorphic Wireless Split Computing with Resonate-and-Fire Neurons	Jun 24, 2025	Audio Classification	—Unverified	0
Verifiable Unlearning on Edge	Jun 24, 2025	Machine UnlearningPrivacy Preserving	—Unverified	0
Learning Instruction-Following Policies through Open-Ended Instruction Relabeling with Large Language Models	Jun 24, 2025	Instruction Followingreinforcement-learning	—Unverified	0
VoxelOpt: Voxel-Adaptive Message Passing for Discrete Optimization in Deformable Abdominal CT Registration	Jun 24, 2025	Contrastive LearningImage Registration	CodeCode Available	0
Accurate and Energy Efficient: Local Retrieval-Augmented Generation Models Outperform Commercial Large Language Models in Medical Tasks	Jun 24, 2025	RAGRetrieval-augmented Generation	—Unverified	0
Universal pre-training by iterated random computation	Jun 24, 2025	In-Context Learning	CodeCode Available	0
HERCULES: Hierarchical Embedding-based Recursive Clustering Using LLMs for Efficient Summarization	Jun 24, 2025	Clustering	CodeCode Available	1
TRACED: Transition-aware Regret Approximation with Co-learnability for Environment Design	Jun 24, 2025	Deep Reinforcement LearningZero-shot Generalization	CodeCode Available	0
A Spatio-Temporal Point Process for Fine-Grained Modeling of Reading Behavior	Jun 24, 2025		CodeCode Available	0
Explaining deep neural network models for electricity price forecasting with XAI	Jun 24, 2025	Novel Concepts	—Unverified	0
LSH-DynED: A Dynamic Ensemble Framework with LSH-Based Undersampling for Evolving Multi-Class Imbalanced Classification	Jun 24, 2025	imbalanced classification	CodeCode Available	0
DIM-SUM: Dynamic IMputation for Smart Utility Management	Jun 24, 2025	ImputationManagement	—Unverified	0
RepuNet: A Reputation System for Mitigating Malicious Clients in DFL	Jun 24, 2025	Federated LearningModel Poisoning	—Unverified	0
Causal-Aware Intelligent QoE Optimization for VR Interaction with Adaptive Keyframe Extraction	Jun 24, 2025	Causal InferenceCPU	—Unverified	0
Hierarchical Reinforcement Learning and Value Optimization for Challenging Quadruped Locomotion	Jun 24, 2025	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified	0
Learning Bilateral Team Formation in Cooperative Multi-Agent Reinforcement Learning	Jun 24, 2025	Multi-agent Reinforcement Learning	—Unverified	0
Prover Agent: An Agent-based Framework for Formal Mathematical Proofs	Jun 24, 2025	AI AgentAutomated Theorem Proving	—Unverified	0
AnchorDP3: 3D Affordance Guided Sparse Diffusion Policy for Robotic Manipulation	Jun 24, 2025	Multi-Task LearningSemantic Segmentation	—Unverified	0
Cross-Layer Discrete Concept Discovery for Interpreting Language Models	Jun 24, 2025	DiversityQuantization	—Unverified	0
Beyond Autocomplete: Designing CopilotLens Towards Transparent and Explainable AI Coding Agents	Jun 24, 2025	Code CompletionDecision Making	—Unverified	0
A Framework for Uncertainty Quantification Based on Nearest Neighbors Across Layers	Jun 24, 2025	Autonomous DrivingMedical Diagnosis	—Unverified	0
QHackBench: Benchmarking Large Language Models for Quantum Code Generation Using PennyLane Hackathon Challenges	Jun 24, 2025	BenchmarkingCode Generation	—Unverified	0
Can LLMs Replace Humans During Code Chunking?	Jun 24, 2025	Chunking	—Unverified	0
New Insights on Unfolding and Fine-tuning Quantum Federated Learning	Jun 24, 2025	DiagnosticFederated Learning	—Unverified	0
Automated Generation of Diverse Courses of Actions for Multi-Agent Operations using Binary Optimization and Graph Learning	Jun 24, 2025	Disaster ResponseDiversity	—Unverified	0
CycleDistill: Bootstrapping Machine Translation using LLMs with Cyclical Distillation	Jun 24, 2025	Machine TranslationTranslation	CodeCode Available	0
GNN's Uncertainty Quantification using Self-Distillation	Jun 24, 2025	Knowledge DistillationUncertainty Quantification	CodeCode Available	0
Supervised Coupled Matrix-Tensor Factorization (SCMTF) for Computational Phenotyping of Patient Reported Outcomes in Ulcerative Colitis	Jun 24, 2025	Computational Phenotyping	CodeCode Available	0
Any-Order GPT as Masked Diffusion Model: Decoupling Formulation and Architecture	Jun 24, 2025	Decoder	CodeCode Available	1
Introducing EG-IPT and ipt~: a novel electric guitar dataset and a new Max/MSP object for real-time classification of instrumental playing techniques	Jun 24, 2025		CodeCode Available	1
Sensing Cardiac Health Across Scenarios and Devices: A Multi-Modal Foundation Model Pretrained on Heterogeneous Data from 1.7 Million Individuals	Jun 23, 2025		—Unverified	0
Enhancing Image Restoration Transformer via Adaptive Translation Equivariance	Jun 23, 2025	Image RestorationInductive Bias	—Unverified	0
SIM-Net: A Multimodal Fusion Network Using Inferred 3D Object Shape Point Clouds from RGB Images for 2D Classification	Jun 23, 2025	Classificationimage-classification	—Unverified	0
RAG-6DPose: Retrieval-Augmented 6D Pose Estimation via Leveraging CAD as Knowledge Base	Jun 23, 2025	6D Pose EstimationObject Localization	—Unverified	0
USVTrack: USV-Based 4D Radar-Camera Tracking Dataset for Autonomous Driving in Inland Waterways	Jun 23, 2025	Autonomous DrivingObject	—Unverified	0
Benchmarking histopathology foundation models in a multi-center dataset for skin cancer subtyping	Jun 23, 2025	BenchmarkingDiversity	CodeCode Available	0
YouTube-Occ: Learning Indoor 3D Semantic Occupancy Prediction from YouTube Videos	Jun 23, 2025	3D Semantic Occupancy PredictionRepresentation Learning	—Unverified	0
TReB: A Comprehensive Benchmark for Evaluating Table Reasoning Capabilities of Large Language Models	Jun 23, 2025		—Unverified	0
Advancing Talking Head Generation: A Comprehensive Survey of Multi-Modal Methodologies, Datasets, Evaluation Metrics, and Loss Functions	Jun 23, 2025	NeRFTalking Head Generation	CodeCode Available	1
LettinGo: Explore User Profile Generation for Recommendation System	Jun 23, 2025	Profile GenerationRecommendation Systems	—Unverified	0
Including Semantic Information via Word Embeddings for Skeleton-based Action Recognition	Jun 23, 2025	Action RecognitionSkeleton Based Action Recognition	—Unverified	0