The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

474,278 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 14001–14050 of 474278 papers

Title	Date	Tasks	Status	Hype
Pay Less Attention to Deceptive Artifacts: Robust Detection of Compressed Deepfakes on Online Social Networks	Jun 25, 2025	DeepFake DetectionFace Swapping	CodeCode Available	0
Memento: Note-Taking for Your Future Self	Jun 25, 2025	Multi-hop Question AnsweringQuestion Answering	—Unverified	0
Probing AI Safety with Source Code	Jun 25, 2025		CodeCode Available	0
Feature Hallucination for Self-supervised Action Recognition	Jun 25, 2025	Action RecognitionHallucination	—Unverified	0
Permutation Equivariant Neural Controlled Differential Equations for Dynamic Graph Representation Learning	Jun 25, 2025	Graph Representation LearningRepresentation Learning	—Unverified	0
Producer-Fairness in Sequential Bundle Recommendation	Jun 25, 2025	Fairness	—Unverified	0
GymPN: A Library for Decision-Making in Process Management Systems	Jun 25, 2025	Decision MakingDeep Reinforcement Learning	—Unverified	0
Enterprise Large Language Model Evaluation Benchmark	Jun 25, 2025	Language Model EvaluationLanguage Modeling	—Unverified	0
DuoGPT: Training-free Dual Sparsity through Activation-aware Pruning in LLMs	Jun 25, 2025	GPU	—Unverified	0
BrokenVideos: A Benchmark Dataset for Fine-Grained Artifact Localization in AI-Generated Videos	Jun 25, 2025	Artifact DetectionBenchmarking	—Unverified	0
SEED: A Structural Encoder for Embedding-Driven Decoding in Time Series Prediction with LLMs	Jun 25, 2025	Language ModelingLanguage Modelling	—Unverified	0
Valid Selection among Conformal Sets	Jun 25, 2025	Conformal PredictionPrediction	—Unverified	0
Learning Moderately Input-Sensitive Functions: A Case Study in QR Code Decoding	Jun 25, 2025	Decoderimage-classification	—Unverified	0
Progressive Alignment Degradation Learning for Pansharpening	Jun 25, 2025	Pansharpening	—Unverified	0
Directed Link Prediction using GNN with Local and Global Feature Fusion	Jun 25, 2025	Contrastive LearningGraph Neural Network	—Unverified	0
Time-series surrogates from energy consumers generated by machine learning approaches for long-term forecasting scenarios	Jun 25, 2025	DenoisingGenerative Adversarial Network	—Unverified	0
DipSVD: Dual-importance Protected SVD for Efficient LLM Compression	Jun 25, 2025	Model CompressionQuantization	—Unverified	0
Client Clustering Meets Knowledge Sharing: Enhancing Privacy and Robustness in Personalized Peer-to-Peer Learning	Jun 25, 2025	Knowledge DistillationTransfer Learning	—Unverified	0
Off-Policy Evaluation and Learning for the Future under Non-Stationarity	Jun 25, 2025	Off-policy evaluation	—Unverified	0
An Agentic System for Rare Disease Diagnosis with Traceable Reasoning	Jun 25, 2025	DiagnosticLarge Language Model	—Unverified	0
Counterfactual Influence as a Distributional Quantity	Jun 25, 2025	counterfactualimage-classification	—Unverified	0
Large Language Model-Driven Code Compliance Checking in Building Information Modeling	Jun 25, 2025	Language ModelingLanguage Modelling	—Unverified	0
Dense Video Captioning using Graph-based Sentence Summarization	Jun 25, 2025	Dense Video CaptioningSentence	—Unverified	0
Weighted Mean Frequencies: a handcraft Fourier feature for 4D Flow MRI segmentation	Jun 25, 2025	MRI segmentationSegmentation	—Unverified	0
Inside you are many wolves: Using cognitive models to interpret value trade-offs in LLMs	Jun 25, 2025	Mathematical Reasoning	—Unverified	0
ITFormer: Bridging Time Series and Natural Language for Multi-Modal QA with Large-Scale Multitask Dataset	Jun 25, 2025	Computational EfficiencyQuestion Answering	—Unverified	0
Intrinsic vs. Extrinsic Evaluation of Czech Sentence Embeddings: Semantic Relevance Doesn't Help with MT Evaluation	Jun 25, 2025	Machine TranslationSemantic Similarity	—Unverified	0
CBF-AFA: Chunk-Based Multi-SSL Fusion for Automatic Fluency Assessment	Jun 25, 2025	Action DetectionActivity Detection	—Unverified	0
FundaQ-8: A Clinically-Inspired Scoring Framework for Automated Fundus Image Quality Assessment	Jun 25, 2025	Diabetic Retinopathy GradingDiagnostic	—Unverified	0
Asymmetric REINFORCE for off-Policy Reinforcement Learning: Balancing positive and negative rewards	Jun 25, 2025	Reinforcement Learning (RL)	—Unverified	0
A Survey of Predictive Maintenance Methods: An Analysis of Prognostics via Classification and Regression	Jun 25, 2025	BenchmarkingManagement	—Unverified	0
On the ability of Deep Neural Networks to Learn Granger Causality in Multi-Variate Time Series Data	Jun 25, 2025	Time SeriesVariable Selection	—Unverified	0
Towards Interpretable and Efficient Feature Selection in Trajectory Datasets: A Taxonomic Approach	Jun 25, 2025	Explainable artificial intelligencefeature selection	—Unverified	0
Physics-Informed Machine Learning Regulated by Finite Element Analysis for Simulation Acceleration of Laser Powder Bed Fusion	Jun 25, 2025	Physics-informed machine learningTransfer Learning	—Unverified	0
Demonstration of effective UCB-based routing in skill-based queues on real-world data	Jun 25, 2025	Cloud ComputingFairness	—Unverified	0
Exploring Graph-Transformer Out-of-Distribution Generalization Abilities	Jun 25, 2025	Domain GeneralizationGraph Learning	—Unverified	0
Mastering Multiple-Expert Routing: Realizable H-Consistency and Strong Guarantees for Learning to Defer	Jun 25, 2025	Text Generation	—Unverified	0
Causal Representation Learning with Observational Grouping for CXR Classification	Jun 25, 2025	Representation Learning	—Unverified	0
Multimodal Representation Learning and Fusion	Jun 25, 2025	AutoMLRepresentation Learning	—Unverified	0
GPTailor: Large Language Model Pruning Through Layer Cutting and Stitching	Jun 25, 2025	Language ModelingLanguage Modelling	CodeCode Available	1
A foundation model with multi-variate parallel attention to generate neuronal activity	Jun 25, 2025	Seizure DetectionTime Series	CodeCode Available	1
Q-resafe: Assessing Safety Risks and Quantization-aware Safety Patching for Quantized Large Language Models	Jun 25, 2025	Quantization	CodeCode Available	1
Fine-Tuning and Prompt Engineering of LLMs, for the Creation of Multi-Agent AI for Addressing Sustainable Protein Production Challenges	Jun 25, 2025	Prompt EngineeringRAG	CodeCode Available	0
FedBKD: Distilled Federated Learning to Embrace Gerneralization and Personalization on Non-IID Data	Jun 25, 2025	Federated LearningKnowledge Distillation	CodeCode Available	0
Argumentative Ensembling for Robust Recourse under Model Multiplicity	Jun 25, 2025	counterfactual	CodeCode Available	0
WattsOnAI: Measuring, Analyzing, and Visualizing Energy and Carbon Footprint of AI Workloads	Jun 25, 2025	Benchmarking	CodeCode Available	1
A Multi-Pass Large Language Model Framework for Precise and Efficient Radiology Report Error Detection	Jun 25, 2025	Language ModelingLanguage Modelling	CodeCode Available	0
Tackling Data Heterogeneity in Federated Learning through Knowledge Distillation with Inequitable Aggregation	Jun 25, 2025	Federated LearningKnowledge Distillation	CodeCode Available	0
The kernel of graph indices for vector search	Jun 25, 2025	valid	CodeCode Available	0
Language Modeling by Language Models	Jun 25, 2025	Code GenerationLanguage Modeling	CodeCode Available	2