The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

474,278 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 20651–20700 of 474278 papers

Title	Date	Tasks	Status	Hype
Data-Distill-Net: A Data Distillation Approach Tailored for Reply-based Continual Learning	May 26, 2025	Continual LearningDataset Distillation	—Unverified	0
Editing as Unlearning: Are Knowledge Editing Methods Strong Baselines for Large Language Model Unlearning?	May 26, 2025	In-Context Learningknowledge editing	—Unverified	0
Task-Oriented Low-Label Semantic Communication With Self-Supervised Learning	May 26, 2025	image-classificationImage Classification	—Unverified	0
Which Data Attributes Stimulate Math and Code Reasoning? An Investigation via Influence Functions	May 26, 2025	AttributeMath	—Unverified	0
Learning Optimal Multimodal Information Bottleneck Representations	May 26, 2025	Computational Efficiency	—Unverified	0
Ankh3: Multi-Task Pretraining with Sequence Denoising and Completion Enhances Protein Representations	May 26, 2025	DenoisingLanguage Modeling	—Unverified	0
Catoni-Style Change Point Detection for Regret Minimization in Non-Stationary Heavy-Tailed Bandits	May 26, 2025	Change Point DetectionRecommendation Systems	—Unverified	0
SafeDPO: A Simple Approach to Direct Preference Optimization with Enhanced Safety	May 26, 2025	Language ModelingLanguage Modelling	—Unverified	0
Tensorization is a powerful but underexplored tool for compression and interpretability of neural networks	May 26, 2025	Deep LearningModel Compression	—Unverified	0
Research on feature fusion and multimodal patent text based on graph attention network	May 26, 2025	Computational EfficiencyGraph Attention	—Unverified	0
Variational Deep Learning via Implicit Regularization	May 26, 2025	Deep LearningInductive Bias	—Unverified	0
DreamPRM: Domain-Reweighted Process Reward Model for Multimodal Reasoning	May 26, 2025	Meta-LearningMultimodal Reasoning	—Unverified	0
Weighted Leave-One-Out Cross Validation	May 26, 2025	Model Selection	—Unverified	0
Efficient Optimization Accelerator Framework for Multistate Ising Problems	May 26, 2025	Combinatorial OptimizationComputational Efficiency	—Unverified	0
Toward Physics-Informed Machine Learning for Data Center Operations: A Tropical Case Study	May 26, 2025	Physics-informed machine learning	—Unverified	0
MSD-LLM: Predicting Ship Detention in Port State Control Inspections with Large Language Model	May 26, 2025	Language ModelingLanguage Modelling	—Unverified	0
CaseEdit: Enhancing Localized Commonsense Reasoning via Null-Space Constrained Knowledge Editing in Small Parameter Language Models	May 26, 2025	Common Sense ReasoningComputational Efficiency	—Unverified	0
Language Model-Enhanced Message Passing for Heterophilic Graph Learning	May 26, 2025	Active LearningGraph Learning	—Unverified	0
Subtle Risks, Critical Failures: A Framework for Diagnosing Physical Safety of LLMs for Embodied Decision Making	May 26, 2025	Decision Making	—Unverified	0
Curriculum-RLAIF: Curriculum Alignment with Reinforcement Learning from AI Feedback	May 26, 2025	reinforcement-learningReinforcement Learning	—Unverified	0
Hierarchical Tree Search-based User Lifelong Behavior Modeling on Large Language Model	May 26, 2025	Language ModelingLanguage Modelling	—Unverified	0
Leveraging Descriptions of Emotional Preferences in Recommender Systems	May 26, 2025	Recommendation Systems	—Unverified	0
Evaluating Large Language Models for Code Review	May 26, 2025	HumanEval	—Unverified	0
LLMs as Better Recommenders with Natural Language Collaborative Signals: A Self-Assessing Retrieval Approach	May 26, 2025	Semantic SimilaritySemantic Textual Similarity	—Unverified	0
Improving Recommendation Fairness without Sensitive Attributes Using Multi-Persona LLMs	May 26, 2025	FairnessRecommendation Systems	—Unverified	0
One Model to Rank Them All: Unifying Online Advertising with End-to-End Learning	May 26, 2025	AllComputational Efficiency	—Unverified	0
Light distillation for Incremental Graph Convolution Collaborative Filtering	May 26, 2025	Collaborative FilteringKnowledge Distillation	—Unverified	0
Power allocation for cell-free MIMO integrated sensing and communication	May 26, 2025	Integrated sensing and communicationISAC	—Unverified	0
Continuous Learning for Children's ASR: Overcoming Catastrophic Forgetting with Elastic Weight Consolidation and Synaptic Intelligence	May 26, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
On the Robustness of RSMA to Adversarial BD-RIS-Induced Interference	May 26, 2025	valid	—Unverified	0
Causality and "In-the-Wild" Video-Based Person Re-ID: A Survey	May 26, 2025	counterfactualCounterfactual Reasoning	—Unverified	0
RedAHD: Reduction-Based End-to-End Automatic Heuristic Design with Large Language Models	May 26, 2025	Combinatorial Optimization	—Unverified	0
Temporal Sampling for Forgotten Reasoning in LLMs	May 26, 2025		CodeCode Available	1
Can Compressed LLMs Truly Act? An Empirical Evaluation of Agentic Capabilities in LLM Compression	May 26, 2025	Language ModelingLanguage Modelling	CodeCode Available	1
WINA: Weight Informed Neuron Activation for Accelerating Large Language Model Inference	May 26, 2025	Language ModelingLanguage Modelling	CodeCode Available	2
Advanced long-term earth system forecasting by learning the small-scale nature	May 26, 2025		CodeCode Available	0
ExAnte: A Benchmark for Ex-Ante Inference in Large Language Models	May 26, 2025	PredictionQuestion Answering	CodeCode Available	0
Memory-Efficient Visual Autoregressive Modeling with Scale-Aware KV Cache Compression	May 26, 2025	Zero-shot Generalization	CodeCode Available	2
Cut out and Replay: A Simple yet Versatile Strategy for Multi-Label Online Continual Learning	May 26, 2025	Continual LearningMissing Labels	CodeCode Available	0
Deep Active Inference Agents for Delayed and Long-Horizon Environments	May 26, 2025	Model-based Reinforcement Learning	CodeCode Available	0
Learning to Trust Bellman Updates: Selective State-Adaptive Regularization for Offline RL	May 26, 2025	D4RLOffline RL	CodeCode Available	0
FunReason: Enhancing Large Language Models' Function Calling via Self-Refinement Multiscale Loss and Automated Data Refinement	May 26, 2025		CodeCode Available	5
Fine-grained List-wise Alignment for Generative Medication Recommendation	May 26, 2025	Clinical Knowledge	CodeCode Available	0
Causal-LLaVA: Causal Disentanglement for Mitigating Hallucination in Multimodal Large Language Models	May 26, 2025	DisentanglementHallucination	CodeCode Available	0
Chain-of-Thought for Autonomous Driving: A Comprehensive Survey and Future Prospects	May 26, 2025	Autonomous DrivingLogical Reasoning	CodeCode Available	2
Capability-Based Scaling Laws for LLM Red-Teaming	May 26, 2025	MMLUPrompt Engineering	CodeCode Available	0
LogiCoL: Logically-Informed Contrastive Learning for Set-based Dense Retrieval	May 26, 2025	Contrastive LearningEntity Retrieval	CodeCode Available	0
Beyond Simple Concatenation: Fairly Assessing PLM Architectures for Multi-Chain Protein-Protein Interactions Prediction	May 26, 2025	Drug Discovery	—Unverified	0
An Empirical Study on Strong-Weak Model Collaboration for Repo-level Code Generation	May 26, 2025	Code GenerationGitHub issue resolution	CodeCode Available	0
Rethinking Gating Mechanism in Sparse MoE: Handling Arbitrary Modality Inputs with Confidence-Guided Gate	May 26, 2025	ImputationMixture-of-Experts	CodeCode Available	0