The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

474,278 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 19351–19400 of 474278 papers

Title	Date	Tasks	Status	Hype
A Survey of Generative Categories and Techniques in Multimodal Large Language Models	May 29, 2025	Mixture-of-ExpertsSelf-Supervised Learning	—Unverified	0
Composite Reward Design in PPO-Driven Adaptive Filtering	May 29, 2025	Denoisingreinforcement-learning	CodeCode Available	0
Zero-Shot Adaptation of Parameter-Efficient Fine-Tuning in Diffusion Models	May 29, 2025	parameter-efficient fine-tuningTransfer Learning	—Unverified	0
Contextual Integrity in LLMs via Reasoning and Reinforcement Learning	May 29, 2025	reinforcement-learningReinforcement Learning	—Unverified	0
Deep Learning-Based Breast Cancer Detection in Mammography: A Multi-Center Validation Study in Thai Population	May 29, 2025	Breast Cancer Detection	—Unverified	0
FOLIAGE: Towards Physical Intelligence World Models Via Unbounded Surface Evolution	May 29, 2025	counterfactualCross-Modal Retrieval	—Unverified	0
Literature Review Of Multi-Agent Debate For Problem-Solving	May 29, 2025	Decision Making	—Unverified	0
Reducing Latency in LLM-Based Natural Language Commands Processing for Robot Navigation	May 29, 2025	Language ModelingLanguage Modelling	—Unverified	0
Human sensory-musculoskeletal modeling and control of whole-body movements	May 29, 2025	Deep Reinforcement Learning	—Unverified	0
The End Of Universal Lifelong Identifiers: Identity Systems For The AI Era	May 29, 2025	Position	—Unverified	0
Leveraging Auxiliary Information in Text-to-Video Retrieval: A Review	May 29, 2025	RetrievalText to Video Retrieval	—Unverified	0
Point-MoE: Towards Cross-Domain Generalization in 3D Semantic Segmentation via Mixture-of-Experts	May 29, 2025	3D Semantic SegmentationDomain Generalization	—Unverified	0
Preemptive Hallucination Reduction: An Input-Level Approach for Multimodal Language Model	May 29, 2025	HallucinationLanguage Modeling	—Unverified	0
Parameter-Free Bio-Inspired Channel Attention for Enhanced Cardiac MRI Reconstruction	May 29, 2025	MRI Reconstruction	—Unverified	0
SafeCOMM: What about Safety Alignment in Fine-Tuned Telecom Large Language Models?	May 29, 2025	DiagnosticRed Teaming	—Unverified	0
Evaluating Prompt Engineering Techniques for Accuracy and Confidence Elicitation in Medical LLMs	May 29, 2025	Prompt Engineering	—Unverified	0
Comparative analysis of privacy-preserving open-source LLMs regarding extraction of diagnostic information from clinical CMR imaging reports	May 29, 2025	DescriptiveDiagnostic	—Unverified	0
Prompt Engineer: Analyzing Skill Requirements in the AI Job Market	May 29, 2025	Prompt Engineering	—Unverified	0
Hierarchical Bayesian Knowledge Tracing in Undergraduate Engineering Education	May 29, 2025	Knowledge TracingSkill Mastery	—Unverified	0
Knowledge Graphs for Digitized Manuscripts in Jagiellonian Digital Library Application	May 29, 2025	Knowledge Graphs	—Unverified	0
Evaluating the Efficacy of LLM-Based Reasoning for Multiobjective HPC Job Scheduling	May 29, 2025	Computational EfficiencyFairness	—Unverified	0
DGIQA: Depth-guided Feature Attention and Refinement for Generalizable Image Quality Assessment	May 29, 2025	Image Quality AssessmentNo-Reference Image Quality Assessment	CodeCode Available	0
Optimizing Storytelling, Improving Audience Retention, and Reducing Waste in the Entertainment Industry	May 29, 2025	feature selection	—Unverified	0
Semantics-Guided Generative Image Compression	May 29, 2025	DecoderImage Compression	CodeCode Available	0
The Automated but Risky Game: Modeling Agent-to-Agent Negotiations and Transactions in Consumer Markets	May 29, 2025		CodeCode Available	1
Cora: Correspondence-aware image editing using few step diffusion	May 29, 2025	Image-to-Image TranslationSemantic correspondence	CodeCode Available	1
Leave it to the Specialist: Repair Sparse LLMs with Sparse Fine-Tuning via Sparsity Evolution	May 29, 2025		CodeCode Available	0
Representational Difference Explanations	May 29, 2025		CodeCode Available	0
Multi-Group Proportional Representation for Text-to-Image Models	May 29, 2025	Image Generation	—Unverified	0
DINO-R1: Incentivizing Reasoning Capability in Vision Foundation Models	May 29, 2025	Visual Prompting	—Unverified	0
Enhancing LLM-Based Code Generation with Complexity Metrics: A Feedback-Driven Approach	May 29, 2025	Code GenerationHumanEval	—Unverified	0
Critical Batch Size Revisited: A Simple Empirical Approach to Large-Batch Language Model Training	May 29, 2025	Language ModelingLanguage Modelling	—Unverified	0
Characterising the Inductive Biases of Neural Networks on Boolean Data	May 29, 2025	Inductive Bias	—Unverified	0
LLM Agents Should Employ Security Principles	May 29, 2025	Large Language Model	—Unverified	0
Exploring Societal Concerns and Perceptions of AI: A Thematic Analysis through the Lens of Problem-Seeking	May 29, 2025	Misinformation	—Unverified	0
TCM-Ladder: A Benchmark for Multimodal Question Answering on Traditional Chinese Medicine	May 29, 2025	DiagnosticMultiple-choice	—Unverified	0
Large Language Model-Based Agents for Automated Research Reproducibility: An Exploratory Study in Alzheimer's Disease	May 29, 2025	Language ModelingLanguage Modelling	—Unverified	0
InterMT: Multi-Turn Interleaved Preference Alignment with Human Feedback	May 29, 2025	multimodal interaction	—Unverified	0
MSQA: Benchmarking LLMs on Graduate-Level Materials Science Reasoning and Knowledge	May 29, 2025	Benchmarking	—Unverified	0
Multi-RAG: A Multimodal Retrieval-Augmented Generation System for Adaptive Video Understanding	May 29, 2025	RAGRetrieval-augmented Generation	—Unverified	0
mRAG: Elucidating the Design Space of Multi-modal Retrieval-Augmented Generation	May 29, 2025	Question AnsweringRAG	—Unverified	0
Towards Understanding The Calibration Benefits of Sharpness-Aware Minimization	May 29, 2025	Autonomous DrivingMedical Diagnosis	—Unverified	0
DATD3: Depthwise Attention Twin Delayed Deep Deterministic Policy Gradient For Model Free Reinforcement Learning Under Output Feedback Control	May 29, 2025	continuous-controlContinuous Control	—Unverified	0
Revisiting Uncertainty Estimation and Calibration of Large Language Models	May 29, 2025	Mixture-of-ExpertsMMLU	—Unverified	0
Personalized Subgraph Federated Learning with Differentiable Auxiliary Projections	May 29, 2025	Federated LearningTransfer Learning	—Unverified	0
Combining Deep Architectures for Information Gain estimation and Reinforcement Learning for multiagent field exploration	May 29, 2025	Visibility Tracking	—Unverified	0
Infi-Med: Low-Resource Medical MLLMs with Robust Reasoning Evaluation	May 29, 2025	DiagnosticMultimodal Reasoning	—Unverified	0
Noise-Robustness Through Noise: Asymmetric LoRA Adaption with Poisoning Expert	May 29, 2025	Mixture-of-Expertsparameter-efficient fine-tuning	—Unverified	0
MaCP: Minimal yet Mighty Adaptation via Hierarchical Cosine Projection	May 29, 2025	image-classificationImage Classification	—Unverified	0
A Benchmark Dataset for Graph Regression with Homogeneous and Multi-Relational Variants	May 29, 2025	Graph Neural NetworkGraph Regression	—Unverified	0