The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

474,278 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 15751–15800 of 474278 papers

Title	Date	Tasks	Status	Hype
crossMoDA Challenge: Evolution of Cross-Modality Domain Adaptation Techniques for Vestibular Schwannoma and Cochlea Segmentation from 2021 to 2023	Jun 13, 2025	BenchmarkingDomain Adaptation	—Unverified	0
Structural Similarity-Inspired Unfolding for Lightweight Image Super-Resolution	Jun 13, 2025	Image Super-ResolutionMixture-of-Experts	CodeCode Available	1
Automated Treatment Planning for Interstitial HDR Brachytherapy for Locally Advanced Cervical Cancer using Deep Reinforcement Learning	Jun 13, 2025	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
SIMSHIFT: A Benchmark for Adapting Neural Surrogates to Distribution Shifts	Jun 13, 2025	Domain Adaptation	CodeCode Available	1
A Gamified Evaluation and Recruitment Platform for Low Resource Language Machine Translation Systems	Jun 13, 2025	Machine Translation	—Unverified	0
EconGym: A Scalable AI Testbed with Diverse Economic Tasks	Jun 13, 2025	Benchmarking	—Unverified	0
Exploring the Effectiveness of Deep Features from Domain-Specific Foundation Models in Retinal Image Synthesis	Jun 13, 2025	Edge DetectionFairness	—Unverified	0
DiffFuSR: Super-Resolution of all Sentinel-2 Multispectral Bands using Diffusion Models	Jun 13, 2025	AllHallucination	CodeCode Available	1
EyeSim-VQA: A Free-Energy-Guided Eye Simulation Framework for Video Quality Assessment	Jun 13, 2025	Image Quality AssessmentVideo Quality Assessment	—Unverified	0
AgriPotential: A Novel Multi-Spectral and Multi-Temporal Remote Sensing Dataset for Agricultural Potentials	Jun 13, 2025	ManagementMulti-Label Classification	—Unverified	0
Statistical Machine Learning for Astronomy -- A Textbook	Jun 13, 2025	AstronomyBayesian Inference	CodeCode Available	2
FCA2: Frame Compression-Aware Autoencoder for Modular and Fast Compressed Video Super-Resolution	Jun 13, 2025	Dimensionality ReductionSuper-Resolution	CodeCode Available	0
Can LLMs Generate High-Quality Test Cases for Algorithm Problems? TestCase-Eval: A Systematic Evaluation of Fault Coverage and Exposure	Jun 13, 2025		—Unverified	0
VEIGAR: View-consistent Explicit Inpainting and Geometry Alignment for 3D object Removal	Jun 13, 2025	3D Generation3D Reconstruction	—Unverified	0
code_transformed: The Influence of Large Language Models on Code	Jun 13, 2025	Code Generation	—Unverified	0
Agent-RLVR: Training Software Engineering Agents via Guidance and Environment Rewards	Jun 13, 2025	MathNavigate	—Unverified	0
VGR: Visual Grounded Reasoning	Jun 13, 2025	Large Language ModelMath	—Unverified	0
LoRA Users Beware: A Few Spurious Tokens Can Manipulate Your Finetuned Model	Jun 13, 2025	Decision Making	CodeCode Available	0
Dual-View Disentangled Multi-Intent Learning for Enhanced Collaborative Filtering	Jun 13, 2025	Collaborative FilteringDisentanglement	CodeCode Available	0
LearnAlign: Reasoning Data Selection for Reinforcement Learning in Large Language Models Based on Improved Gradient Alignment	Jun 13, 2025	GSM8KMathematical Reasoning	—Unverified	0
ReVeal: Self-Evolving Code Agents via Iterative Generation-Verification	Jun 13, 2025	Code Generationreinforcement-learning	—Unverified	0
Med-PRM: Medical Reasoning Models with Stepwise, Guideline-verified Process Rewards	Jun 13, 2025	DiagnosticMedQA	—Unverified	0
TAViS: Text-bridged Audio-Visual Segmentation with Foundation Models	Jun 13, 2025	cross-modal alignmentSegmentation	—Unverified	0
Learning Causality for Modern Machine Learning	Jun 13, 2025	Drug Discovery	—Unverified	0
Interpretable representation learning of quantum data enabled by probabilistic variational autoencoders	Jun 13, 2025	Interpretable Machine LearningRepresentation Learning	—Unverified	0
Let the Tree Decide: FABART A Non-Parametric Factor Model	Jun 13, 2025	Dimensionality Reduction	—Unverified	0
Camera-based method for the detection of lifted truck axles using convolutional neural networks	Jun 13, 2025	Image Augmentation	—Unverified	0
Visual Pre-Training on Unlabeled Images using Reinforcement Learning	Jun 13, 2025	reinforcement-learningReinforcement Learning	CodeCode Available	1
Mind the XAI Gap: A Human-Centered LLM Framework for Democratizing Explainable AI	Jun 13, 2025	BenchmarkingIn-Context Learning	CodeCode Available	0
Vision-based Lifting of 2D Object Detections for Automated Driving	Jun 13, 2025	3D Object DetectionAutonomous Driving	—Unverified	0
LiveCodeBench Pro: How Do Olympiad Medalists Judge LLMs in Competitive Programming?	Jun 13, 2025		—Unverified	0
Fast Bayesian Optimization of Function Networks with Partial Evaluations	Jun 13, 2025	Bayesian OptimizationDrug Discovery	CodeCode Available	0
Prohibited Items Segmentation via Occlusion-aware Bilayer Modeling	Jun 13, 2025	DecoderImage Segmentation	CodeCode Available	0
Robust Molecular Property Prediction via Densifying Scarce Labeled Data	Jun 13, 2025	Drug DiscoveryMeta-Learning	CodeCode Available	0
Learn to Preserve Personality: Federated Foundation Models in Recommendations	Jun 13, 2025	Recommendation Systems	—Unverified	0
A Watermark for Auto-Regressive Image Generation Models	Jun 13, 2025	Face SwappingImage Generation	—Unverified	0
Improving Large Language Model Safety with Contrastive Representation Learning	Jun 13, 2025	Language ModelingLanguage Modelling	CodeCode Available	0
On the Natural Robustness of Vision-Language Models Against Visual Perception Attacks in Autonomous Driving	Jun 13, 2025	Autonomous DrivingAutonomous Vehicles	—Unverified	0
TreeRL: LLM Reinforcement Learning with On-Policy Tree Search	Jun 13, 2025	Mathreinforcement-learning	CodeCode Available	2
TrustGLM: Evaluating the Robustness of GraphLLMs Against Prompt, Text, and Structure Attacks	Jun 13, 2025	AttributeGraph Learning	CodeCode Available	0
Long-Short Alignment for Effective Long-Context Modeling in LLMs	Jun 13, 2025		CodeCode Available	0
Optimization of bi-directional gated loop cell based on multi-head attention mechanism for SSD health state classification model	Jun 13, 2025	Binary ClassificationCloud Computing	—Unverified	0
A Hybrid Multi-Agent Prompting Approach for Simplifying Complex Sentences	Jun 13, 2025	Game DesignSentence	—Unverified	0
Feedforward Ordering in Neural Connectomes via Feedback Arc Minimization	Jun 13, 2025	ARC	—Unverified	0
BraTS orchestrator : Democratizing and Disseminating state-of-the-art brain tumor image analysis	Jun 13, 2025	Brain Tumor SegmentationTumor Segmentation	CodeCode Available	2
Semantic Preprocessing for LLM-based Malware Analysis	Jun 13, 2025	Language ModelingLanguage Modelling	—Unverified	0
Abstract Sound Fusion with Unconditioned Inversion Model	Jun 13, 2025	model	—Unverified	0
FIMA-Q: Post-Training Quantization for Vision Transformers by Fisher Information Matrix Approximation	Jun 13, 2025	Model CompressionQuantization	CodeCode Available	1
SecONNds: Secure Outsourced Neural Network Inference on ImageNet	Jun 13, 2025	CPUGPU	CodeCode Available	0
Real-World Deployment of a Lane Change Prediction Architecture Based on Knowledge Graph Embeddings and Bayesian Inference	Jun 13, 2025	Bayesian InferenceKnowledge Graph Embeddings	—Unverified	0