The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

474,278 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 12951–13000 of 474278 papers

Title	Date	Tasks	Status	Hype
Few-Shot Learning by Explicit Physics Integration: An Application to Groundwater Heat Transport	Jul 8, 2025	Few-Shot Learning	CodeCode Available	0
CogniSQL-R1-Zero: Lightweight Reinforced Reasoning for Efficient SQL Generation	Jul 8, 2025	Reinforcement Learning (RL)TAG	—Unverified	0
High-Resolution Visual Reasoning via Multi-Turn Grounding-Based Reinforcement Learning	Jul 8, 2025	MMEReinforcement Learning (RL)	CodeCode Available	2
AI-Based Demand Forecasting and Load Balancing for Optimising Energy use in Healthcare Systems: A real case study	Jul 8, 2025	Demand Forecastingenergy management	—Unverified	0
Growing Transformers: Modular Composition and Layer-wise Expansion on a Frozen Substrate	Jul 8, 2025	Continual LearningMixture-of-Experts	CodeCode Available	0
A Survey on Latent Reasoning	Jul 8, 2025	Survey	CodeCode Available	3
CriticLean: Critic-Guided Reinforcement Learning for Mathematical Formalization	Jul 8, 2025	Active LearningAutomated Theorem Proving	CodeCode Available	1
LighthouseGS: Indoor Structure-aware 3D Gaussian Splatting for Panorama-Style Mobile Captures	Jul 8, 2025	3DGSDepth Estimation	—Unverified	0
Tile-Based ViT Inference with Visual-Cluster Priors for Zero-Shot Multi-Species Plant Identification	Jul 8, 2025	ARC	CodeCode Available	0
USIGAN: Unbalanced Self-Information Feature Transport for Weakly Paired Image IHC Virtual Staining	Jul 8, 2025	Virtual Staining	CodeCode Available	0
What ZTF Saw Where Rubin Looked: Anomaly Hunting in DR23	Jul 8, 2025	Anomaly Detection	—Unverified	0
PaddleOCR 3.0 Technical Report	Jul 8, 2025	document understandingKey Information Extraction	—Unverified	0
Hierarchical Task Offloading for UAV-Assisted Vehicular Edge Computing via Deep Reinforcement Learning	Jul 8, 2025	Deep Reinforcement LearningEdge-computing	—Unverified	0
MP-ALOE: An r2SCAN dataset for universal machine learning interatomic potentials	Jul 8, 2025	Active Learning	—Unverified	0
TalkFashion: Intelligent Virtual Try-On Assistant Based on Multimodal Large Language Model	Jul 8, 2025	Language ModelingLanguage Modelling	—Unverified	0
Fast and Accurate Collision Probability Estimation for Autonomous Vehicles using Adaptive Sigma-Point Sampling	Jul 8, 2025	Autonomous Vehicles	—Unverified	0
Remember Past, Anticipate Future: Learning Continual Multimodal Misinformation Detectors	Jul 8, 2025	ArticlesContinual Learning	CodeCode Available	0
RIS-Enabled Transmitter Design for Joint Radar and Communication	Jul 8, 2025	Integrated sensing and communicationISAC	—Unverified	0
Video Event Reasoning and Prediction by Fusing World Knowledge from LLMs with Vision Foundation Models	Jul 8, 2025	Future predictionLarge Language Model	—Unverified	0
Diffusion Dataset Condensation: Training Your Diffusion Model Faster with Less Data	Jul 8, 2025	Dataset CondensationGPU	—Unverified	0
Critical Nodes Identification in Complex Networks: A Survey	Jul 8, 2025	Computational EfficiencySurvey	—Unverified	0
Communication-Efficient Module-Wise Federated Learning for Grasp Pose Detection in Cluttered Environments	Jul 8, 2025	Federated LearningPrivacy Preserving	—Unverified	0
Generative Head-Mounted Camera Captures for Photorealistic Avatars	Jul 8, 2025	Disentanglement	—Unverified	0
Empowering Bridge Digital Twins by Bridging the Data Gap with a Unified Synthesis Framework	Jul 8, 2025	Missing LabelsSemantic Segmentation	—Unverified	0
A Directed Lazy Random Walk Model to Three-Way Dynamic Matching Problem	Jul 8, 2025	valid	—Unverified	0
LeAD: The LLM Enhanced Planning System Converged with End-to-end Autonomous Driving	Jul 8, 2025	Autonomous DrivingImitation Learning	—Unverified	0
AdaptaGen: Domain-Specific Image Generation through Hierarchical Semantic Optimization Framework	Jul 8, 2025	DiversityImage Generation	—Unverified	0
Multi-Modal Face Anti-Spoofing via Cross-Modal Feature Transitions	Jul 8, 2025	Face Anti-Spoofing	—Unverified	0
Automatic Synthesis of High-Quality Triplet Data for Composed Image Retrieval	Jul 8, 2025	Image RetrievalLarge Language Model	—Unverified	0
High-Fidelity and Generalizable Neural Surface Reconstruction with Sparse Feature Volumes	Jul 8, 2025	Surface Reconstruction	—Unverified	0
TigAug: Data Augmentation for Testing Traffic Light Detection in Autonomous Driving Systems	Jul 8, 2025	Autonomous DrivingData Augmentation	—Unverified	0
FEVO: Financial Knowledge Expansion and Reasoning Evolution for Large Language Models	Jul 8, 2025	Logical ReasoningReinforcement Learning (RL)	—Unverified	0
GSVR: 2D Gaussian-based Video Representation for 800+ FPS with Hybrid Deformation Field	Jul 8, 2025	QuantizationVideo Compression	—Unverified	0
QS4D: Quantization-aware training for efficient hardware deployment of structured state-space sequential models	Jul 8, 2025	Computational EfficiencyEdge-computing	—Unverified	0
TuneShield: Mitigating Toxicity in Conversational AI while Fine-tuning on Untrusted Data	Jul 8, 2025	ChatbotInstruction Following	—Unverified	0
Model-free Optical Processors using In Situ Reinforcement Learning with Proximal Policy Optimization	Jul 8, 2025	image-classificationImage Classification	—Unverified	0
DESIGN: Encrypted GNN Inference via Server-Side Input Graph Pruning	Jul 8, 2025	Privacy Preserving	—Unverified	0
DS@GT at CheckThat! 2025: Ensemble Methods for Detection of Scientific Discourse on Social Media	Jul 8, 2025	ARC	CodeCode Available	0
PSAT: Pediatric Segmentation Approaches via Adult Augmentations and Transfer Learning	Jul 8, 2025	AnatomyContinual Learning	CodeCode Available	0
SenseShift6D: Multimodal RGB-D Benchmarking for Robust 6D Pose Estimation across Environment and Sensor Variations	Jul 8, 2025	6D Pose Estimation6D Pose Estimation using RGB	CodeCode Available	0
Deep Learning Optimization of Two-State Pinching Antennas Systems	Jul 8, 2025	Deep Learning	—Unverified	0
SPADE: Spatial-Aware Denoising Network for Open-vocabulary Panoptic Scene Graph Generation with Long- and Local-range Context Reasoning	Jul 8, 2025	DenoisingGraph Generation	—Unverified	0
DS@GT at CheckThat! 2025: Detecting Subjectivity via Transfer-Learning and Corrective Data Augmentation	Jul 8, 2025	ARCData Augmentation	CodeCode Available	0
Differentiable Reward Optimization for LLM based TTS system	Jul 8, 2025	text-to-speechText to Speech	CodeCode Available	2
UQLM: A Python Package for Uncertainty Quantification in Large Language Models	Jul 8, 2025	HallucinationUncertainty Quantification	CodeCode Available	5
Prototype-Guided and Lightweight Adapters for Inherent Interpretation and Generalisation in Federated Learning	Jul 8, 2025	Federated Learning	CodeCode Available	0
AutoTriton: Automatic Triton Programming with Reinforcement Learning in LLMs	Jul 8, 2025	GPUreinforcement-learning	CodeCode Available	2
NeoBabel: A Multilingual Open Tower for Visual Generation	Jul 8, 2025	Image GenerationText to Image Generation	CodeCode Available	1
DreamArt: Generating Interactable Articulated Objects from a Single Image	Jul 8, 2025	3D GenerationImage to 3D	—Unverified	0
ScoreAdv: Score-based Targeted Generation of Natural Adversarial Examples via Diffusion Models	Jul 8, 2025	Adversarial AttackDenoising	CodeCode Available	1