The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5351–5375 of 661570 papers

Title	Date	Tasks	Status	Hype
Temporal Query Network for Efficient Multivariate Time Series Forecasting	May 19, 2025	Correlated Time Series ForecastingMultivariate Time Series Forecasting	CodeCode Available	2
RBF++: Quantifying and Optimizing Reasoning Boundaries across Measurable and Unmeasurable Capabilities for Chain-of-Thought Reasoning	May 19, 2025		CodeCode Available	2
CPRet: A Dataset, Benchmark, and Model for Retrieval in Competitive Programming	May 19, 2025	FairnessLarge Language Model	CodeCode Available	2
μPC: Scaling Predictive Coding to 100+ Layer Networks	May 19, 2025		CodeCode Available	2
MMAR: A Challenging Benchmark for Deep Reasoning in Speech, Audio, Music, and Their Mix	May 19, 2025		CodeCode Available	2
G1: Bootstrapping Perception and Reasoning Abilities of Vision-Language Model via Reinforcement Learning	May 19, 2025	Language ModelingLanguage Modelling	CodeCode Available	2
FlightGPT: Towards Generalizable and Interpretable UAV Vision-and-Language Navigation with Vision-Language Models	May 19, 2025	Disaster ResponseVision and Language Navigation	CodeCode Available	2
AD-AGENT: A Multi-agent Framework for End-to-end Anomaly Detection	May 19, 2025	Anomaly DetectionCode Generation	CodeCode Available	2
4Hammer: a board-game reinforcement learning environment for the hour long time frame	May 19, 2025	Board Gamesreinforcement-learning	CodeCode Available	2
Neurosymbolic Diffusion Models	May 19, 2025	Autonomous DrivingUncertainty Quantification	CodeCode Available	2
Recollection from Pensieve: Novel View Synthesis via Learning from Uncalibrated Videos	May 19, 2025	3D geometryCamera Pose Estimation	CodeCode Available	2
Hybrid 3D-4D Gaussian Splatting for Fast Dynamic Scene Representation	May 19, 2025	3D Scene ReconstructionComputational Efficiency	CodeCode Available	2
Optimizing Anytime Reasoning via Budget Relative Policy Optimization	May 19, 2025	Mathematical ReasoningReinforcement Learning (RL)	CodeCode Available	2
Rethinking Features-Fused-Pyramid-Neck for Object Detection	May 19, 2025	object-detectionObject Detection	CodeCode Available	2
AdaptThink: Reasoning Models Can Learn When to Think	May 19, 2025	Math	CodeCode Available	2
CSC-SQL: Corrective Self-Consistency in Text-to-SQL via Reinforcement Learning	May 19, 2025	Text to SQLText-To-SQL	CodeCode Available	2
DD-Ranking: Rethinking the Evaluation of Dataset Distillation	May 19, 2025	Data AugmentationData Compression	CodeCode Available	2
Learnware of Language Models: Specialized Small Language Models Can Do Big	May 19, 2025	Privacy PreservingQuestion Answering	CodeCode Available	2
Degradation-Aware Feature Perturbation for All-in-One Image Restoration	May 19, 2025	AllDeblurring	CodeCode Available	2
Dynamic Graph Induced Contour-aware Heat Conduction Network for Event-based Object Detection	May 19, 2025	Event-based visionObject	CodeCode Available	2
Panda: A pretrained forecast model for universal representation of chaotic dynamics	May 19, 2025	Time Series	CodeCode Available	2
DisCO: Reinforcing Large Reasoning Models with Discriminative Constrained Optimization	May 18, 2025	Mathematical Reasoning	CodeCode Available	2
VideoRFT: Incentivizing Video Reasoning Capability in MLLMs via Reinforced Fine-Tuning	May 18, 2025	Reinforcement Learning (RL)	CodeCode Available	2
SLOT: Sample-specific Language Model Optimization at Test-time	May 18, 2025	GSM8KLanguage Modeling	CodeCode Available	2
GlobalGeoTree: A Multi-Granular Vision-Language Dataset for Global Tree Species Classification	May 18, 2025	Benchmarking	CodeCode Available	2