The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

474,278 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 17501–17550 of 474278 papers

Title	Date	Tasks	Status	Hype
A Survey of Automatic Evaluation Methods on Text, Visual and Speech Generations	Jun 6, 2025	Audio GenerationText Generation	—Unverified	0
GS4: Generalizable Sparse Splatting Semantic SLAM	Jun 6, 2025	3D Semantic SegmentationSemantic Segmentation	—Unverified	0
Dy3DGS-SLAM: Monocular 3D Gaussian Splatting SLAM for Dynamic Environments	Jun 6, 2025	3DGSNeRF	—Unverified	0
Mitigating Catastrophic Forgetting with Adaptive Transformer Block Expansion in Federated Fine-Tuning	Jun 6, 2025	parameter-efficient fine-tuning	—Unverified	0
Edge-Enabled Collaborative Object Detection for Real-Time Multi-Vehicle Perception	Jun 6, 2025	Autonomous DrivingAutonomous Vehicles	CodeCode Available	0
NeurNCD: Novel Class Discovery via Implicit Neural Representation	Jun 6, 2025	NeRFNovel Class Discovery	—Unverified	0
Generating Long Semantic IDs in Parallel for Recommendation	Jun 6, 2025		CodeCode Available	2
3DFlowAction: Learning Cross-Embodiment Manipulation from 3D Flow World Model	Jun 6, 2025	Optical Flow EstimationRobot Manipulation	CodeCode Available	1
Bridging Perspectives: A Survey on Cross-view Collaborative Intelligence with Egocentric-Exocentric Vision	Jun 6, 2025	Video Understanding	CodeCode Available	0
EqCollide: Equivariant and Collision-Aware Deformable Objects Neural Simulator	Jun 6, 2025	Graph Neural Network	—Unverified	0
FlowOE: Imitation Learning with Flow Policy from Ensemble RL Experts for Optimal Execution under Heston Volatility and Concave Market Impacts	Jun 6, 2025	Imitation Learning	—Unverified	0
The World of AI: A Novel Approach to AI Literacy for First-year Engineering Students	Jun 6, 2025	Fairness	—Unverified	0
BEAST: Efficient Tokenization of B-Splines Encoded Action Sequences for Imitation Learning	Jun 6, 2025	continuous-controlContinuous Control	—Unverified	0
BiAssemble: Learning Collaborative Affordance for Bimanual Geometric Assembly	Jun 6, 2025	Diversity	—Unverified	0
Neural-Augmented Kelvinlet: Real-Time Soft Tissue Deformation with Multiple Graspers	Jun 6, 2025		CodeCode Available	0
Being Strong Progressively! Enhancing Knowledge Distillation of Large Language Models through a Curriculum Learning Framework	Jun 6, 2025	Instruction FollowingKnowledge Distillation	CodeCode Available	0
TimeWak: Temporal Chained-Hashing Watermark for Time Series Data	Jun 6, 2025	Time Series	CodeCode Available	0
Voice Impression Control in Zero-Shot TTS	Jun 6, 2025	Language ModelingLanguage Modelling	—Unverified	0
InstantFT: An FPGA-Based Runtime Subsecond Fine-tuning of CNN Models	Jun 6, 2025	parameter-efficient fine-tuning	—Unverified	0
CrimeMind: Simulating Urban Crime with Multi-Modal LLM Agents	Jun 6, 2025	counterfactual	—Unverified	0
Exploring Microstructural Dynamics in Cryptocurrency Limit Order Books: Better Inputs Matter More Than Stacking Another Hidden Layer	Jun 6, 2025	Feature Engineering	—Unverified	0
Pruning Spurious Subgraphs for Graph Out-of-Distribtuion Generalization	Jun 6, 2025	Out-of-Distribution Generalization	CodeCode Available	0
An Optimized Franz-Parisi Criterion and its Equivalence with SQ Lower Bounds	Jun 6, 2025	Additive models	—Unverified	0
FinanceReasoning: Benchmarking Financial Numerical Reasoning More Credible, Comprehensive and Challenging	Jun 6, 2025	Benchmarking	CodeCode Available	1
Topology of Reasoning: Understanding Large Reasoning Models through Reasoning Graph Properties	Jun 6, 2025	GSM8K	CodeCode Available	1
MLOps with Microservices: A Case Study on the Maritime Domain	Jun 6, 2025	Anomaly Detection	—Unverified	0
Numerical Investigation of Sequence Modeling Theory using Controllable Memory Functions	Jun 6, 2025	BenchmarkingState Space Models	—Unverified	0
Simple Yet Effective: Extracting Private Data Across Clients in Federated Fine-Tuning of Large Language Models	Jun 6, 2025	Federated LearningMemorization	—Unverified	0
CodeContests+: High-Quality Test Case Generation for Competitive Programming	Jun 6, 2025	Reinforcement Learning (RL)	—Unverified	0
CP-Bench: Evaluating Large Language Models for Constraint Modelling	Jun 6, 2025	Code Generation	—Unverified	0
MCA-Bench: A Multimodal Benchmark for Evaluating CAPTCHA Robustness Against VLM-based Attacks	Jun 6, 2025	Benchmarking	CodeCode Available	0
TissUnet: Improved Extracranial Tissue and Cranium Segmentation for Children through Adulthood	Jun 6, 2025	Computed Tomography (CT)	CodeCode Available	0
SurGSplat: Progressive Geometry-Constrained Gaussian Splatting for Surgical Scene Reconstruction	Jun 6, 2025	3DGS3D Reconstruction	—Unverified	0
Statistical Guarantees in Data-Driven Nonlinear Control: Conformal Robustness for Stability and Safety	Jun 6, 2025	Conformal PredictionPrediction	—Unverified	0
Eigenspectrum Analysis of Neural Networks without Aspect Ratio Bias	Jun 6, 2025	image-classificationImage Classification	CodeCode Available	1
Peer-Ranked Precision: Creating a Foundational Dataset for Fine-Tuning Vision Models from DataSeeds' Annotated Imagery	Jun 6, 2025	Hyperparameter OptimizationImage Generation	CodeCode Available	0
MLLM-CL: Continual Learning for Multimodal Large Language Models	Jun 5, 2025	Continual Learning	—Unverified	0
PCDVQ: Enhancing Vector Quantization for Large Language Models via Polar Coordinate Decoupling	Jun 5, 2025	ClusteringQuantization	—Unverified	0
Pseudo-Siamese Blind-Spot Transformers for Self-Supervised Real-World Denoising	Jun 5, 2025	DenoisingImage Denoising	CodeCode Available	0
Customizing Speech Recognition Model with Large Language Model Feedback	Jun 5, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Better Pseudo-labeling with Multi-ASR Fusion and Error Correction by SpeechLLM	Jun 5, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Intelligibility of Text-to-Speech Systems for Mathematical Expressions	Jun 5, 2025	text-to-speechText to Speech	—Unverified	0
Structured Labeling Enables Faster Vision-Language Models for End-to-End Autonomous Driving	Jun 5, 2025	Autonomous DrivingDecision Making	—Unverified	0
MORSE-500: A Programmatically Controllable Video Benchmark to Stress-Test Multimodal Reasoning	Jun 5, 2025	Dataset GenerationMathematical Problem-Solving	CodeCode Available	1
MobiEdit: Resource-efficient Knowledge Editing for Personalized On-device LLMs	Jun 5, 2025	General Knowledgeknowledge editing	—Unverified	0
Dynamic Context Tuning for Retrieval-Augmented Generation: Enhancing Multi-Turn Planning and Tool Adaptation	Jun 5, 2025	RAGRetrieval	—Unverified	0
Deep histological synthesis from mass spectrometry imaging for multimodal registration	Jun 5, 2025	SSIM	CodeCode Available	0
U-NetMN and SegNetMN: Modified U-Net and SegNet models for bimodal SAR image segmentation	Jun 5, 2025	Body DetectionComputational Efficiency	—Unverified	0
Massive MIMO with 1-Bit DACs: Data Detection for Quantized Linear Precoding with Dithering	Jun 5, 2025	Quantization	—Unverified	0
Spectral Efficiency Maximization for mmWave MIMO-Aided Integrated Sensing and Communication Under Practical Constraints	Jun 5, 2025	FairnessIntegrated sensing and communication	—Unverified	0