The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

474,278 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 15801–15850 of 474278 papers

Title	Date	Tasks	Status	Hype
ViTaSCOPE: Visuo-tactile Implicit Representation for In-hand Pose and Extrinsic Contact Estimation	Jun 13, 2025	3D geometryObject	—Unverified	0
Evaluating Sensitivity Parameters in Smartphone-Based Gaze Estimation: A Comparative Study of Appearance-Based and Infrared Eye Trackers	Jun 13, 2025	Deep LearningGaze Estimation	—Unverified	0
MTabVQA: Evaluating Multi-Tabular Reasoning of Language Models in Visual Space	Jun 13, 2025	Question AnsweringVisual Question Answering	—Unverified	0
Instruction Tuning and CoT Prompting for Contextual Medical QA with LLMs	Jun 13, 2025	Medical Question AnsweringMedQA	—Unverified	0
A Fast, Reliable, and Secure Programming Language for LLM Agents with Code Actions	Jun 13, 2025	Conformal PredictionQuestion Answering	—Unverified	0
Today's Cat Is Tomorrow's Dog: Accounting for Time-Based Changes in the Labels of ML Vulnerability Detection Approaches	Jun 13, 2025	Vulnerability Detection	—Unverified	0
Bias Amplification in RAG: Poisoning Knowledge Retrieval to Steer LLMs	Jun 13, 2025	FairnessRAG	—Unverified	0
Byzantine Outside, Curious Inside: Reconstructing Data Through Malicious Updates	Jun 13, 2025	Federated LearningReconstruction Attack	—Unverified	0
Large Language Models for History, Philosophy, and Sociology of Science: Interpretive Uses, Methodological Challenges, and Critical Perspectives	Jun 13, 2025	Model SelectionPhilosophy	—Unverified	0
Bias and Identifiability in the Bounded Confidence Model	Jun 13, 2025	modelparameter estimation	—Unverified	0
AgentSense: Virtual Sensor Data Generation Using LLM Agents in Simulated Home Environments	Jun 13, 2025	Activity RecognitionHuman Activity Recognition	—Unverified	0
The Behavior Gap: Evaluating Zero-shot LLM Agents in Complex Task-Oriented Dialogs	Jun 13, 2025	Large Language Model	—Unverified	0
Large Language Model-Powered Conversational Agent Delivering Problem-Solving Therapy (PST) for Family Caregivers: Enhancing Empathy and Therapeutic Alliance Using In-Context Learning	Jun 13, 2025	In-Context LearningLanguage Modeling	—Unverified	0
Deep Learning-based mmWave MIMO Channel Estimation using sub-6 GHz Channel Information: CNN and UNet Approaches	Jun 13, 2025	Deep Learning	—Unverified	0
Investigating the Potential of Large Language Model-Based Router Multi-Agent Architectures for Foundation Design Automation: A Task Classification and Expert Selection Study	Jun 13, 2025	Language ModelingLanguage Modelling	—Unverified	0
Teleoperated Driving: a New Challenge for 3D Object Detection in Compressed Point Clouds	Jun 13, 2025	3D Object DetectionAutonomous Driving	—Unverified	0
SPLATART: Articulated Gaussian Splatting with Estimated Object Structure	Jun 13, 2025	Object	—Unverified	0
SAIL: Faster-than-Demonstration Execution of Imitation Learning Policies	Jun 13, 2025	Imitation LearningScheduling	—Unverified	0
Enabling automatic transcription of child-centered audio recordings from real-world environments	Jun 13, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
(SimPhon Speech Test): A Data-Driven Method for In Silico Design and Validation of a Phonetically Balanced Speech Test	Jun 13, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Foundation Models in Autonomous Driving: A Survey on Scenario Generation and Scenario Analysis	Jun 13, 2025	Autonomous DrivingAutonomous Vehicles	CodeCode Available	2
Quizzard@INOVA Challenge 2025 -- Track A: Plug-and-Play Technique in Interleaved Multi-Image Model	Jun 13, 2025		CodeCode Available	0
Prioritizing Alignment Paradigms over Task-Specific Model Customization in Time-Series LLMs	Jun 13, 2025	Anomaly DetectionTime Series	CodeCode Available	0
From Emergence to Control: Probing and Modulating Self-Reflection in Language Models	Jun 13, 2025	Large Language ModelNavigate	CodeCode Available	0
Diffusion-Based Electrocardiography Noise Quantification via Anomaly Detection	Jun 13, 2025	Anomaly DetectionDecision Making	CodeCode Available	1
PRO-V: An Efficient Program Generation Multi-Agent System for Automatic RTL Verification	Jun 13, 2025	Code GenerationIn-Context Learning	CodeCode Available	1
Fed-HeLLo: Efficient Federated Foundation Model Fine-Tuning with Heterogeneous LoRA Allocation	Jun 13, 2025	Federated Learning	CodeCode Available	0
ICME 2025 Grand Challenge on Video Super-Resolution for Video Conferencing	Jun 13, 2025	Super-ResolutionVideo Super-Resolution	CodeCode Available	1
Interaction, Process, Infrastructure: A Unified Architecture for Human-Agent Collaboration	Jun 13, 2025	Human Agent Collaboration	—Unverified	0
LiLAC: A Lightweight Latent ControlNet for Musical Audio Generation	Jun 13, 2025	Audio Generation	—Unverified	0
CLIP the Landscape: Automated Tagging of Crowdsourced Landscape Images	Jun 13, 2025		CodeCode Available	0
Enter: Graduated Realism: A Pedagogical Framework for AI-Powered Avatars in Virtual Reality Teacher Training	Jun 13, 2025	Retrieval-augmented Generation	—Unverified	0
Dr. GPT Will See You Now, but Should It? Exploring the Benefits and Harms of Large Language Models in Medical Diagnosis using Crowdsourced Clinical Cases	Jun 13, 2025	Medical DiagnosisRAG	—Unverified	0
Learning Encodings by Maximizing State Distinguishability: Variational Quantum Error Correction	Jun 13, 2025		CodeCode Available	0
Spectral Estimation with Free Decompression	Jun 13, 2025		CodeCode Available	0
Schema-R1: A reasoning training approach for schema linking in Text-to-SQL Task	Jun 13, 2025	reinforcement-learningReinforcement Learning	CodeCode Available	1
On the performance of multi-fidelity and reduced-dimensional neural emulators for inference of physiologic boundary conditions	Jun 13, 2025	AnatomyDimensionality Reduction	—Unverified	0
Efficient Multi-Camera Tokenization with Triplanes for End-to-End Driving	Jun 13, 2025	Motion Planning	—Unverified	0
A correlation-permutation approach for speech-music encoders model merging	Jun 13, 2025	Re-basin	—Unverified	0
Fidelity Isn't Accuracy: When Linearly Decodable Functions Fail to Match the Ground Truth	Jun 13, 2025	Diagnosticregression	CodeCode Available	0
CGVQM+D: Computer Graphics Video Quality Metric and Dataset	Jun 13, 2025	DenoisingNovel View Synthesis	CodeCode Available	2
CLEAN-MI: A Scalable and Efficient Pipeline for Constructing High-Quality Neurodata in Motor Imagery Paradigm	Jun 13, 2025	EEGMotor Imagery	—Unverified	0
FeNN: A RISC-V vector processor for Spiking Neural Network acceleration	Jun 13, 2025	GPU	—Unverified	0
Recursive KalmanNet: Deep Learning-Augmented Kalman Filtering for State Estimation with Consistent Uncertainty Quantification	Jun 13, 2025	State EstimationUncertainty Quantification	CodeCode Available	1
FAA Framework: A Large Language Model-Based Approach for Credit Card Fraud Investigations	Jun 13, 2025	Fraud DetectionLanguage Modeling	—Unverified	0
A Lightweight IDS for Early APT Detection Using a Novel Feature Selection Method	Jun 13, 2025	Explainable artificial intelligenceExplainable Artificial Intelligence (XAI)	—Unverified	0
Data-driven approaches to inverse problems	Jun 13, 2025	Computational Efficiency	—Unverified	0
FocalAD: Local Motion Planning for End-to-End Autonomous Driving	Jun 13, 2025	Autonomous DrivingBench2Drive	—Unverified	0
Deep Learning Model Acceleration and Optimization Strategies for Real-Time Recommendation Systems	Jun 13, 2025	QuantizationRecommendation Systems	—Unverified	0
EgoPrivacy: What Your First-Person Camera Says About You?	Jun 13, 2025	Retrieval	CodeCode Available	0