The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4101–4125 of 661570 papers

Title	Date	Status	Hype
Human Psychometric Questionnaires Mischaracterize LLM Psychology: Evidence from Generation Behavior	Mar 18, 2026	—Unverified	0
Exact Generalisation Error Exposes Benchmarks Skew Graph Neural Networks Success (or Failure)	Mar 18, 2026	—Unverified	0
InPhyRe Discovers: Large Multimodal Models Struggle in Inductive Physical Reasoning	Mar 18, 2026	—Unverified	0
Diagonal Linear Networks and the Lasso Regularization Path	Mar 18, 2026	—Unverified	0
See, Think, Act: Teaching Multimodal Agents to Effectively Interact with GUI by Identifying Toggles	Mar 18, 2026	CodeCode Available	0
Where MLLMs Attend and What They Rely On: Explaining Autoregressive Token Generation	Mar 18, 2026	—Unverified	0
IA2: Alignment with ICL Activations Improves Supervised Fine-Tuning	Mar 18, 2026	—Unverified	0
M3DLayout: A Multi-Source Dataset of 3D Indoor Layouts and Structured Descriptions for 3D Generation	Mar 18, 2026	—Unverified	0
In-Context Compositional Q-Learning for Offline Reinforcement Learning	Mar 18, 2026	—Unverified	0
Personalized Motion Guidance Framework for Athlete-Centric Coaching	Mar 18, 2026	—Unverified	0
LMOD+: A Comprehensive Multimodal Dataset and Benchmark for Developing and Evaluating Multimodal Large Language Models in Ophthalmology	Mar 18, 2026	—Unverified	0
Vector sketch animation generation with differentiable motion trajectories	Mar 18, 2026	—Unverified	0
Assessing LLM Reasoning Through Implicit Causal Chain Discovery in Climate Discourse	Mar 18, 2026	—Unverified	0
Detecting Data Contamination from Reinforcement Learning Post-training for Large Language Models	Mar 18, 2026	—Unverified	1
Scalable Energy-Based Models via Adversarial Training: Unifying Discrimination and Generation	Mar 18, 2026	—Unverified	0
CBF-RL: Safety Filtering Reinforcement Learning in Training with Control Barrier Functions	Mar 18, 2026	—Unverified	0
Learning Time-Varying Graphs from Incomplete Graph Signals	Mar 18, 2026	—Unverified	0
Automated Wicket-Taking Delivery Segmentation and Trajectory-Based Dismissal-Zone Analysis in Cricket Videos Using OCR-Guided YOLOv8	Mar 18, 2026	—Unverified	0
Communication to Completion: Modeling Collaborative Workflows with Intelligent Multi-Agent Communication	Mar 18, 2026	—Unverified	0
SHAP Meets Tensor Networks: Provably Tractable Explanations with Parallelism	Mar 18, 2026	—Unverified	0
From Slides to Chatbots: Enhancing Large Language Models with University Course Materials	Mar 18, 2026	—Unverified	0
Frame Semantic Patterns for Identifying Underreporting of Notifiable Events in Healthcare: The Case of Gender-Based Violence	Mar 18, 2026	—Unverified	0
Towards One-step Causal Video Generation via Adversarial Self-Distillation	Mar 18, 2026	—Unverified	0
Generative Hints	Mar 18, 2026	—Unverified	0
Silenced Biases: The Dark Side LLMs Learned to Refuse	Mar 18, 2026	—Unverified	0