The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7201–7250 of 661570 papers

Title	Date	Status	Hype
Mechanistic Indicators of Steering Effectiveness in Large Language Models	Mar 12, 2026	—Unverified	0
Model-Dowser: Data-Free Importance Probing to Mitigate Catastrophic Forgetting in Multimodal Large Language Models	Mar 12, 2026	—Unverified	0
NBAvatar: Neural Billboards Avatars with Realistic Hand-Face Interaction	Mar 12, 2026	—Unverified	0
Embed-RL: Reinforcement Learning for Reasoning-Driven Multimodal Embeddings	Mar 12, 2026	—Unverified	1
PsihoRo: Depression and Anxiety Romanian Text Corpus	Mar 12, 2026	—Unverified	0
IDSelect: A RL-Based Cost-Aware Selection Agent for Video-based Multi-Modal Person Recognition	Mar 12, 2026	—Unverified	0
Reasoning Boosts Opinion Alignment in LLMs	Mar 12, 2026	—Unverified	0
Scaling Machine Learning Interatomic Potentials with Mixtures of Experts	Mar 12, 2026	—Unverified	0
Limited Reasoning Space: The cage of long-horizon reasoning in LLMs	Mar 12, 2026	—Unverified	0
De novo molecular structure elucidation from mass spectra via flow matching	Mar 12, 2026	—Unverified	0
SIMSPINE: A Biomechanics-Aware Simulation Framework for 3D Spine Motion Annotation and Benchmarking	Mar 12, 2026	—Unverified	0
ECHOSAT: Estimating Canopy Height Over Space And Time	Mar 12, 2026	CodeCode Available	0
Extending Sequence Length is Not All You Need: Effective Integration of Multimodal Signals for Gene Expression Prediction	Mar 12, 2026	—Unverified	0
Evaluating Zero-Shot and One-Shot Adaptation of Small Language Models in Leader-Follower Interaction	Mar 12, 2026	—Unverified	0
Truncated Step-Level Sampling with Process Rewards for Retrieval-Augmented Reasoning	Mar 12, 2026	—Unverified	0
GeoDiff4D: Geometry-Aware Diffusion for 4D Head Avatar Reconstruction	Mar 12, 2026	—Unverified	0
Subliminal Signals in Preference Labels	Mar 12, 2026	—Unverified	0
FastLightGen: Fast and Light Video Generation with Fewer Steps and Parameters	Mar 12, 2026	—Unverified	0
LaST-VLA: Thinking in Latent Spatio-Temporal Space for Vision-Language-Action in Autonomous Driving	Mar 12, 2026	—Unverified	0
Benchmark of Benchmarks: Unpacking Influence and Code Repository Quality in LLM Safety Benchmarks	Mar 12, 2026	—Unverified	0
Reasoning Theater: Disentangling Model Beliefs from Chain-of-Thought	Mar 12, 2026	—Unverified	0
From Toil to Thought: Designing for Strategic Exploration and Responsible AI in Systematic Literature Reviews	Mar 12, 2026	—Unverified	0
Cross-Context Review: Improving LLM Output Quality by Separating Production and Review Sessions	Mar 12, 2026	—Unverified	0
Structure-Aware Set Transformers: Temporal and Variable-Type Attention Biases for Asynchronous Clinical Time Series	Mar 12, 2026	—Unverified	0
Conditional Unbalanced Optimal Transport Maps: An Outlier-Robust Framework for Conditional Generative Modeling	Mar 12, 2026	—Unverified	0
SGG-R^ 3: From Next-Token Prediction to End-to-End Unbiased Scene Graph Generation	Mar 12, 2026	—Unverified	0
Micro-Diffusion Compression - Binary Tree Tweedie Denoising for Online Probability Estimation	Mar 12, 2026	—Unverified	0
Deep Tabular Research via Continual Experience-Driven Execution	Mar 12, 2026	—Unverified	0
A Variational Latent Equilibrium for Learning in Neuronal Circuits	Mar 12, 2026	—Unverified	0
EXPLORE-Bench: Egocentric Scene Prediction with Long-Horizon Reasoning	Mar 12, 2026	—Unverified	0
AraModernBERT: Transtokenized Initialization and Long-Context Encoder Modeling for Arabic	Mar 12, 2026	—Unverified	0
Beyond the Prompt in Large Language Models: Comprehension, In-Context Learning, and Chain-of-Thought	Mar 12, 2026	—Unverified	0
Leveraging Wikidata for Geographically Informed Sociocultural Bias Dataset Creation: Application to Latin America	Mar 12, 2026	—Unverified	0
The Epistemic Support-Point Filter: Jaynesian Maximum Entropy Meets Popperian Falsification	Mar 12, 2026	—Unverified	0
Rethinking the Harmonic Loss via Non-Euclidean Distance Layers	Mar 12, 2026	—Unverified	0
StyleGallery: Training-free and Semantic-aware Personalized Style Transfer from Arbitrary Image References	Mar 12, 2026	—Unverified	0
Unlearning the Unpromptable: Prompt-free Instance Unlearning in Diffusion Models	Mar 12, 2026	—Unverified	0
Beam-Plasma Collective Oscillations in Intense Charged-Particle Beams: Dielectric Response Theory, Langmuir Wave Dispersion, and Unsupervised Detection via Prometheus	Mar 12, 2026	—Unverified	0
Less is More: Decoder-Free Masked Modeling for Efficient Skeleton Representation Learning	Mar 12, 2026	—Unverified	0
Contract And Conquer: How to Provably Compute Adversarial Examples for a Black-Box Model?	Mar 12, 2026	—Unverified	0
On the Reliability of Cue Conflict and Beyond	Mar 12, 2026	—Unverified	0
Try, Check and Retry: A Divide-and-Conquer Framework for Boosting Long-context Tool-Calling Performance of LLMs	Mar 12, 2026	—Unverified	0
Speak or Stay Silent: Context-Aware Turn-Taking in Multi-Party Dialogue	Mar 12, 2026	—Unverified	0
Mango-GS: Enhancing Spatio-Temporal Consistency in Dynamic Scenes Reconstruction using Multi-Frame Node-Guided 4D Gaussian Splatting	Mar 12, 2026	—Unverified	0
A Multi-Label Temporal Convolutional Framework for Transcription Factor Binding Characterization	Mar 12, 2026	—Unverified	0
Deactivating Refusal Triggers: Understanding and Mitigating Overrefusal in Safety Alignment	Mar 12, 2026	—Unverified	0
High-Precision 6DOF Pose Estimation via Global Phase Retrieval in Fringe Projection Profilometry for 3D Mapping	Mar 12, 2026	—Unverified	0
Agentic AI for Embodied-enhanced Beam Prediction in Low-Altitude Economy Networks	Mar 12, 2026	—Unverified	0
ARROW: Augmented Replay for RObust World models	Mar 12, 2026	—Unverified	0
Harnessing Data Asymmetry: Manifold Learning in the Finsler World	Mar 12, 2026	—Unverified	0