The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10001–10050 of 661570 papers

Title	Date	Tasks	Status	Hype
Verif.ai: Towards an Open-Source Scientific Generative Question-Answering System with Referenced and Verifiable Answers	Feb 9, 2024	Generative Question AnsweringInformation Retrieval	CodeCode Available	2
Diffusion-ES: Gradient-free Planning with Diffusion for Autonomous Driving and Zero-Shot Instruction Following	Feb 9, 2024	Autonomous DrivingDenoising	CodeCode Available	2
On the Efficacy of Eviction Policy for Key-Value Constrained Generative Language Model Inference	Feb 9, 2024	GPULanguage Modeling	CodeCode Available	2
Debating with More Persuasive LLMs Leads to More Truthful Answers	Feb 9, 2024	Persuasiveness	CodeCode Available	2
CLIPZyme: Reaction-Conditioned Virtual Screening of Enzymes	Feb 9, 2024		CodeCode Available	2
Dirichlet Flow Matching with Applications to DNA Sequence Design	Feb 8, 2024		CodeCode Available	2
Training Large Language Models for Reasoning through Reverse Curriculum Reinforcement Learning	Feb 8, 2024	GSM8Kreinforcement-learning	CodeCode Available	2
Time Series Diffusion in the Frequency Domain	Feb 8, 2024	DenoisingInductive Bias	CodeCode Available	2
PLAPT: Protein-Ligand Binding Affinity Prediction Using Pretrained Transformers	Feb 8, 2024	Drug DiscoveryPrediction	CodeCode Available	2
Learning to Route Among Specialized Experts for Zero-Shot Generalization	Feb 8, 2024	parameter-efficient fine-tuningZero-shot Generalization	CodeCode Available	2
Let Your Graph Do the Talking: Encoding Structured Data for LLMs	Feb 8, 2024		CodeCode Available	2
Paralinguistics-Aware Speech-Empowered Large Language Models for Natural Conversation	Feb 8, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	2
CREMA: Generalizable and Efficient Video-Language Reasoning via Multimodal Modular Fusion	Feb 8, 2024	Computational EfficiencyMultimodal Reasoning	CodeCode Available	2
Accurate LoRA-Finetuning Quantization of LLMs via Information Retention	Feb 8, 2024	MMLUQuantization	CodeCode Available	2
Sandwiched Compression: Repurposing Standard Codecs with Neural Network Wrappers	Feb 8, 2024	Video Compression	CodeCode Available	2
Get What You Want, Not What You Don't: Image Content Suppression for Text-to-Image Diffusion Models	Feb 8, 2024		CodeCode Available	2
JailbreakRadar: Comprehensive Assessment of Jailbreak Attacks Against LLMs	Feb 8, 2024	Ethics	CodeCode Available	2
Scalable Diffusion Models with State Space Backbone	Feb 8, 2024	Conditional Image GenerationImage Generation	CodeCode Available	2
DiffSpeaker: Speech-Driven 3D Facial Animation with Diffusion Transformer	Feb 8, 2024		CodeCode Available	2
How Well Can LLMs Negotiate? NegotiationArena Platform and Analysis	Feb 8, 2024		CodeCode Available	2
Mamba-ND: Selective State Space Modeling for Multi-Dimensional Data	Feb 8, 2024	Action RecognitionMamba	CodeCode Available	2
Can Large Language Model Agents Simulate Human Trust Behavior?	Feb 7, 2024	Language ModelingLanguage Modelling	CodeCode Available	2
InstructScene: Instruction-Driven 3D Indoor Scene Synthesis with Semantic Graph Prior	Feb 7, 2024	BenchmarkingDecoder	CodeCode Available	2
Edu-ConvoKit: An Open-Source Library for Education Conversation Data	Feb 7, 2024		CodeCode Available	2
BEBLID: Boosted efficient binary local image descriptor	Feb 7, 2024	Computational EfficiencyRetrieval	CodeCode Available	2
ConvLoRA and AdaBN based Domain Adaptation via Self-Training	Feb 7, 2024	Domain AdaptationMulti-target Domain Adaptation	CodeCode Available	2
Triplet Interaction Improves Graph Transformers: Accurate Molecular Graph Learning with Triplet Graph Transformers	Feb 7, 2024	Drug DiscoveryGraph Learning	CodeCode Available	2
A Comprehensive Survey of Cross-Domain Policy Transfer for Embodied Agents	Feb 7, 2024		CodeCode Available	2
Data-efficient Large Vision Models through Sequential Autoregression	Feb 7, 2024		CodeCode Available	2
SALAD-Bench: A Hierarchical and Comprehensive Safety Benchmark for Large Language Models	Feb 7, 2024	DiversityMultiple-choice	CodeCode Available	2
A Survey on Domain Generalization for Medical Image Analysis	Feb 7, 2024	Domain GeneralizationMedical Image Analysis	CodeCode Available	2
Towards Aligned Layout Generation via Diffusion Model with Aesthetic Constraints	Feb 7, 2024	Layout DesignLayout Generation	CodeCode Available	2
FM-Fusion: Instance-aware Semantic Mapping Boosted by Vision-Language Foundation Models	Feb 7, 2024	Instance SegmentationObject	CodeCode Available	2
Multi-Patch Prediction: Adapting LLMs for Time Series Representation Learning	Feb 7, 2024	Contrastive LearningPrediction	CodeCode Available	2
Closing the Gap Between SGP4 and High-Precision Propagation via Differentiable Programming	Feb 7, 2024		CodeCode Available	2
Pedagogical Alignment of Large Language Models	Feb 7, 2024	Synthetic Data Generation	CodeCode Available	2
Blue noise for diffusion models	Feb 7, 2024	Denoising	CodeCode Available	2
λ-ECLIPSE: Multi-Concept Personalized Text-to-Image Diffusion Models by Leveraging CLIP Latent Space	Feb 7, 2024	Concept AlignmentGPU	CodeCode Available	2
Universal Neural Functionals	Feb 7, 2024		CodeCode Available	2
MLLM-as-a-Judge: Assessing Multimodal LLM-as-a-Judge with Vision-Language Benchmark	Feb 7, 2024		CodeCode Available	2
ScreenAI: A Vision-Language Model for UI and Infographics Understanding	Feb 7, 2024	Chart Question AnsweringLanguage Modeling	CodeCode Available	2
Hydra: Sequentially-Dependent Draft Heads for Medusa Decoding	Feb 7, 2024		CodeCode Available	2
MolTC: Towards Molecular Relational Modeling In Language Models	Feb 6, 2024	Relational Reasoning	CodeCode Available	2
RL-VLM-F: Reinforcement Learning from Vision Language Foundation Model Feedback	Feb 6, 2024	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	2
AdaFlow: Imitation Learning with Variance-Adaptive Flow-Based Policies	Feb 6, 2024	Decision MakingDiversity	CodeCode Available	2
Fine-Tuned Language Models Generate Stable Inorganic Materials as Text	Feb 6, 2024		CodeCode Available	2
QuEST: Low-bit Diffusion Model Quantization via Efficient Selective Finetuning	Feb 6, 2024	Image GenerationModel Compression	CodeCode Available	2
YOLOPoint Joint Keypoint and Object Detection	Feb 6, 2024	Objectobject-detection	CodeCode Available	2
DySLIM: Dynamics Stable Learning by Invariant Measure for Chaotic Systems	Feb 6, 2024		CodeCode Available	2
Learning a Decision Tree Algorithm with Transformers	Feb 6, 2024	Meta-Learning	CodeCode Available	2