The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

659,983 papers248,104 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1051–1075 of 659983 papers

Title	Date	Tasks	Status	Hype
Off-Policy Primal-Dual Safe Reinforcement Learning	Jan 26, 2024	reinforcement-learningReinforcement Learning	CodeCode Available	5
WebVoyager: Building an End-to-End Web Agent with Large Multimodal Models	Jan 25, 2024		CodeCode Available	5
SpeechGPT-Gen: Scaling Chain-of-Information Speech Generation	Jan 24, 2024	text-to-speechText to Speech	CodeCode Available	5
Differentiable Tree Search Network	Jan 22, 2024	Decision MakingInductive Bias	CodeCode Available	5
Mastering Text-to-Image Diffusion: Recaptioning, Planning, and Generating with Multimodal LLMs	Jan 22, 2024	Diffusion Personalization Tuning FreeImage Generation	CodeCode Available	5
Large Language Model based Multi-Agents: A Survey of Progress and Challenges	Jan 21, 2024	Decision MakingLanguage Modeling	CodeCode Available	5
OMG-Seg: Is One Model Good Enough For All Segmentation?	Jan 18, 2024	AllDecoder	CodeCode Available	5
Scalable Pre-training of Large Autoregressive Image Models	Jan 16, 2024	Image Classification	CodeCode Available	5
SiT: Exploring Flow and Diffusion-based Generative Models with Scalable Interpolant Transformers	Jan 16, 2024	Image Generation	CodeCode Available	5
Real3D-Portrait: One-shot Realistic 3D Talking Portrait Synthesis	Jan 16, 2024	3D ReconstructionFace Generation	CodeCode Available	5
Unlocking Efficiency in Large Language Model Inference: A Comprehensive Survey of Speculative Decoding	Jan 15, 2024	Language ModelingLanguage Modelling	CodeCode Available	5
Secrets of RLHF in Large Language Models Part II: Reward Modeling	Jan 11, 2024	Contrastive LearningMeta-Learning	CodeCode Available	5
DeepSeekMoE: Towards Ultimate Expert Specialization in Mixture-of-Experts Language Models	Jan 11, 2024	Language ModellingLarge Language Model	CodeCode Available	5
Extreme Compression of Large Language Models via Additive Quantization	Jan 11, 2024	CPUGPU	CodeCode Available	5
Personal LLM Agents: Insights and Survey about the Capability, Efficiency and Security	Jan 10, 2024	Task Planning	CodeCode Available	5
Exploring Large Language Model based Intelligent Agents: Definitions, Methods, and Prospects	Jan 7, 2024	Language ModelingLanguage Modelling	CodeCode Available	5
Segment Anything Model for Medical Image Segmentation: Current Applications and Future Directions	Jan 7, 2024	BenchmarkingImage Segmentation	CodeCode Available	5
Latte: Latent Diffusion Transformer for Video Generation	Jan 5, 2024	Text-to-Video GenerationVideo Generation	CodeCode Available	5
Open-Vocabulary SAM: Segment and Recognize Twenty-thousand Classes Interactively	Jan 5, 2024	image-classificationImage Classification	CodeCode Available	5
Street Gaussians: Modeling Dynamic Urban Scenes with Gaussian Splatting	Jan 2, 2024	Autonomous DrivingNeRF	CodeCode Available	5
A Comprehensive Study of Knowledge Editing for Large Language Models	Jan 2, 2024	knowledge editingModel Editing	CodeCode Available	5
Self-Play Fine-Tuning Converts Weak Language Models to Strong Language Models	Jan 2, 2024		CodeCode Available	5
UniRepLKNet: A Universal Perception Large-Kernel ConvNet for Audio Video Point Cloud Time-Series and Image Recognition	Jan 1, 2024	Time SeriesTime Series Forecasting	CodeCode Available	5
Astraios: Parameter-Efficient Instruction Tuning Code Large Language Models	Jan 1, 2024	Code Generationparameter-efficient fine-tuning	CodeCode Available	5
Point Transformer V3: Simpler Faster Stronger	Jan 1, 2024	Representation Learning	CodeCode Available	5