The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4051–4075 of 661570 papers

Title	Date	Tasks	Status	Hype
Evolution of Heuristics: Towards Efficient Automatic Algorithm Design Using Large Language Model	Jan 4, 2024	Combinatorial OptimizationLanguage Modeling	CodeCode Available	3
Text2MDT: Extracting Medical Decision Trees from Medical Texts	Jan 4, 2024		CodeCode Available	3
LEAP-VO: Long-term Effective Any Point Tracking for Visual Odometry	Jan 3, 2024	Point TrackingVisual Odometry	CodeCode Available	3
CharacterEval: A Chinese Benchmark for Role-Playing Conversational Agent Evaluation	Jan 2, 2024		CodeCode Available	3
EEGPT: Pretrained Transformer for Universal and Reliable Representation of EEG Signals	Jan 1, 2024	EEGRepresentation Learning	CodeCode Available	3
SEED-Bench: Benchmarking Multimodal Large Language Models	Jan 1, 2024	BenchmarkingImage Generation	CodeCode Available	3
Towards Modern Image Manipulation Localization: A Large-Scale Dataset and Novel Methods	Jan 1, 2024	Image ManipulationImage Manipulation Localization	CodeCode Available	3
LL3DA: Visual Interactive Instruction Tuning for Omni-3D Understanding Reasoning and Planning	Jan 1, 2024	3D dense captioningDense Captioning	CodeCode Available	3
Intelligent Grimm - Open-ended Visual Storytelling via Latent Diffusion Models	Jan 1, 2024	Image GenerationText to Image Generation	CodeCode Available	3
Inversion-Free Image Editing with Language-Guided Diffusion Models	Jan 1, 2024	DenoisingImage Manipulation	CodeCode Available	3
Towards Automatic Power Battery Detection: New Challenge Benchmark Dataset and Baseline	Jan 1, 2024	Crowd Countingobject-detection	CodeCode Available	3
Exploring Regional Clues in CLIP for Zero-Shot Semantic Segmentation	Jan 1, 2024	SegmentationSemantic Segmentation	CodeCode Available	3
Stronger Fewer & Superior: Harnessing Vision Foundation Models for Domain Generalized Semantic Segmentation	Jan 1, 2024	Domain GeneralizationSemantic Segmentation	CodeCode Available	3
Improving Text Embeddings with Large Language Models	Dec 31, 2023	DecoderDiversity	CodeCode Available	3
Fairness in Serving Large Language Models	Dec 31, 2023	FairnessScheduling	CodeCode Available	3
EMAGE: Towards Unified Holistic Co-Speech Gesture Generation via Expressive Masked Audio Gesture Modeling	Dec 31, 2023	3D Face AnimationDiversity	CodeCode Available	3
Large Language Models for Generative Information Extraction: A Survey	Dec 29, 2023	Survey	CodeCode Available	3
TinyGPT-V: Efficient Multimodal Large Language Model via Small Backbones	Dec 28, 2023	Computational EfficiencyImage Captioning	CodeCode Available	3
MobileVLM : A Fast, Strong and Open Vision Language Assistant for Mobile Devices	Dec 28, 2023	AutoMLCPU	CodeCode Available	3
LangSplat: 3D Language Gaussian Splatting	Dec 26, 2023	NeRFObject Localization	CodeCode Available	3
XuanCe: A Comprehensive and Unified Deep Reinforcement Learning Library	Dec 25, 2023	CPUDeep Reinforcement Learning	CodeCode Available	3
SOLAR 10.7B: Scaling Large Language Models with Simple yet Effective Depth Up-Scaling	Dec 23, 2023	Instruction FollowingLanguage Modeling	CodeCode Available	3
emotion2vec: Self-Supervised Pre-Training for Speech Emotion Representation	Dec 23, 2023	Emotion RecognitionSelf-Supervised Learning	CodeCode Available	3
DriveLM: Driving with Graph Visual Question Answering	Dec 21, 2023	Autonomous DrivingQuestion Answering	CodeCode Available	3
Generative Multimodal Models are In-Context Learners	Dec 20, 2023	In-Context LearningPersonalized Image Generation	CodeCode Available	3