The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

474,278 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 20751–20800 of 474278 papers

Title	Date	Tasks	Status	Hype
TrustEMG-Net: Using Representation-Masking Transformer with U-Net for Surface Electromyography Enhancement	Oct 4, 2024	Denoising	CodeCode Available	1
CliMedBench: A Large-Scale Chinese Benchmark for Evaluating Medical Large Language Models in Clinical Scenarios	Oct 4, 2024	Clinical KnowledgeDiagnostic	CodeCode Available	1
You Know What I'm Saying: Jailbreak Attack via Implicit Reference	Oct 4, 2024	Language ModelingLanguage Modelling	CodeCode Available	1
Beyond correlation: The Impact of Human Uncertainty in Measuring the Effectiveness of Automatic Evaluation and LLM-as-a-Judge	Oct 3, 2024		CodeCode Available	1
High-Efficiency Neural Video Compression via Hierarchical Predictive Learning	Oct 3, 2024	Motion EstimationVideo Compression	CodeCode Available	1
SuperGS: Super-Resolution 3D Gaussian Splatting Enhanced by Variational Residual Features and Uncertainty-Augmented Learning	Oct 3, 2024	3DGSNovel View Synthesis	CodeCode Available	1
Capturing complex hand movements and object interactions using machine learning-powered stretchable smart textile gloves	Oct 3, 2024	Data Augmentation	CodeCode Available	1
Dog-IQA: Standard-guided Zero-shot MLLM for Mix-grained Image Quality Assessment	Oct 3, 2024	Image Quality AssessmentOut-of-Distribution Generalization	CodeCode Available	1
Enhanced MRI brain tumor detection and classification via topological data analysis and low-rank tensor decomposition	Oct 3, 2024	Brain Tumor ClassificationBrain Tumor Segmentation	CodeCode Available	1
BACKTIME: Backdoor Attacks on Multivariate Time Series Forecasting	Oct 3, 2024	EpidemiologyMultivariate Time Series Forecasting	CodeCode Available	1
Custom Non-Linear Model Predictive Control for Obstacle Avoidance in Indoor and Outdoor Environments	Oct 3, 2024	Model Predictive Control	CodeCode Available	1
Spiking Neural Network as Adaptive Event Stream Slicer	Oct 3, 2024	Object Tracking	CodeCode Available	1
Adversarial Decoding: Generating Readable Documents for Adversarial Objectives	Oct 3, 2024	Adversarial TextRAG	CodeCode Available	1
Tutor CoPilot: A Human-AI Approach for Scaling Real-Time Expertise	Oct 3, 2024		CodeCode Available	1
Med-TTT: Vision Test-Time Training model for Medical Image Segmentation	Oct 3, 2024	Image SegmentationMedical Image Segmentation	CodeCode Available	1
General Preference Modeling with Preference Representations for Aligning Language Models	Oct 3, 2024	Language ModellingRepresentation Learning	CodeCode Available	1
MetaMetrics: Calibrating Metrics For Generation Tasks Using Human Preferences	Oct 3, 2024		CodeCode Available	1
Disentangling Textual and Acoustic Features of Neural Speech Representations	Oct 3, 2024	DisentanglementEmotion Recognition	CodeCode Available	1
C-MORL: Multi-Objective Reinforcement Learning through Efficient Discovery of Pareto Front	Oct 3, 2024	continuous-controlContinuous Control	CodeCode Available	1
Boosting Masked ECG-Text Auto-Encoders as Discriminative Learners	Oct 3, 2024	cross-modal alignment	CodeCode Available	1
Inductive Generative Recommendation via Retrieval-based Speculation	Oct 3, 2024	Re-RankingRetrieval	CodeCode Available	1
Long-Sequence Recommendation Models Need Decoupled Embeddings	Oct 3, 2024	Recommendation Systems	CodeCode Available	1
Unleashing the Potential of the Diffusion Model in Few-shot Semantic Segmentation	Oct 3, 2024	Few-Shot Semantic SegmentationImage Generation	CodeCode Available	1
ReLIC: A Recipe for 64k Steps of In-Context Reinforcement Learning for Embodied AI	Oct 3, 2024	Few-Shot Imitation LearningImitation Learning	CodeCode Available	1
POSIX: A Prompt Sensitivity Index For Large Language Models	Oct 3, 2024	Sensitivity	CodeCode Available	1
L-CiteEval: Do Long-Context Models Truly Leverage Context for Responding?	Oct 3, 2024	8kDocument Summarization	CodeCode Available	1
Searching for Efficient Linear Layers over a Continuous Space of Structured Matrices	Oct 3, 2024	Mixture-of-Experts	CodeCode Available	1
DivScene: Benchmarking LVLMs for Object Navigation with Diverse Scenes and Objects	Oct 3, 2024	BenchmarkingImitation Learning	CodeCode Available	1
ColaCare: Enhancing Electronic Health Record Modeling through Large Language Model-Driven Multi-Agent Collaboration	Oct 3, 2024	Decision MakingLanguage Modeling	CodeCode Available	1
Understanding and Mitigating Miscalibration in Prompt Tuning for Vision-Language Models	Oct 3, 2024		CodeCode Available	1
Training Language Models on Synthetic Edit Sequences Improves Code Synthesis	Oct 3, 2024	HumanEvalSynthetic Data Generation	CodeCode Available	1
Why Sample Space Matters: Keyframe Sampling Optimization for LiDAR-based Place Recognition	Oct 3, 2024	Loop Closure DetectionPose Estimation	CodeCode Available	1
BadCM: Invisible Backdoor Attack Against Cross-Modal Learning	Oct 3, 2024	Backdoor AttackCross-Modal Retrieval	CodeCode Available	1
PixelShuffler: A Simple Image Translation Through Pixel Rearrangement	Oct 3, 2024	ColorizationDomain Adaptation	CodeCode Available	1
DaWin: Training-free Dynamic Weight Interpolation for Robust Adaptation	Oct 3, 2024	Multi-Task LearningObject Recognition	CodeCode Available	1
Agents' Room: Narrative Generation through Multi-step Collaboration	Oct 3, 2024		CodeCode Available	1
CriSPO: Multi-Aspect Critique-Suggestion-guided Automatic Prompt Optimization for Text Generation	Oct 3, 2024	Abstractive Text SummarizationHallucination	CodeCode Available	1
Spatial-Temporal Multi-Cuts for Online Multiple-Camera Vehicle Tracking	Oct 3, 2024	Autonomous DrivingMulti-Object Tracking	CodeCode Available	1
Parameter Competition Balancing for Model Merging	Oct 3, 2024	Domain Generalizationmodel	CodeCode Available	1
A New Benchmark In Vivo Paired Dataset for Laparoscopic Image De-smoking	Oct 3, 2024	Image Enhancement	CodeCode Available	1
Collective Critics for Creative Story Generation	Oct 3, 2024	Story Generation	CodeCode Available	1
Mitigating Memorization In Language Models	Oct 3, 2024	Machine UnlearningMemorization	CodeCode Available	1
LLM-Pilot: Characterize and Optimize Performance of your LLM Inference Services	Oct 3, 2024	BenchmarkingGPU	CodeCode Available	1
Immunogenicity Prediction with Dual Attention Enables Vaccine Target Selection	Oct 3, 2024	Deep LearningPrediction	CodeCode Available	1
Agent-Oriented Planning in Multi-Agent Systems	Oct 3, 2024	Scheduling	CodeCode Available	1
Lightweight Diffusion Models for Resource-Constrained Semantic Communication	Oct 3, 2024	QuantizationSemantic Communication	CodeCode Available	1
FastAdaSP: Multitask-Adapted Efficient Inference for Large Speech Language Model	Oct 3, 2024	Emotion RecognitionLanguage Modeling	CodeCode Available	1
EmbedLLM: Learning Compact Representations of Large Language Models	Oct 3, 2024	Decoder	CodeCode Available	1
MA-RLHF: Reinforcement Learning from Human Feedback with Macro Actions	Oct 3, 2024	Code GenerationDialogue Generation	CodeCode Available	1
SymmetricDiffusers: Learning Discrete Diffusion on Finite Symmetric Groups	Oct 3, 2024	Denoising	CodeCode Available	1