GPU

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 151–200 of 5629 papers

Title	Date	Tasks	Status	Hype
SceneSplat: Gaussian Splatting-based Scene Understanding with Vision-Language Pretraining	Mar 23, 2025	3DGSBenchmarking	CodeCode Available	3
ZO2: Scalable Zeroth-Order Fine-Tuning for Extremely Large Language Models with Limited GPU Memory	Mar 16, 2025	CPUGPU	CodeCode Available	3
LiteGS: A High-Performance Modular Framework for Gaussian Splatting Training	Mar 3, 2025	3DGSGPU	CodeCode Available	3
SelaVPR++: Towards Seamless Adaptation of Foundation Models for Efficient Place Recognition	Feb 23, 2025	Deep HashingGPU	CodeCode Available	3
Slamming: Training a Speech Language Model on One GPU in a Day	Feb 19, 2025	GPULanguage Modeling	CodeCode Available	3
MetaDE: Evolving Differential Evolution by Differential Evolution	Feb 13, 2025	Computational EfficiencyGPU	CodeCode Available	3
Long-VITA: Scaling Large Multi-modal Models to 1 Million Tokens with Leading Short-Context Accuray	Feb 7, 2025	4kGeneral Knowledge	CodeCode Available	3
Transolver++: An Accurate Neural Solver for PDEs on Million-Scale Geometries	Feb 4, 2025	GPU	CodeCode Available	3
M+: Extending MemoryLLM with Scalable Long-Term Memory	Feb 1, 2025	16kGPU	CodeCode Available	3
How Well Do Supervised 3D Models Transfer to Medical Imaging Tasks?	Jan 20, 2025	Computed Tomography (CT)GPU	CodeCode Available	3
Dataset Distillation with Neural Characteristic Function: A Minmax Perspective	Jan 1, 2025	Computational EfficiencyDataset Distillation	CodeCode Available	3
CLEAR: Conv-Like Linearization Revs Pre-Trained Diffusion Transformers Up	Dec 20, 2024	8kGPU	CodeCode Available	3
PanSplat: 4K Panorama Synthesis with Feed-Forward Gaussian Splatting	Dec 16, 2024	3D Reconstruction4k	CodeCode Available	3
HadaCore: Tensor Core Accelerated Hadamard Transform Kernel	Dec 12, 2024	GPUMMLU	CodeCode Available	3
GraphNeuralNetworks.jl: Deep Learning on Graphs with Julia	Dec 9, 2024	Deep LearningGPU	CodeCode Available	3
APOLLO: SGD-like Memory, AdamW-level Performance	Dec 6, 2024	GPUQuantization	CodeCode Available	3
Pushing the Limits of Large Language Model Quantization via the Linearity Theorem	Nov 26, 2024	GPULanguage Modeling	CodeCode Available	3
MobileMamba: Lightweight Multi-Receptive Visual Mamba Network	Nov 24, 2024	GPUMamba	CodeCode Available	3
Nd-BiMamba2: A Unified Bidirectional Architecture for Multi-Dimensional Data Processing	Nov 22, 2024	Computational EfficiencyCPU	CodeCode Available	3
REDUCIO! Generating 10241024 Video within 16 Seconds using Extremely Compressed Motion Latents	Nov 20, 2024	GPUVideo Generation	CodeCode Available	3
Video-RAG: Visually-aligned Retrieval-Augmented Long Video Comprehension	Nov 20, 2024	GPUMME	CodeCode Available	3
Data Generation for Hardware-Friendly Post-Training Quantization	Oct 29, 2024	Data AugmentationGPU	CodeCode Available	3
ShadowKV: KV Cache in Shadows for High-Throughput Long-Context LLM Inference	Oct 28, 2024	CPU	CodeCode Available	3
Modular Duality in Deep Learning	Oct 28, 2024	Deep LearningGPU	CodeCode Available	3
Breaking the Memory Barrier: Near Infinite Batch Size Scaling for Contrastive Loss	Oct 22, 2024	GPURepresentation Learning	CodeCode Available	3
MagicPIG: LSH Sampling for Efficient LLM Generation	Oct 21, 2024	CPUGPU	CodeCode Available	3
CtrLoRA: An Extensible and Efficient Framework for Controllable Image Generation	Oct 12, 2024	Conditional Image GenerationGPU	CodeCode Available	3
High-Speed Stereo Visual SLAM for Low-Powered Computing Devices	Oct 5, 2024	GPU	CodeCode Available	3
SwiftKV: Fast Prefill-Optimized Inference with Knowledge-Preserving Model Transformation	Oct 4, 2024	16kCode Generation	CodeCode Available	3
LayerKV: Optimizing Large Language Model Serving with Layer-wise KV Cache Management	Oct 1, 2024	GPULanguage Modeling	CodeCode Available	3
Simple and Fast Distillation of Diffusion Models	Sep 29, 2024	GPUImage Generation	CodeCode Available	3
3DGS-LM: Faster Gaussian-Splatting Optimization with Levenberg-Marquardt	Sep 19, 2024	3DGSGPU	CodeCode Available	3
LongLLaVA: Scaling Multi-modal LLMs to 1000 Images Efficiently via a Hybrid Architecture	Sep 4, 2024	GPUMamba	CodeCode Available	3
LinFusion: 1 GPU, 1 Minute, 16K Image	Sep 3, 2024	16kCausal Inference	CodeCode Available	3
InstanSeg: an embedding-based instance segmentation algorithm optimized for accurate, efficient and portable cell segmentation	Aug 28, 2024	Cell SegmentationGPU	CodeCode Available	3
The Mamba in the Llama: Distilling and Accelerating Hybrid Models	Aug 27, 2024	GPULanguage Modeling	CodeCode Available	3
OctFusion: Octree-based Diffusion Models for 3D Shape Generation	Aug 27, 2024	3D Generation3D Shape Generation	CodeCode Available	3
Accelerating Goal-Conditioned RL Algorithms and Research	Aug 20, 2024	GPUreinforcement-learning	CodeCode Available	3
ABQ-LLM: Arbitrary-Bit Quantized Inference Acceleration for Large Language Models	Aug 16, 2024	GPUModel Compression	CodeCode Available	3
LLMServingSim: A HW/SW Co-Simulation Infrastructure for LLM Inference Serving at Scale	Aug 10, 2024	GPULanguage Modelling	CodeCode Available	3
UniBench: Visual Reasoning Requires Rethinking Vision-Language Beyond Scaling	Aug 9, 2024	GPULanguage Modeling	CodeCode Available	3
Practical Video Object Detection via Feature Selection and Aggregation	Jul 29, 2024	feature selectionGPU	CodeCode Available	3
vTensor: Flexible Virtual Tensor Management for Efficient LLM Serving	Jul 22, 2024	CPUGPU	CodeCode Available	3
Inference Performance Optimization for Large Language Models on CPUs	Jul 10, 2024	CPUGPU	CodeCode Available	3
EfficientQAT: Efficient Quantization-Aware Training for Large Language Models	Jul 10, 2024	GPUQuantization	CodeCode Available	3
Consistency Models Made Easy	Jun 20, 2024	Computational EfficiencyGPU	CodeCode Available	3
VisualRWKV: Exploring Recurrent Neural Networks for Visual Language Models	Jun 19, 2024	GPULanguage Modeling	CodeCode Available	3
IMDL-BenCo: A Comprehensive Benchmark and Codebase for Image Manipulation Detection & Localization	Jun 15, 2024	GPUImage Manipulation	CodeCode Available	3
AdaRevD: Adaptive Patch Exiting Reversible Decoder Pushes the Limit of Image Deblurring	Jun 13, 2024	DeblurringDecoder	CodeCode Available	3
Merlin: A Vision Language Foundation Model for 3D Computed Tomography	Jun 10, 2024	3D Semantic SegmentationComputed Tomography (CT)	CodeCode Available	3

Show:10 25 50

← PrevPage 4 of 113Next →

No leaderboard results yet.