GPU

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1951–2000 of 5629 papers

Title	Date	Tasks	Status
Stochastic Engrams for Efficient Continual Learning with Binarized Neural Networks	Mar 27, 2025	Computational EfficiencyContinual Learning	—Unverified
Robust DNN Partitioning and Resource Allocation Under Uncertain Inference Time	Mar 27, 2025	CPUGPU	—Unverified
Self-ReS: Self-Reflection in Large Vision-Language Models for Long Video Understanding	Mar 26, 2025	GPUQuestion Answering	—Unverified
High Quality Diffusion Distillation on a Single GPU with Relative and Absolute Position Matching	Mar 26, 2025	GPUImage Generation	—Unverified
AdaptiVocab: Enhancing LLM Efficiency in Focused Domains through Lightweight Vocabulary Adaptation	Mar 25, 2025	Domain AdaptationGPU	CodeCode Available
Optimizing Breast Cancer Detection in Mammograms: A Comprehensive Study of Transfer Learning, Resolution Reduction, and Multi-View Classification	Mar 25, 2025	Breast Cancer DetectionGPU	—Unverified
PyGraph: Robust Compiler Support for CUDA Graphs in PyTorch	Mar 25, 2025	CPUGPU	—Unverified
Improved Alignment of Modalities in Large Vision Language Models	Mar 25, 2025	GPUImage Captioning	—Unverified
Video-XL-Pro: Reconstructive Token Compression for Extremely Long Video Understanding	Mar 24, 2025	8kGPU	—Unverified
GRiNS: A Python Library for Simulating Gene Regulatory Network Dynamics	Mar 24, 2025	GPU	CodeCode Available
Oaken: Fast and Efficient LLM Serving with Online-Offline Hybrid KV Cache Quantization	Mar 24, 2025	GPULarge Language Model	—Unverified
WindowKV: Task-Adaptive Group-Wise KV Cache Window Selection for Efficient LLM Inference	Mar 23, 2025	GPU	CodeCode Available
Co-SemDepth: Fast Joint Semantic Segmentation and Depth Estimation on Aerial Images	Mar 23, 2025	Autonomous NavigationDepth Estimation	CodeCode Available
V-Seek: Accelerating LLM Reasoning on Open-hardware Server-class RISC-V Platforms	Mar 21, 2025	CPUGPU	—Unverified
Robustness of deep learning classification to adversarial input on GPUs: asynchronous parallel accumulation is a source of vulnerability	Mar 21, 2025	Adversarial RobustnessBayesian Optimization	—Unverified
Temporal Action Detection Model Compression by Progressive Block Drop	Mar 21, 2025	Action DetectionAutonomous Driving	—Unverified
Improving the End-to-End Efficiency of Offline Inference for Multi-LLM Applications Based on Sampling and Simulation	Mar 21, 2025	GPUScheduling	—Unverified
UniCon: Unidirectional Information Flow for Effective Control of Large-Scale Diffusion Models	Mar 21, 2025	GPU	—Unverified
SpeCache: Speculative Key-Value Caching for Efficient Generation of LLMs	Mar 20, 2025	CPUGPU	—Unverified
GauRast: Enhancing GPU Triangle Rasterizers to Accelerate 3D Gaussian Splatting	Mar 20, 2025	3DGSGPU	—Unverified
ML-Triton, A Multi-Level Compilation and Language Extension to Triton GPU Programming	Mar 19, 2025	GPU	—Unverified
Reducing Communication Overhead in Federated Learning for Network Anomaly Detection with Adaptive Client Selection	Mar 19, 2025	Anomaly DetectionFederated Learning	—Unverified
TGBFormer: Transformer-GraphFormer Blender Network for Video Object Detection	Mar 18, 2025	GPUobject-detection	—Unverified
Bolt3D: Generating 3D Scenes in Seconds	Mar 18, 2025	3D geometry3D Reconstruction	—Unverified
Optimized 3D Gaussian Splatting using Coarse-to-Fine Image Frequency Modulation	Mar 18, 2025	3DGSGPU	—Unverified
ClusComp: A Simple Paradigm for Model Compression and Efficient Finetuning	Mar 17, 2025	GPUModel Compression	—Unverified
Long-VMNet: Accelerating Long-Form Video Understanding via Fixed Memory	Mar 17, 2025	FormGPU	—Unverified
MagicDistillation: Weak-to-Strong Video Distillation for Large-Scale Few-Step Synthesis	Mar 17, 2025	GPU	—Unverified
AccelGen: Heterogeneous SLO-Guaranteed High-Throughput LLM Inference Serving for Diverse Applications	Mar 17, 2025	ChunkingGPU	—Unverified
Changing Base Without Losing Pace: A GPU-Efficient Alternative to MatMul in DNNs	Mar 15, 2025	GPU	—Unverified
PIPO: Pipelined Offloading for Efficient Inference on Consumer Devices	Mar 15, 2025	GPUScheduling	—Unverified
Characterizing GPU Resilience and Impact on AI/HPC Systems	Mar 14, 2025	AttributeGPU	—Unverified
Vamba: Understanding Hour-Long Videos with Hybrid Mamba-Transformers	Mar 14, 2025	GPUMamba	—Unverified
Distance-Based Tree-Sliced Wasserstein Distance	Mar 14, 2025	Computational EfficiencyGPU	CodeCode Available
X-EcoMLA: Upcycling Pre-Trained Attention into MLA for Efficient and Extreme KV Compression	Mar 14, 2025	GPU	—Unverified
LLMPerf: GPU Performance Modeling meets Large Language Models	Mar 14, 2025	GPU	CodeCode Available
Cost-effective Deep Learning Infrastructure with NVIDIA GPU	Mar 14, 2025	Deep LearningGPU	CodeCode Available
OuroMamba: A Data-Free Quantization Framework for Vision Mamba Models	Mar 13, 2025	channel selectionContrastive Learning	—Unverified
KV-Distill: Nearly Lossless Learnable Context Compression for LLMs	Mar 13, 2025	GPUQuestion Answering	—Unverified
Speedy MASt3R	Mar 13, 2025	3D Scene ReconstructionGPU	—Unverified
MoE-Gen: High-Throughput MoE Inference on a Single GPU with Module-Based Batching	Mar 12, 2025	GPU	CodeCode Available
Priority-Aware Preemptive Scheduling for Mixed-Priority Workloads in MoE Inference	Mar 12, 2025	BlockingGPU	—Unverified
Sometimes Painful but Certainly Promising: Feasibility and Trade-offs of Language Model Inference at the Edge	Mar 12, 2025	CPUGPU	—Unverified
VideoScan: Enabling Efficient Streaming Video Understanding via Frame-level Semantic Carriers	Mar 12, 2025	GPUStreaming video understanding	—Unverified
MarineGym: A High-Performance Reinforcement Learning Platform for Underwater Robotics	Mar 12, 2025	BenchmarkingGPU	—Unverified
Mind the Memory Gap: Unveiling GPU Bottlenecks in Large-Batch LLM Inference	Mar 11, 2025	GPU	CodeCode Available
Accelerating MoE Model Inference with Expert Sharding	Mar 11, 2025	DecoderGPU	—Unverified
TT-GaussOcc: Test-Time Compute for Self-Supervised Occupancy Prediction via Spatio-Temporal Gaussian Splatting	Mar 11, 2025	GPU	—Unverified
AdaptSR: Low-Rank Adaptation for Efficient and Scalable Real-World Super-Resolution	Mar 10, 2025	GPUSuper-Resolution	—Unverified
Global Context Is All You Need for Parallel Efficient Tractography Parcellation	Mar 10, 2025	AllData Augmentation	—Unverified

Show:10 25 50

← PrevPage 40 of 113Next →

No leaderboard results yet.