GPU

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1851–1900 of 5629 papers

Title	Date	Tasks	Status
Can Large Language Models Predict Parallel Code Performance?	May 6, 2025	GPU	—Unverified
Anant-Net: Breaking the Curse of Dimensionality with Scalable and Interpretable Neural Surrogate for High-Dimensional PDEs	May 6, 2025	GPUKolmogorov-Arnold Networks	—Unverified
Prism: Unleashing GPU Sharing for Cost-Efficient Multi-LLM Serving	May 6, 2025	GPUScheduling	—Unverified
Quantitative Analysis of Performance Drop in DeepSeek Model Quantization	May 5, 2025	GPUQuantization	CodeCode Available
RetroInfer: A Vector-Storage Approach for Scalable Long-Context LLM Inference	May 5, 2025	CPUGPU	—Unverified
QiMeng-Xpiler: Transcompiling Tensor Programs for Deep Learning Systems with a Neural-Symbolic Approach	May 4, 2025	Code GenerationGPU	—Unverified
A UNet Model for Accelerated Preprocessing of CRISM Hyperspectral Data for Mineral Identification on Mars	May 4, 2025	GPU	—Unverified
Sparfels: Fast Reconstruction from Sparse Unposed Imagery	May 4, 2025	GPU	—Unverified
Feature Optimization for Time Series Forecasting via Novel Randomized Uphill Climbing	May 2, 2025	GPUMultivariate Time Series Forecasting	—Unverified
Phantora: Live GPU Cluster Simulation for Machine Learning System Performance Estimation	May 2, 2025	GPU	—Unverified
Efficient On-Chip Implementation of 4D Radar-Based 3D Object Detection on Hailo-8L	May 1, 2025	3D Object DetectionAutonomous Driving	—Unverified
Aggregating empirical evidence from data strategy studies: a case on model quantization	May 1, 2025	GPUQuantization	—Unverified
Sionna RT: Technical Report	Apr 30, 2025	GPU	—Unverified
TF1-EN-3M: Three Million Synthetic Moral Fables for Training Small, Open Language Models	Apr 29, 2025	BenchmarkingDataset Generation	CodeCode Available
Towards Easy and Realistic Network Infrastructure Testing for Large-scale Machine Learning	Apr 29, 2025	CPUGPU	—Unverified
Efficient Domain-adaptive Continual Pretraining for the Process Industry in the German Language	Apr 28, 2025	Continual PretrainingGPU	—Unverified
semi-PD: Towards Efficient LLM Serving via Phase-Wise Disaggregated Computation and Unified Storage	Apr 28, 2025	GPULarge Language Model	—Unverified
Accelerating Mixture-of-Experts Training with Adaptive Expert Replication	Apr 28, 2025	GPUMixture-of-Experts	—Unverified
FlashOverlap: A Lightweight Design for Efficiently Overlapping Communication and Computation	Apr 28, 2025	GPU	—Unverified
NSFlow: An End-to-End FPGA Framework with Scalable Dataflow Architecture for Neuro-Symbolic AI	Apr 27, 2025	GPU	—Unverified
Generative Models for Fast Simulation of Cherenkov Detectors at the Electron-Ion Collider	Apr 26, 2025	BenchmarkingGPU	CodeCode Available
GPU accelerated program synthesis: Enumerate semantics, not syntax!	Apr 26, 2025	CPUGPU	—Unverified
The Big Send-off: High Performance Collectives on GPU-based Supercomputers	Apr 25, 2025	GPULanguage Modeling	—Unverified
L3: DIMM-PIM Integrated Architecture and Coordination for Scalable Long-Context LLM Inference	Apr 24, 2025	GPU	—Unverified
Emo Pillars: Knowledge Distillation to Support Fine-Grained Context-Aware and Context-Less Emotion Classification	Apr 23, 2025	Emotion ClassificationGPU	—Unverified
Fried Parameter Estimation from Single Wavefront Sensor Image with Artificial Neural Networks	Apr 23, 2025	GPUparameter estimation	—Unverified
Democracy of AI Numerical Weather Models: An Example of Global Forecasting with FourCastNetv2 Made by a University Research Lab Using GPU	Apr 23, 2025	GPUWeather Forecasting	—Unverified
Scalable APT Malware Classification via Parallel Feature Extraction and GPU-Accelerated Learning	Apr 22, 2025	GPUMalware Classification	—Unverified
A LoRA-Based Approach to Fine-Tuning LLMs for Educational Guidance in Resource-Constrained Settings	Apr 22, 2025	Computational EfficiencyGPU	CodeCode Available
Hexcute: A Tile-based Programming Language with Automatic Layout and Task-Mapping Synthesis	Apr 22, 2025	GPUQuantization	—Unverified
Splitwiser: Efficient LM inference with constrained resources	Apr 21, 2025	GPUScheduling	CodeCode Available
Beyond Terabit/s Integrated Neuromorphic Photonic Processor for DSP-Free Optical Interconnects	Apr 21, 2025	GPU	—Unverified
Distribution-aware Dataset Distillation for Efficient Image Restoration	Apr 21, 2025	4kDataset Distillation	—Unverified
LithOS: An Operating System for Efficient Machine Learning on GPUs	Apr 21, 2025	BlockingGPU	—Unverified
Robust and Real-time Surface Normal Estimation from Stereo Disparities using Affine Transformations	Apr 21, 2025	GPUSurface Normal Estimation	—Unverified
AlphaZero-Edu: Making AlphaZero Accessible to Everyone	Apr 20, 2025	GPU	CodeCode Available
HPU: High-Bandwidth Processing Unit for Scalable, Cost-effective LLM Inference via GPU Co-processing	Apr 18, 2025	GPU	—Unverified
Quantum Walks-Based Adaptive Distribution Generation with Efficient CUDA-Q Acceleration	Apr 18, 2025	GPU	—Unverified
ARAP-GS: Drag-driven As-Rigid-As-Possible 3D Gaussian Splatting Editing with Diffusion Prior	Apr 17, 2025	3DGSGPU	—Unverified
NNTile: a machine learning framework capable of training extremely large GPT language models on a single node	Apr 17, 2025	CPUGPU	—Unverified
Tilus: A Virtual Machine for Arbitrary Low-Precision GPGPU Computation in LLM Serving	Apr 17, 2025	GPU	—Unverified
Second-order Optimization of Gaussian Splats with Importance Sampling	Apr 17, 2025	3DGSGPU	—Unverified
MOM: Memory-Efficient Offloaded Mini-Sequence Inference for Long Context Language Models	Apr 16, 2025	GPU	—Unverified
Characterizing and Optimizing LLM Inference Workloads on CPU-GPU Coupled Architectures	Apr 16, 2025	CPUGPU	—Unverified
Accelerating Clinical NLP at Scale with a Hybrid Framework with Reduced GPU Demands: A Case Study in Dementia Identification	Apr 16, 2025	GPU	—Unverified
BitNet b1.58 2B4T Technical Report	Apr 16, 2025	Computational EfficiencyCPU	—Unverified
Cost-Efficient LLM Serving in the Cloud: VM Selection with KV Cache Offloading	Apr 16, 2025	GPUText Summarization	CodeCode Available
PatrolVision: Automated License Plate Recognition in the wild	Apr 15, 2025	Autonomous DrivingGPU	—Unverified
Bringing together invertible UNets with invertible attention modules for memory-efficient diffusion models	Apr 15, 2025	DenoisingGPU	—Unverified
ConvShareViT: Enhancing Vision Transformers with Convolutional Attention Mechanisms for Free-Space Optical Accelerators	Apr 15, 2025	GPU	—Unverified

Show:10 25 50

← PrevPage 38 of 113Next →

No leaderboard results yet.