GPU

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 201–250 of 5629 papers

Title	Date	Tasks	Status	Hype
Graph-Reward-SQL: Execution-Free Reinforcement Learning for Text-to-SQL via Graph Matching and Stepwise Reward	May 18, 2025	GPUGraph Matching	CodeCode Available	3
Tiny QA Benchmark++: Ultra-Lightweight, Synthetic Multilingual Dataset Generation & Smoke-Tests for Continuous LLM Evaluation	May 17, 2025	Dataset GenerationGPU	CodeCode Available	1
From Hand-Crafted Metrics to Evolved Training-Free Performance Predictors for Neural Architecture Search via Genetic Programming	May 16, 2025	GPUNeural Architecture Search	—Unverified	0
Flash Invariant Point Attention	May 16, 2025	GPU	CodeCode Available	1
HessFormer: Hessians at Foundation Scale	May 16, 2025	GPU	—Unverified	0
Group Think: Multiple Concurrent Reasoning Agents Collaborating at Token Level Granularity	May 16, 2025	GPU	—Unverified	0
Entropy-Driven Genetic Optimization for Deep-Feature-Guided Low-Light Image Enhancement	May 16, 2025	GPUImage Enhancement	CodeCode Available	0
Gaussian Weight Sampling for Scalable, Efficient and Stable Pseudo-Quantization Training	May 16, 2025	GPUQuantization	—Unverified	0
Group-in-Group Policy Optimization for LLM Agent Training	May 16, 2025	GPUMathematical Reasoning	CodeCode Available	5
Accelerating Visual-Policy Learning through Parallel Differentiable Simulation	May 15, 2025	GPU	CodeCode Available	4
VRSplat: Fast and Robust Gaussian Splatting for Virtual Reality	May 15, 2025	3DGSGPU	CodeCode Available	2
SpecOffload: Unlocking Latent GPU Capacity for LLM Inference on Resource-Constrained Devices	May 15, 2025	CPUGPU	CodeCode Available	1
Single-shot prediction of parametric partial differential equations	May 14, 2025	CPUGPU	—Unverified	0
Marigold: Affordable Adaptation of Diffusion-Based Image Generators for Image Analysis	May 14, 2025	DenoisingDepth Estimation	CodeCode Available	7
FlashMLA-ETAP: Efficient Transpose Attention Pipeline for Accelerating MLA Inference on NVIDIA H20 GPUs	May 13, 2025	GPU	CodeCode Available	1
AI Accelerators for Large Language Model In-ference: Architecture Analysis and Scaling Strategies	May 13, 2025	GPULanguage Modeling	—Unverified	0
Scaling Multi Agent Reinforcement Learning for Underwater Acoustic Tracking via Autonomous Vehicles	May 13, 2025	Autonomous VehiclesGPU	—Unverified	0
Generative Molecular Design with Steerable and Granular Synthesizability Control	May 13, 2025	GPU	—Unverified	0
SLAG: Scalable Language-Augmented Gaussian Splatting	May 12, 2025	GPULanguage Modeling	—Unverified	0
On the Cost and Benefits of Training Context with Utterance or Full Conversation Training: A Comparative Stud	May 12, 2025	GPUHallucination	—Unverified	0
Fused3S: Fast Sparse Attention on Tensor Cores	May 12, 2025	GPU	CodeCode Available	0
OnPrem.LLM: A Privacy-Conscious Document Intelligence Toolkit	May 12, 2025	GPUPrivacy Preserving	CodeCode Available	4
Cache-Efficient Posterior Sampling for Reinforcement Learning with LLM-Derived Priors Across Discrete and Continuous Domains	May 12, 2025	continuous-controlContinuous Control	—Unverified	0
Private LoRA Fine-tuning of Open-Source LLMs with Homomorphic Encryption	May 12, 2025	GPUKnowledge Base Question Answering	—Unverified	0
L-SWAG: Layer-Sample Wise Activation with Gradients information for Zero-Shot NAS on Vision Transformers	May 12, 2025	GPUNeural Architecture Search	—Unverified	0
Matrix Is All You Need	May 11, 2025	AllGPU	—Unverified	0
Streaming Krylov-Accelerated Stochastic Gradient Descent	May 11, 2025	GPUStochastic Optimization	—Unverified	0
JaxRobotarium: Training and Deploying Multi-Robot Policies in 10 Minutes	May 10, 2025	BenchmarkingGPU	CodeCode Available	1
QoS-Efficient Serving of Multiple Mixture-of-Expert LLMs Using Partial Runtime Reconfiguration	May 10, 2025	GPUMixture-of-Experts	—Unverified	0
Challenging GPU Dominance: When CPUs Outperform for On-Device LLM Inference	May 9, 2025	CPUGPU	—Unverified	0
FloE: On-the-Fly MoE Inference on Memory-constrained GPU	May 9, 2025	CPUGPU	—Unverified	0
Fast Differentiable Modal Simulation of Non-linear Strings, Membranes, and Plates	May 9, 2025	Audio SynthesisCPU	CodeCode Available	1
Boosting Performance on ARC is a Matter of Perspective	May 8, 2025	ARCGPU	—Unverified	0
UltraGauss: Ultrafast Gaussian Reconstruction of 3D Ultrasound Volumes	May 8, 2025	3D ReconstructionComputational Efficiency	—Unverified	0
Steepest Descent Density Control for Compact 3D Gaussian Splatting	May 8, 2025	3DGSGPU	—Unverified	0
Leveraging Simultaneous Usage of Edge GPU Hardware Engines for Video Face Detection and Recognition	May 7, 2025	Face DetectionFace Recognition	—Unverified	0
FastMap: Revisiting Dense and Scalable Structure from Motion	May 7, 2025	GPU	CodeCode Available	3
Plexus: Taming Billion-edge Graphs with 3D Parallel GNN Training	May 7, 2025	CPUGPU	—Unverified	0
Edge-GPU Based Face Tracking for Face Detection and Recognition Acceleration	May 7, 2025	CPUFace Detection	—Unverified	0
Supporting renewable energy planning and operation with data-driven high-resolution ensemble weather forecast	May 7, 2025	CPUGPU	—Unverified	0
LONGER: Scaling Up Long Sequence Modeling in Industrial Recommenders	May 7, 2025	GPURecommendation Systems	—Unverified	0
Prism: Unleashing GPU Sharing for Cost-Efficient Multi-LLM Serving	May 6, 2025	GPUScheduling	—Unverified	0
Can Large Language Models Predict Parallel Code Performance?	May 6, 2025	GPU	—Unverified	0
NBF at SemEval-2025 Task 5: Light-Burst Attention Enhanced System for Multilingual Subject Recommendation	May 6, 2025	GPURetrieval	—Unverified	0
Anant-Net: Breaking the Curse of Dimensionality with Scalable and Interpretable Neural Surrogate for High-Dimensional PDEs	May 6, 2025	GPUKolmogorov-Arnold Networks	—Unverified	0
AnomalyMatch: Discovering Rare Objects of Interest with Semi-supervised and Active Learning	May 6, 2025	Active LearningAnomaly Detection	CodeCode Available	0
RetroInfer: A Vector-Storage Approach for Scalable Long-Context LLM Inference	May 5, 2025	CPUGPU	—Unverified	0
Quantitative Analysis of Performance Drop in DeepSeek Model Quantization	May 5, 2025	GPUQuantization	CodeCode Available	0
A UNet Model for Accelerated Preprocessing of CRISM Hyperspectral Data for Mineral Identification on Mars	May 4, 2025	GPU	—Unverified	0
Sparfels: Fast Reconstruction from Sparse Unposed Imagery	May 4, 2025	GPU	—Unverified	0

Show:10 25 50

← PrevPage 5 of 113Next →

No leaderboard results yet.