PDPTA 2025

Accelerating TVM LLM Inference via Paged KV-Cache and Customized Kernels on RVV

Shou Chen Chiu, Chun Lin Huang*, Meng Shiun Yu, Ming Zhang Huang, Jenq Kuen Lee (National Tsing Hua University, Taiwan)