trie
Trie¶
sglang 里面使用的 Radix attention,就是使用了 trie 的升级版 radix tree
CSR matrix¶
https://docs.scipy.org/doc/scipy/reference/generated/scipy.sparse.csr_matrix.html
稀疏矩阵的存储方式;核心思想是仅仅存储原来矩阵中非零元素的数值和索引来达到节省内存的目的
sglang 里面使用的 Radix attention,就是使用了 trie 的升级版 radix tree
https://docs.scipy.org/doc/scipy/reference/generated/scipy.sparse.csr_matrix.html
稀疏矩阵的存储方式;核心思想是仅仅存储原来矩阵中非零元素的数值和索引来达到节省内存的目的