XunhaoLai

XunhaoLai XunhaoLai

Achievements

ByteDance-Seed/FlexPrefill ByteDance-Seed/FlexPrefill Public

Code for paper: [ICLR2025 Oral] FlexPrefill: A Context-Aware Sparse Attention Mechanism for Efficient Long-Sequence Inference

Python 160 9
native-sparse-attention-triton native-sparse-attention-triton Public

Efficient triton implementation of Native Sparse Attention.

Python 257 18
ring-sliding-window-attention ring-sliding-window-attention Public

Ring sliding window attention implementation with flash attention

Python 8