在北大和deepseek发表那篇引发关注的原生稀疏注意力NSA论文( )后,MIT博士Songlin Yang(松琳)根据论文做了个开源实现,项目托管在:github.com/fla-org/native-sparse-attention
通过基准测试(图2)也证实了其高效性。
在北大和deepseek发表那篇引发关注的原生稀疏注意力NSA论文( )后,MIT博士Songlin Yang(松琳)根据论文做了个开源实现,项目托管在:github.com/fla-org/native-sparse-attention
通过基准测试(图2)也证实了其高效性。
猜你喜欢
【1点赞】
【27评论】【77点赞】
【5评论】【6点赞】
【3评论】【47点赞】
【275评论】【51点赞】
作者最新文章
热门分类
科技TOP
科技最新文章