听到一个说法,Deepseek一个很大的突破,是在做训练的时候用英伟达的FP8

海啸喵主子 2025-02-07 15:33:47

听到一个说法, Deepseek一个很大的突破,是在做训练的时候用英伟达的FP8数据类型,这块之前被行业忽略了。并且deepseek自己把整个的系统工程全做了,同时也贡献给了cuda社区,这会让整个训练成本大幅降低,整个行业也因此受益。

0 阅读:0
海啸喵主子

海啸喵主子

感谢大家的关注