Deepseek团队发表论文了!论文第一作者是北大硕士实习生,梁文锋也署名了。论

邦立评娱乐 2025-02-19 08:27:50

Deepseek团队发表论文了!

论文第一作者是北大硕士实习生,

梁文锋也署名了。

论文精彩之处在于:

介绍了一种NSA架构机制可用于长文本上下文推理,能实现长文本处理上的“降本增效”!

对于大模型算法厂商来说无疑是一大福音:

这相当于Deepseek公开了核心专利,

有需要的大模型厂商可以直接用。

Deepseek这是真开源啊!

0 阅读:2
邦立评娱乐

邦立评娱乐

感谢大家的关注