马斯克成科技界的汪峰了[泪奔] 之前娱乐圈只要有重磅消息,你看看汪峰保准有新消

钟繇的趣事 2025-02-19 23:05:16

马斯克成科技界的汪峰了[泪奔] 之前娱乐圈只要有重磅消息,你看看汪峰保准有新消息出来,然后被重爆消息带走了流量,大家的关注点就都不在汪峰身上了。 昨儿可有意思了,马斯克喊得多响啊声称「Grok-3是最聪明的AI」,然后奥特曼(OpenAI的CEO)就发消息表示即将开源GPT O3系列模型,还暗示GPT-4.5已经让测试者摸到了AGI门槛。 话里话外,都在表达,「来来来,看我看我,我的AI大模型才是最牛的。」[泪奔] 然后马斯克刚整完Grok-3的发布会,一个小时还没过,DeepSeek就直接丢新论文了。表示颠覆行业的原生稀疏注意力技术NSA+,梁文峰亲自挂帅署名。 笑死哈哈哈哈哈哈哈。 用人话说,就是这篇论文出来,其实告诉大家一个本质问题,当前大模型的架构,很可能有跟自伤就错了,现在一些公司的大模型用全注意力机制去阅读文本,就是连标点符号也不放过,但事实上上人类在阅读的时候,很多时候是抓重点抓框架匆匆扫过但是不影响阅读,而且后者更高效,更节省。 对应到实际应用场景,就是如果这项技术普及,那么我们很可能会解锁上传800页行业报告,AI能几十秒快速提炼出核心趋势和风险点。对于很多做学术读paper的学生来说,用AI快速解析文献也能解决很多很多问题。更具有深远意义的事,这次中方团队抢到了算法创新的牵手,我们第一次提出了被国际学术界认可的基础架构改进。 自从DeepSeek出现,游戏规则就变了,科技界到底谁来引领这次AI革命,大家攻守之势确实已经变了。 另外,值得注意的是这篇论文的第一作者是北大实习生,梁文峰挂名倒数第二,DeepSeek这个带新人的思路,比某些大厂高管抢第一作的吃相好看很多。[狗头] 大家怎么看的?

0 阅读:37
钟繇的趣事

钟繇的趣事

感谢大家的关注