#iPhone16或全系标配8GB内存#果子虽然另辟蹊径搞了个针对LLM的“内存

风云中的机海 2024-07-03 11:30:28

#iPhone16或全系标配8GB内存#果子虽然另辟蹊径搞了个针对LLM的“内存优化”技术,能从闪存“草船借箭”,但是主打本地布署策略的它对内存的占用还是会水涨船高,怕之前的小水管影响果粉体验,抠不拉几的库克无奈才为下代iPhone提升了DRAM容量。

果子的技术路线我早在之前的V+长文里做过科普,截选一段,供延迟满足能力较强的粉丝观看吧:

苹果不对大模型进行压缩,但是却对内存进行优化管理,具体是将模型参数存储在至少比DRAM大一个数量级的闪存(Nand Flash)上,然后在推理过程中直接且巧妙地从闪存中加载所需的参数。

不得不说,苹果这个方法很绝,闪存目前的高端机动辄512GB、1TB,甭管你是步署70亿参数还是130亿参数,甚至千亿参数的LLM,都完全能装得下,只不过,苹果的方案,对技术实力的要求更高了一个Level:

通过Windowing+Row-Column Bundling这两项关键技术实现最小化数据传输最大化闪存吞吐量的效果,同时借助A系列芯片的强悍CPU与GPU算力来提升速率,最终理论上能实现等同甚至反超OV的压缩方案的效果。

当然,这只是理论预测,实际表现,还要等实测[笑哈哈]

0 阅读:24