“你们为啥囤卡啊?你们又不训大模型底座...”“因为我们要微调啊”
去年我跟一个创业的朋友聊起来,他们还没有产品,就已经先囤了一波显卡。
今年奔着微调目的去囤卡的创业狗都哭了,倒不是因为搭建微调的软硬件环境有多难受,主要是因为,大模型厂商的价格战一夜之间卷到了模型微调问题上。
不得不感叹,过去一年,大模型变得太快了。
分享一个数字,GPT-4级别的模型价格已经降了200倍了。不止如此,现在已经卷到了模型微调上。
这不,今天我在浏览各个大模型API价格的时候,发现了一个薅羊毛的细节,
在智谱大模型开放平台上,已经悄悄地把GLM-4-flash系列的全部模型设置为免费了,而且,还开启了微调限时免费!!
先去注册的用户能获得500万 tokens (有效期3个月)的免费资源包,都限时免费了,那经验上说,不限时免费也不远了...
想起我们为模型微调交的钱和时间,真是没有对比就没有伤害啊...
免费是好事,但这免费的东西“好不好用”就是另一回事儿了。
抱着这个疑问,笔者从推理和微调效果上分别做了一波测试。
免费的GLM-4-Flash抗打吗?
我先找了个把GPT等一众国内外模型都难哭了的“经典问题”去为难它——
纳尼?不敢想象,一个免费模型竟然做对了?
震惊的我去问了下同样免费的国外大模型担当(GPT-4o-mini):
哇!瞬间国产自信了有没有!
还有一个超出预期的地方,这次免费的GLM-4 Flash,竟然自带联网搜索能力,比如你问它人工智能领域最近一周的新闻:
好家伙,敢情我套壳一下GLM-4-Flash的API就能自己手撸一个AI搜索引擎产品Demo了。
而且,我还不用花钱。
微调是更大的爽点
当然了,对于在深耕AI应用落地的开发者和企业来说,免费的通用大模型虽好,但离了微调环节依然用不起来。
毕竟模型的能力跟它训练阶段见过的数据依然是强关联的。如果模型没见过企业内部知识库、垂直场景的数据,那一定还是做不到实际可落地的效果的。
在一些强依赖模型微调的场景:
比如最简单的分类,在看似相同的分类任务上,不同的业务场景常常有不同的标准,必须通过微调来让模型学习个性化的分类标准。
再比如结构化输出,程序员都深知结构化输出有多香。某一个业务场景下就是需要某种格式的表格,比如银行里填表和工业检测里填表,就完全不一样。这里不仅包括解码阶段的语法规范,还常常涉及一些语义甚至业务逻辑层面的知识训练。要做到高可用性,微调是绕不开的。
再者还有现在企业都非常看重的行业知识、企业知识库,都是在互联网上不存在的数据,像销售话术、医疗诊断、端内数据,如果要在这些场景落地,模型要先微调学习相关的行业知识,才能更好的回答用户的问题。
工具API的调用同样是在互联网上不存在的知识,因此通用大模型往往在工具调用问题上表现的“很傻”,但其实通过少量的样本去微调一把,这种工具API调用的问题也能得到极大的改善。
从这个视角看,也不难理解为什么笔者说能傻瓜式免费微调是更大的爽点了吧!
毕竟如果你要自己微调模型,花钱买卡买机器还是小事儿,关键是软硬件环境的维护、专业人员的配置以及大模型备案等一系列的问题,都会让你觉得“这波创业简直是地狱级的难度”。
好不好试了才知道
想法虽好,但好不好用同样还是要测了才知道。
首先,笔者经过一顿测试,发现GLM-4-Flash并没有读过我们夕小瑶科技说的文章 =,=
不过没关系,咱们去微调一把!
Step 0:进入开发者平台
进入智谱AI开放平台的模型微调页:https://bigmodel.cn/console/modelft/finetuning
小白也能看懂的简单三步:
开干!
Step 1:创建数据集
这里笔者把公众号近期的上百篇文章的后台数据给扒拉了下来,做成了json格式的数据集。
然后将数据集丢给智谱:
Step 2:创建微调任务
配置好后,注意侧边栏的消费金额!
嗯!这个0元让我感觉非常舒适。
我们点击确认创建。就能在任务管理页看到任务进度啦!
由于数据量不多,加上我们选了LoRA微调,分钟级的就训练完了!
走,去试试效果——
稳!
如果免费的500万 tokens不够,官方还新出了一个开发者pro版权益套餐,每月99元,可以享受更多的资源,flash模型每个月的微调和推理的额度分别是1000万 token,还有智谱其他大模型GLM-4、GLM-4V的额度等等。总之,主打一个字:多!
多扯几句,从今年大模型厂商的动作路径其实不难发现——
务实、去泡沫是今年的主旋律。
多扯几句,从今年大模型厂商的动作路径其实不难发现——
务实、去泡沫是今年的主旋律。
AGI不一定会来,更大规模的AI落地一定会。
今年无论做ToB还是ToC,都要仔细评估下智谱的更新节奏,踩对点,做应用落地的开发者能省下不少金钱和心力。
不说了,我去薅羊毛做应用去了。
附 GLM-4-Flash 传送门:https://zhipuaishengchan.datasink.sensorsdata.cn/t/GA