Manus又打钱了,继续分享今天的使用实例。
起因是看到有有媒体转载了A16z刚刚更新的AI应用50强,编辑用红圈标出了其中的国产AI应用,用以佐证赢麻了的主题。
这就是我说小厂千万不要害怕营销风评的原因,在很多时候你连曝光权都不会得到平等对待,编辑只认得大厂出品的图标和名字,但实际上这图上还有一堆中国公司推出的AI产品,就这么被开除国籍了。
那么,如果要核实这里面到底有几家中国公司,怎么办?Claude会用知识库的截止日期来做筛选,Grok 3的Deep Research轮次不够,OpenAI的Operator应该可以但200美金我是真没开,最后用Manus解决回放在这里你们可以自己看:
manus.im/share/AppolsjmuwQW9EevzVrRlN?replay=1
manus.im/share/KJDn3CJL4kVXBXiV0mANeU?replay=1
我的指令词是:「这张图上有50款AI产品,请确定其中哪些产品是由中国公司推出的,不要遗漏也不要偷懒,老老实实的对每一家公司进行核实,最后给我一份报告。」
这是一个纯体力活,如果给人(实习生)来做,就是让他把每一家公司的名字写下来,然后一家家的去查,最后给出一个报告,券商之类的机构把工作拆解到执行端,都是这么干的。
AI Agent至少能够起到等量价值,Manus的todo列得很清晰,先用OCR提取图片文本,列出1-50家公司,接着一家家的去做查询,包括搜索关键词、访问官网、确认总部、了解新闻、甚至阅读LindIn,最终告诉我列表里实际上有12款由中国公司推出的产品。(图2)
这个交付成果我是认的,有些带争议的判断,比如它没有把PixAI算进去,是因为PixAI本身总部就设在新加坡,实控团队在国内的消息比较隐蔽,按Manus给自己定的验证标准来看不算遗漏。
这么说吧,如果你要解决类似的需求,你是自己机械性的操作几个小时,不停的开关窗口更新文档,还是把活儿丢给AI Agent牛马去干,只负责验收结果?
另外,从实测体感出发,「不要遗漏也不要偷懒,老老实实的对每一家公司进行核实」这句话也是必加的,原因和我前几天说的模型偷懒本能有关,不刻意强调的话很容易被AI偷工减料。
就像以前的提示词技巧会有情绪勒索的偏方,比如说你要是不认真回答这个世界就会有一个无辜的人死去,然后立竿见影的AI就会用心多了,后来几次训练迭代之后AI已经变聪明了,情绪勒索不再管用,但「请调用你的单次Token消耗上限」这样的明确命令还是偶尔能有奇效。
这次任务也超出了Manus的单任务算力上限,所以拆成了2次完成的,还是那句话,AI Agent发展路上的最大拦路虎,永远是计算资源的分配,芯片会是个好生意,而且不应该只是英伟达的好生意。