本次测试“识别图片文字并提取排版”,这个是最常用的AI使用场景之一,从图片提取文字再按要求排版。
输入的图片是App Store的一张AI热闹应用首先要求豆包和Kimi提取文字,Kimi胜豆包提取的文字
kimi提取的文字
按要求添加这些Ai应用所属公司,豆包和kimi都很失败豆包无法理解添加所属公司,只知道从图片查找文字
kimi能理解所属公司,并去搜索和匹配,但没有正确是增加,而把原文字删除了
让kimi保留原文字,总算加回来了
接着要求改变序号的连接符号,豆包完胜豆包是纯文本,能正确理解“把序号的点换成顿号”
kimi无法理解这个需求,还一本正经说干好了
最后是输出图片分享,豆包和kimi都失败,生硬把最后一个要求做为标题了,失去了上下文。kimi生硬生成分享图片
豆包生硬生成分享图片
在生成分享图片方面,豆包和kimi都算失败1、豆包和kimi都是生硬生成图片,没有使用最先的标题,而是最后一条对话内容。
2、豆包在底下瞎标注AI风险,kimi没有多此一举。
3、豆包是对话框样式,kimi是对话帖模式,更喜欢kimi这种分享图片模式。
宽哥额外增加一项测试:提取Logo豆包没有这个功能,并且瞎反馈内容
kimi也没有这个功能,但备用回答的内容让人满意
这个属于“无此功能”的测试,kimi明显比豆包更AI。
结论好了,以上是宽哥对豆包和kimi的关于“从图片提取文字并按要求排版”的简单操作,总体来说一个AI应用很难满足我们的日常需求。贴出我最满意的结果内容:
1、豆包 - 抖音旗下 AI 智能助手,AI全智能聊天对话问答助手,搜索写作翻译编程全能工具
所属公司:字节跳动公司
2、Kimi 智能助手,AI深度搜索 拍照答疑 智能聊天问答 阅读创作 翻译编程
所属公司:北京月之暗面科技有限公司
3、文小言-原文心一言 APP,百度旗下新搜索智能助手 有问题,问小言
所属公司:百度公司
4、通义 - 你的全能 AI 助手,原通义千问
所属公司:阿里巴巴集团
5、智谱清言,AI视频通话清影图文生视频,搜索写作画图长文本解读智…
所属公司:北京智谱华章科技有限公司
6、讯飞星火-懂你的 AI 助手,智能问答 文案创作 文档阅读 PPT 生成 AI 绘画 联网搜索
所属公司:科大讯飞公司
7、天工,搜索更深度 阅读更多彩
所属公司:昆仑万维科技股份有限公司
8、WHEE-高品质的 AI 素材生成器,专业设计师都在用的 AI 生图工具
所属公司:美图公司
9、海螺 AI-你的智能伙伴,智能搜索 识别图片 语音通话 写作助手 文件速读
所属公司:上海稀宇科技有限公司(MiniMax)
10、Hi Echo - 虚拟人口语私教,网易有道重磅出品
所属公司:网易有道
11、星野-所建皆你所 AI,多模态智能体内容社区
所属公司:上海稀宇科技有限公司(MiniMax)
12、筑梦岛,AI虚拟人物智能互动聊天情感陪伴
所属公司:上海阅文信息技术有限公司
13、百小应,懂搜索的 AI 助手 智能创作 文档解读 问答助手 辅助编程
所属公司:百度公司
14、腾讯元宝-发现 AI 新体验,轻松工作,多点生活
所属公司:腾讯公司
END