大家发现没有,DeepSeek 并没有传说的那样神。 虽然它在开源大模型领域有一定热度,在应用商店下载量中也名列前茅,但在实际使用中,暴露出了诸多不尽如人意的地方。 从准确性角度看,专业工具 NewsGuard 的测评结果令人咋舌,DeepSeek 的准确性得分仅 17%,在 11 个 AI 聊天机器人中排名第 10 。其输出回答中经常出现非中立结果和不准确的结果,30% 的回复包含虚假信息,53% 的回复对查询没有回答,只有 17% 的回复揭穿了虚假声明,性能明显低于行业平均水平 62% 的失败率。 例如在一些涉及新闻和信息主题的问题上,它无法准确提供相关内容,甚至在回答中插入非中立的官方立场,即使问题与该国无关。 它还存在错误信息漏洞,很容易被恶意行为者利用来传播虚假声明。这对于需要精准信息的用户,如科研人员、决策制定者等,无疑是致命缺陷。
vivoX200Ultra样张来了[doge],我就说lyt818,超高转换
【4评论】【4点赞】