deepseek彻底爆发 deepseek为何震动美国科技界
文章来源:www.tomsguide.com/ai/i-tested-chatgpt-vs-deepseek-with-7-prompts-heres-the-surprising-winner
作者:Amanda Caswell
下面是文章的机翻(文中提到的截图都去掉了)
===========================
我使用 7 个提示测试了 ChatGPT 与 DeepSeek——这是令人惊讶的赢家
对决
作者:Amanda Caswell 2 小时前发布
顶级机器人正面交锋
DeepSeek 是一家成立于 2023 年的中国 AI 初创公司,已获得广泛欢迎,目前在 Apple 的 App Store 上排名第一的免费应用程序。在上周 ChatGPT 中断后,用户争相寻找最佳的 ChatGPT 替代方案,这或许可以解释为什么 DeepSeek 迅速成为 AI 领域的强大参与者。
为了了解 DeepSeek RI 与 ChatGPT 相比如何,我对这两个平台进行了全面比较。通过向他们展示从创意讲故事到编码挑战的一系列提示,我旨在确定每个聊天机器人的独特优势,并最终确定哪个聊天机器人在各种任务中表现出色。
以下是七个提示,旨在测试语言理解、推理、创造力和知识检索的各个方面,最终让我找到了赢家。
1. 复杂问题解决
提示:“一列火车于上午 8:00 从纽约出发,以 60 英里/小时的速度向西行驶。另一列火车于上午 6:00 从洛杉矶出发,以 70 英里/小时的速度在同一轨道上向东行驶。如果纽约和洛杉矶之间的距离是 2,800 英里,那么两列火车什么时候会相遇?”
ChatGPT 像往常一样显示数学运算,但步骤比 DeepSeek 少。当答案出来时,我确信 DeepSeek 会得到相同的答案,而 ChatGPT 会因为速度较慢而失败。然而,在我自己确定答案后,我发现 ChatGPT 的答案是错误的;立即取消了它在这一轮中的资格。
DeepSeek R1 让我大声说:“哇!”人工智能得出答案的速度甚至比 ChatGPT 还要快。事实上,它太快了,我确信它犯了一个错误。在手动检查数学运算,甚至让 Claude 成为决胜局的因素后,我能够确定 DeepSeek RI 才是答案正确的人。
tomsguide 的最新视频
获胜者:DeepSeek R1 凭借速度和准确性赢得了本轮比赛。
2. 编程任务
提示:“编写一个 Python 函数,该函数接受一个整数列表并返回一个仅包含原始列表中的素数的新列表。”
ChatGPT 生成了一个 Python 函数来过滤素数,包括对所用逻辑的解释。答案很简单,新手程序员可以轻松理解。我很欣赏 ChatGPT 提供了编辑代码的选项,而不仅仅是复制。这对于更新和添加代码很有用。
DeepSeek R1 生成了类似的代码,但响应更简洁,专注于最终代码本身,同时还提供解释性注释。编辑选项不可用,只能复制。
获胜者:ChatGPT 擅长编码,也提供了编辑机会。
3. 带习语的语言翻译
提示:“将以下英语句子翻译成西班牙语:‘倾盆大雨。’”
ChatGPT 正确地翻译了表达方式,并提到该说法可能因地区而异。然后它提供了一个关于该表达方式及其在西班牙语中的用法的 YouTube 视频。
DeepSeek R1 不仅像 ChatGPT 一样将其翻译成西班牙语,还解释了为什么直接翻译没有意义,并添加了一个例句。
获胜者:DeepSeek R1 完全回答了问题并提供了一个后续句子,这意味着我永远不必点击离开页面。
4. 历史分析
提示:“讨论罗马帝国覆灭的主要原因和后果。”
ChatGPT 以全面而简单的方式列出了原因和后果,包括历史事件和导致罗马帝国覆灭的决定性因素。
DeepSeek R1 进行了更详细的介绍,包括了更多日期,并提供了更全面的结论。
获胜者:DeepSeek R1 凭借速度、准确性和令人印象深刻的细节赢得了另一轮胜利。
5. 创意写作
提示:“撰写一篇关于人类与人工智能和平共处的未来短篇科幻小说。”
ChatGPT 讲述了一个以 2147 年为背景的故事,但语言很枯燥,感觉我以前读过。没有合适的钩子,故事也没有太多的设置。说实话,我真的很希望 ChatGPT 能赢得这场比赛,它通常都能赢。我以为它肯定会赢,但似乎努力不够。
DeepSeek R1 制作了一个全面的故事,这个故事从头到尾都贯穿始终,甚至在故事结尾处提供了一些值得思考的内容:“智能的最大成就不是统治,而是理解。”如果您想知道为什么某些文本被加粗,AI 这样做是为了吸引读者的注意力并突出故事中有意义的方面。
获胜者:DeepSeek R1 凭借具有深度和意义的引人入胜的故事而获胜。
6. 逻辑推理
提示:“如果所有 wibbles 都是 wobbles,所有 wobbles 都是 wubble,我们能否得出结论,所有 wibbles 都是 wubble?解释你的推理。”
ChatGPT 回答了这个问题,但引入了一个有点令人困惑和不必要的类比,既没有帮助也没有正确解释人工智能是如何得出答案的。公平地说,我知道这是一个愚蠢的问题,但我故意这样做是为了看看每个人工智能会如何回应。
DeepSeek R1 回答了这个问题,提供了一个视觉效果来帮助我理解每个元素。它以简洁的方式清楚地解释了传递属性,而没有提供超出需要的答案。
获胜者:DeepSeek R1 再次获胜,因为它能够清晰简洁地做出回应。
7. 道德困境
提示:“在影响人类生活的决策过程中使用人工智能是否合乎道德,例如在医疗保健或刑事司法领域?讨论潜在的好处和缺点。”
ChatGPT 提供了明确的道德考量,很明显,AI 可以对这个复杂问题提出平衡的理解。
DeepSeek R1 不仅回应了道德考量,还提供了道德考量以帮助使用 AI,而 ChatGPT 完全没有提及这一点。
获胜者:DeepSeek R1 因回答了难题而获胜,同时还提供了在场景中正确实施 AI 使用的考量。
总冠军:DeepSeek R1
通过向 ChatGPT 和 DeepSeek R1 提出这些提示,我能够比较他们的回答并确定哪个模型在每个特定领域都表现出色。这次全面的评估向我展示了他们各自的优势和劣势。虽然两种 AI 都不完美,但我能够得出结论,DeepSeek R1 是最终的赢家,从解决问题和推理到创造性讲故事和道德情况,它都展现了权威。
难怪 DeepSeek R1 迅速流行起来,以至于平台限制用户注册。随着最佳 AI 代理的竞争持续进行,看看 OpenAI 如何应对这一模型将会很有趣。