新研究发现人工智能搜索工具的平均准确率仅为 60% Tow 数字新闻中心最近研究了八个 AI 搜索引擎,包括 ChatGPT Search、Perplexity、Perplexity Pro、Gemini、DeepSeek Search、Grok-2 Search、Grok-3 Search 和 Copilot。他们测试了每种工具的准确性,并记录了工具拒绝回答的频率。 研究人员从 20 家新闻出版社(每家 10 篇)随机选择了 200 篇新闻报道。他们确保每篇报道在使用文章摘录时都能在 Google 搜索中返回前三个结果。然后,他们在每个人工智能搜索工具中执行相同的查询,并根据搜索是否正确引用了 A)文章、B)新闻机构和 C)URL 来评定准确性。 然后,研究人员根据从"完全正确"到"完全不正确"的准确度给每条搜索贴上标签。从下图中可以看出,除了两个版本的 Perplexity 外,其他人工智能的表现都不理想。总体而言,人工智能搜索引擎有 60% 的时间是不准确的。
新研究发现人工智能搜索工具的平均准确率仅为60% Tow数字新闻中心最近研究
绮梅谈科技
2025-03-12 16:19:15
0
阅读:0