跟美国怎么比？真的是为国产AI大语言模型捏一把汗！阿里的通义千问、腾讯的混

跟美国怎么比？真的是为国产AI大语言模型捏一把汗！阿里的通义千问、腾讯的混元、科大讯飞的星火认知、背靠清华大学的智谱AI、百川智能，目前它们都是属于“不及格”的水平。相较而言，在“及格”水平以上的国产AI模型恐怕是，百度的文心一言、字节跳动的豆包。对于这样一个提问：我们知道一个程序员一天可以写1024行代码，一个汽车智能驾驶系统估计需要有2千万行代码，我需要在一年内开发出一套这样的高质量系统，请问需要多少程序员？ OpenAI的GPT-4回答得最好，能够根据人类真实世界的实际情况，进行合乎逻辑的推理和运算。其次就要属微软Bing Chat，直接从人类现实世界角度出发和作答，虽然没有进行数学运算，但依然是较为令人满意的参考。谷歌Bard给出的答案，就显得十分勉强。最起码，OpenAI的GPT-4和微软Bing Chat表现出了智能的特征。再回过头来看国产AI大模型。百度文心一言直接当成小学算术应用题目进行处理，整个推理和运算过程详细、清晰且正确。字节跳动豆包则学会了从实际角度考虑和作答，跟微软Bing Chat一样回避了数字运算（认为这样的数学运算并无多大意义）。而阿里通义千问、腾讯混元、科大讯飞星火认知、智谱AI ChatGLM、百川智能，它们暴露出来的问题包括，语言表述在逻辑上混乱，推理和运算错误，等等。只用一个提问来测试不同厂商的AI模型，肯定显得以偏概全；但是好的AI大语言模型在应对具有一定挑战性的问题时，一般都能给出相对好的答案。

2 阅读：10222

只为今生

2023-10-27 19:48

一个是潜心研究好多年，一个是赶鸭子上架催出来的，不好比！

浅谈回复 12-16 07:38
他们是创始者，再没有可模仿的前提下没有大量基础研究是不可能的

浅谈回复 12-16 07:37
他们是创始者，再没有可模仿的前提下，没有大量的基础研究又没有

用户18xxx10

2023-11-04 10:38

任何大模型的基础是云计算！这才是根本，中国目前有阿里云和华为云，美帝多一些！其他国家没有，所以未来就是中美之争！至于模型只是一种算法和高成本投入，只要有需求这些都不是问题！看看华为的盘古大模型！人要学会看到本质！

雪飘回复 01-04 10:18
笑死了，ai的基础是他所学习的内容，所以搜索引擎才是基础。但是嘛，chat可以学习任何内容，国内的这些你懂的，所以我们的大语言模型落后几年不关技术问题。

tb70481554 回复 01-04 06:12
本质是抄作业也需要时间，需求十年二十年前都有，不过别人还没有把作业写出来

用户18xxx31

2023-10-25 06:19

讯飞星火模型经常答非所问，问的次数多了就简单重复上次的回答，纯粹是机器，没有人工的感觉

画风回复 12-06 17:45
文心一言回答不出来就会马上让你换一个话题😂😂😂

零度

2023-11-09 17:57

有锤子用，都是垃圾！！说穿了就一个资料库。包括美国的一样是垃圾，吹嘘过头，如同区块链现在还有几个人提？？

lsp 回复 11-10 05:31
愚蠢至极，自以为是

好名出不来

2024-01-04 23:31

认真对比，字节的和阿里巴巴的最好，成本最合理，适合投资建设。而小编说的1，2适合投简历，专业对口，适合当个人事部经理

老衲法号曹贼

2023-11-18 07:12

如果说GPT是博士生，那国产AI就是幼儿园小小班，而且永远长不大，因为有各种条条框框捆绑着

Dacian 回复 11-29 11:15
感觉11月27发布的浪潮源2.0很不错，模型参数达到了千亿级别。文章里面的模型参数太低了，不上千亿就没法达到智能门槛的。

我有个朋友 回复 01-08 03:18
语不惊人死不休啊

用户15xxx20

2023-10-26 08:47

都是拿人家开源的抄袭模仿的，拿什么比啊。

山鸡的故事 回复 11-04 03:14
你这种全自动喷子比智能ai厉害多了，ai说话还要过一遍数据，你开喷只需要张嘴就行，足够的数据库样本才是智能ai不断进步的核心关键，张嘴就说是抄的，数据库能抄吗？

2023-11-04 08:43

目前是豆包领先，但与GPT还有很大差距，功能没文心一言多，文心一言功能虽多，但限制也多，废物一个，准备卸载了

李子

2023-11-16 12:55

十年前，你敢想象国产车现在的红火吗？此消彼长，大势所趋，已经不容易了，时间上看，国家只要稳定，结果就不会差

用户18xxx21

2023-11-02 19:31

百度文心一言4.0版本基本和chatgpt4.0相差无几，可以说各有千秋，但是总体还是不如4.0，我觉得博主过于悲观了

用户17xxx74 回复 11-08 07:47
我让他写段vba代码，他连结束都没有，就算有，也跑不起来，很简单的那种，还是差很多

用户18xxx21 回复 用户17xxx74 11-08 20:17
各有千秋，有的地方文心一言会胜出，不过总体还是cg胜出

坏坏笑一本正经》

2023-11-07 09:08

我觉得文心一言把这个当成一道数学题目，你没发现这个题目和小学数学很像吗

陆刚-刚刚 回复 12-06 10:14
这还不是数学题

DeanLouw

2023-10-26 12:32

国产都是阉割版，最终都只能走山寨，难堪大用。

掌柜的

2023-11-08 09:06

我让文心一言帮我查带某两个字的古诗，结果给了我三首诗一个都不对，我说这些古诗里不含有我要的词，它说抱歉里面的确没有，我再给你三首，结果里面还是没有。。。

皮都都

2023-11-19 05:27

看了，chatgpt也在糊弄事，中听不中用，还不如百度老老实实算数学

好名出不来 回复 01-04 23:20
确实，一个汽车系统不是按代码分的，是按系统分类来算的，而且人工的失误率也没算进去

用户92xxx62

2023-12-22 06:23

同等于二、三十年前华强北二手手机市场

月淡风清

2024-01-06 23:26

加油干！中国科技！！

老实人

2023-10-25 02:42

起码国产AI还是一天比一天强

大乘根性 回复 11-02 00:38
持续做一件事情总有改善的地方，这自然规律，有什么可说的。

将错误进行到底

2023-10-29 11:11

百度的文心一言还是很可以的，某些方面不比chatgpt差了

我和你

2023-11-02 21:40

一个程序员一天只能写出几十行高质量代码

用户94xxx45 回复 11-22 13:48
真的吗，那跟我一个业余门外汉有何区别

color

2023-11-08 15:50

一年以后，你们喷的应该不是这方面了，国外0到1国内1到无限

用户11xxx94

2023-11-13 23:31

荷鬼抄粉

信念de锚

2023-11-27 04:37

名字都挺好的！[鼓掌]

望尘雪

2023-12-31 23:29

你知道个天井，要水煮

风之谷

2024-01-04 10:49

实测百度文心一言比通义千问差一大截。

田野沐雨

2023-10-25 10:51

你把盘古大模型吃了吗

笔记回复 10-25 21:04
盘古还没怼普通人开放，测试不了

用户13xxx28

2023-11-04 07:53

昆仑的天工可以

菜刀

2023-11-26 01:15

是谁让你在评测国产AI了，要评测就认真评测

用户12xxx08

2024-01-04 11:29

豆包，呵呵，

用户70xxx45

2023-11-03 14:04

免费让你用，还挑三拣四

用户13xxx86

2023-10-31 16:05

把小编拉上去，反正小编啥都能答

红绿灯

2023-11-04 00:00

捏一把汗说明你要去洗澡！国内AI语言模型与国外比有差距，但也不是小编说的那么不堪😂……

2023-11-04 08:03

我以为你捏一把💩呢，还捏一把汗

用户16xxx18

2023-11-07 20:29

国内主要没有顶级英伟达显卡，拿不到货，AI需要算力的

洪水的爱 回复 11-10 01:56
我国的量子计算机不是超越美国么？用量子计算机代替传统运算不就行了

智缺

2023-11-18 14:43

我在一本正经地胡说八道

Burgess--茅台三家坊1915

2023-11-26 09:53

字节的从没听过

闹市隐者

2023-11-09 07:12

你的问题就很有问题让不同的人来看他们心中有不同的答案

跟美国怎么比？真的是为国产AI大语言模型捏一把汗！ 阿里的通义千问、腾讯的混

跟美国怎么比？真的是为国产AI大语言模型捏一把汗！阿里的通义千问、腾讯的混