跟美国怎么比?真的是为国产AI大语言模型捏一把汗!   阿里的通义千问、腾讯的混

我为科技狂鸭 2023-10-24 17:38:35

跟美国怎么比?真的是为国产AI大语言模型捏一把汗!   阿里的通义千问、腾讯的混元、科大讯飞的星火认知、背靠清华大学的智谱AI、百川智能,目前它们都是属于“不及格”的水平。相较而言,在“及格”水平以上的国产AI模型恐怕是,百度的文心一言、字节跳动的豆包。   对于这样一个提问:我们知道一个程序员一天可以写1024行代码,一个汽车智能驾驶系统估计需要有2千万行代码,我需要在一年内开发出一套这样的高质量系统,请问需要多少程序员?   OpenAI的GPT-4回答得最好,能够根据人类真实世界的实际情况,进行合乎逻辑的推理和运算。其次就要属微软Bing Chat,直接从人类现实世界角度出发和作答,虽然没有进行数学运算,但依然是较为令人满意的参考。谷歌Bard给出的答案,就显得十分勉强。最起码,OpenAI的GPT-4和微软Bing Chat表现出了智能的特征。   再回过头来看国产AI大模型。百度文心一言直接当成小学算术应用题目进行处理,整个推理和运算过程详细、清晰且正确。字节跳动豆包则学会了从实际角度考虑和作答,跟微软Bing Chat一样回避了数字运算(认为这样的数学运算并无多大意义)。而阿里通义千问、腾讯混元、科大讯飞星火认知、智谱AI ChatGLM、百川智能,它们暴露出来的问题包括,语言表述在逻辑上混乱,推理和运算错误,等等。 只用一个提问来测试不同厂商的AI模型,肯定显得以偏概全;但是好的AI大语言模型在应对具有一定挑战性的问题时,一般都能给出相对好的答案。

2 阅读:10222

评论列表

只为今生

只为今生

21
2023-10-27 19:48

一个是潜心研究好多年,一个是赶鸭子上架催出来的,不好比!

浅谈 回复 12-16 07:38
他们是创始者,再没有可模仿的前提下没有大量基础研究是不可能的

浅谈 回复 12-16 07:37
他们是创始者,再没有可模仿的前提下,没有大量的基础研究又没有

用户18xxx10

用户18xxx10

16
2023-11-04 10:38

任何大模型的基础是云计算!这才是根本,中国目前有阿里云和华为云,美帝多一些!其他国家没有,所以未来就是中美之争!至于模型只是一种算法和高成本投入,只要有需求这些都不是问题!看看华为的盘古大模型!人要学会看到本质!

雪飘 回复 01-04 10:18
笑死了,ai的基础是他所学习的内容,所以搜索引擎才是基础。但是嘛,chat可以学习任何内容,国内的这些你懂的,所以我们的大语言模型落后几年不关技术问题。

tb70481554 回复 01-04 06:12
本质是抄作业也需要时间,需求十年二十年前都有,不过别人还没有把作业写出来

用户18xxx31

用户18xxx31

11
2023-10-25 06:19

讯飞星火模型经常答非所问,问的次数多了就简单重复上次的回答,纯粹是机器,没有人工的感觉

画风 回复 12-06 17:45
文心一言回答不出来就会马上让你换一个话题😂😂😂

零度

零度

11
2023-11-09 17:57

有锤子用,都是垃圾!!说穿了就一个资料库。包括美国的一样是垃圾,吹嘘过头,如同区块链现在还有几个人提??

lsp 回复 11-10 05:31
愚蠢至极,自以为是

好名出不来

好名出不来

11
2024-01-04 23:31

认真对比,字节的和阿里巴巴的最好,成本最合理,适合投资建设。而小编说的1,2适合投简历,专业对口,适合当个人事部经理

老衲法号曹贼

老衲法号曹贼

9
2023-11-18 07:12

如果说GPT是博士生,那国产AI就是幼儿园小小班,而且永远长不大,因为有各种条条框框捆绑着

Dacian 回复 11-29 11:15
感觉11月27发布的浪潮源2.0很不错,模型参数达到了千亿级别。文章里面的模型参数太低了,不上千亿就没法达到智能门槛的。

我有个朋友 回复 01-08 03:18
语不惊人死不休啊

用户15xxx20

用户15xxx20

8
2023-10-26 08:47

都是拿人家开源的抄袭模仿的,拿什么比啊。

山鸡的故事 回复 11-04 03:14
你这种全自动喷子比智能ai厉害多了,ai说话还要过一遍数据,你开喷只需要张嘴就行,足够的数据库样本才是智能ai不断进步的核心关键,张嘴就说是抄的,数据库能抄吗?

老衲法号曹贼

老衲法号曹贼

8
2023-11-04 08:43

目前是豆包领先,但与GPT还有很大差距,功能没文心一言多,文心一言功能虽多,但限制也多,废物一个,准备卸载了

李子

李子

8
2023-11-16 12:55

十年前,你敢想象国产车现在的红火吗?此消彼长,大势所趋,已经不容易了,时间上看,国家只要稳定,结果就不会差

用户18xxx21

用户18xxx21

4
2023-11-02 19:31

百度文心一言4.0版本基本和chatgpt4.0相差无几,可以说各有千秋,但是总体还是不如4.0,我觉得博主过于悲观了

用户17xxx74 回复 11-08 07:47
我让他写段vba代码,他连结束都没有,就算有,也跑不起来,很简单的那种,还是差很多

用户18xxx21 回复 用户17xxx74 11-08 20:17
各有千秋,有的地方文心一言会胜出,不过总体还是cg胜出

坏坏笑一本正经》

坏坏笑一本正经》

4
2023-11-07 09:08

我觉得文心一言把这个当成一道数学题目,你没发现这个题目和小学数学很像吗

陆刚-刚刚 回复 12-06 10:14
这还不是数学题

DeanLouw

DeanLouw

3
2023-10-26 12:32

国产都是阉割版,最终都只能走山寨,难堪大用。

掌柜的

掌柜的

3
2023-11-08 09:06

我让文心一言帮我查带某两个字的古诗,结果给了我三首诗一个都不对,我说这些古诗里不含有我要的词,它说抱歉里面的确没有,我再给你三首,结果里面还是没有。。。

皮都都

皮都都

3
2023-11-19 05:27

看了,chatgpt也在糊弄事,中听不中用,还不如百度老老实实算数学

好名出不来 回复 01-04 23:20
确实,一个汽车系统不是按代码分的,是按系统分类来算的,而且人工的失误率也没算进去

用户92xxx62

用户92xxx62

3
2023-12-22 06:23

同等于二、三十年前华强北二手手机市场

月淡风清

月淡风清

3
2024-01-06 23:26

加油干!中国科技!!

老实人

老实人

2
2023-10-25 02:42

起码国产AI还是一天比一天强

大乘根性 回复 11-02 00:38
持续做一件事情总有改善的地方,这自然规律,有什么可说的。

将错误进行到底

将错误进行到底

2
2023-10-29 11:11

百度的文心一言还是很可以的,某些方面不比chatgpt差了

我和你

我和你

2
2023-11-02 21:40

一个程序员一天只能写出几十行高质量代码

用户94xxx45 回复 11-22 13:48
真的吗,那跟我一个业余门外汉有何区别

color

color

2
2023-11-08 15:50

一年以后,你们喷的应该不是这方面了,国外0到1国内1到无限

用户11xxx94

用户11xxx94

2
2023-11-13 23:31

荷鬼抄粉

信念de锚

信念de锚

2
2023-11-27 04:37

名字都挺好的![鼓掌]

望尘雪

望尘雪

2
2023-12-31 23:29

你知道个天井,要水煮

风之谷

风之谷

2
2024-01-04 10:49

实测百度文心一言比通义千问差一大截。

田野沐雨

田野沐雨

1
2023-10-25 10:51

你把盘古大模型吃了吗

笔记 回复 10-25 21:04
盘古还没怼普通人开放,测试不了

用户13xxx28

用户13xxx28

1
2023-11-04 07:53

昆仑的天工可以

菜刀

菜刀

1
2023-11-26 01:15

是谁让你在评测国产AI了,要评测就认真评测

用户12xxx08

用户12xxx08

1
2024-01-04 11:29

豆包,呵呵,

用户70xxx45

用户70xxx45

1
2023-11-03 14:04

免费让你用,还挑三拣四

用户13xxx86

用户13xxx86

2023-10-31 16:05

把小编拉上去,反正小编啥都能答

红绿灯

红绿灯

2023-11-04 00:00

捏一把汗说明你要去洗澡!国内AI语言模型与国外比有差距,但也不是小编说的那么不堪😂……

用户13xxx86

用户13xxx86

2023-11-04 08:03

我以为你捏一把💩呢,还捏一把汗

用户16xxx18

用户16xxx18

2023-11-07 20:29

国内主要没有顶级英伟达显卡,拿不到货,AI需要算力的

洪水的爱 回复 11-10 01:56
我国的量子计算机不是超越美国么?用量子计算机代替传统运算不就行了

智缺

智缺

2023-11-18 14:43

我在一本正经地胡说八道

Burgess--茅台三家坊1915

Burgess--茅台三家坊1915

2023-11-26 09:53

字节的从没听过

闹市隐者

闹市隐者

2023-11-09 07:12

你的问题就很有问题 让不同的人来看 他们心中有不同的答案

我为科技狂鸭

我为科技狂鸭

感谢大家的关注