跟美国怎么比?真的是为国产AI大语言模型捏一把汗!   阿里的通义千问、腾讯的混

我为科技狂鸭 2023-10-24 17:38:35

跟美国怎么比?真的是为国产AI大语言模型捏一把汗!   阿里的通义千问、腾讯的混元、科大讯飞的星火认知、背靠清华大学的智谱AI、百川智能,目前它们都是属于“不及格”的水平。相较而言,在“及格”水平以上的国产AI模型恐怕是,百度的文心一言、字节跳动的豆包。   对于这样一个提问:我们知道一个程序员一天可以写1024行代码,一个汽车智能驾驶系统估计需要有2千万行代码,我需要在一年内开发出一套这样的高质量系统,请问需要多少程序员?   OpenAI的GPT-4回答得最好,能够根据人类真实世界的实际情况,进行合乎逻辑的推理和运算。其次就要属微软Bing Chat,直接从人类现实世界角度出发和作答,虽然没有进行数学运算,但依然是较为令人满意的参考。谷歌Bard给出的答案,就显得十分勉强。最起码,OpenAI的GPT-4和微软Bing Chat表现出了智能的特征。   再回过头来看国产AI大模型。百度文心一言直接当成小学算术应用题目进行处理,整个推理和运算过程详细、清晰且正确。字节跳动豆包则学会了从实际角度考虑和作答,跟微软Bing Chat一样回避了数字运算(认为这样的数学运算并无多大意义)。而阿里通义千问、腾讯混元、科大讯飞星火认知、智谱AI ChatGLM、百川智能,它们暴露出来的问题包括,语言表述在逻辑上混乱,推理和运算错误,等等。 只用一个提问来测试不同厂商的AI模型,肯定显得以偏概全;但是好的AI大语言模型在应对具有一定挑战性的问题时,一般都能给出相对好的答案。

2 阅读:10222
评论列表
  • 2023-10-27 19:48

    一个是潜心研究好多年,一个是赶鸭子上架催出来的,不好比!

    浅谈 回复:
    他们是创始者,再没有可模仿的前提下没有大量基础研究是不可能的
    浅谈 回复:
    他们是创始者,再没有可模仿的前提下,没有大量的基础研究又没有
  • 2023-11-04 10:38

    任何大模型的基础是云计算!这才是根本,中国目前有阿里云和华为云,美帝多一些!其他国家没有,所以未来就是中美之争!至于模型只是一种算法和高成本投入,只要有需求这些都不是问题!看看华为的盘古大模型!人要学会看到本质!

    紧缩的瞳孔 回复:
    华为的盘古方向是服务他的客户,应用的方向也是比较局限的工业服务和生活服务,但你没有明白国内所有模型的本质:它没有底层的算法逻辑,都是套用的国外开放模型,在别人的底价上发展起来的套壳应用,说白了就是用别人的底层框架做的适合于自身的app模型,所以别人给不给你继续开放,或者开不开放升级版的“智慧”底架模型?除了现在的百度问心一言,国内上百个所谓的大模型更多是像一个app应用,它没有底层逻辑能力,就是真正人工智能ai所必需的算法,这个算法老美是搞了10年的研究,集合全球天才计算机大神,包括数学、物理、语言、图形等,而且它的底层逻辑是预测和推理以及逻辑判断这三个核心点,国内目前除了问心一言有些靠近,其余都是水货,基本不举备真正的底层算法能力
    浅谈 回复:
    本质就是算法,这种系统也是赢者通吃的游戏。谁的算法更先进谁就能占领市场其他就淘汰了。和手机系统不一样吗?就是一个算法,但一但建立统治地位强者越强,
  • 2023-10-25 06:19

    讯飞星火模型经常答非所问,问的次数多了就简单重复上次的回答,纯粹是机器,没有人工的感觉

    画风 回复:
    文心一言回答不出来就会马上让你换一个话题😂😂😂
  • 零度 11
    2023-11-09 17:57

    有锤子用,都是垃圾!!说穿了就一个资料库。包括美国的一样是垃圾,吹嘘过头,如同区块链现在还有几个人提??

    lsp 回复:
    愚蠢至极,自以为是
  • 2024-01-04 23:31

    认真对比,字节的和阿里巴巴的最好,成本最合理,适合投资建设。而小编说的1,2适合投简历,专业对口,适合当个人事部经理

  • 2023-11-18 07:12

    如果说GPT是博士生,那国产AI就是幼儿园小小班,而且永远长不大,因为有各种条条框框捆绑着

    Dacian 回复:
    感觉11月27发布的浪潮源2.0很不错,模型参数达到了千亿级别。文章里面的模型参数太低了,不上千亿就没法达到智能门槛的。
    我有个朋友 回复:
    语不惊人死不休啊
  • 2023-10-26 08:47

    都是拿人家开源的抄袭模仿的,拿什么比啊。

    山鸡的故事 回复:
    你这种全自动喷子比智能ai厉害多了,ai说话还要过一遍数据,你开喷只需要张嘴就行,足够的数据库样本才是智能ai不断进步的核心关键,张嘴就说是抄的,数据库能抄吗?
  • 2023-11-04 08:43

    目前是豆包领先,但与GPT还有很大差距,功能没文心一言多,文心一言功能虽多,但限制也多,废物一个,准备卸载了

  • 2023-11-16 12:55

    十年前,你敢想象国产车现在的红火吗?此消彼长,大势所趋,已经不容易了,时间上看,国家只要稳定,结果就不会差

  • 2023-11-02 19:31

    百度文心一言4.0版本基本和chatgpt4.0相差无几,可以说各有千秋,但是总体还是不如4.0,我觉得博主过于悲观了

    用户17xxx74 回复:
    我让他写段vba代码,他连结束都没有,就算有,也跑不起来,很简单的那种,还是差很多
    用户18xxx21 回复: 用户17xxx74
    各有千秋,有的地方文心一言会胜出,不过总体还是cg胜出
  • 2023-11-07 09:08

    我觉得文心一言把这个当成一道数学题目,你没发现这个题目和小学数学很像吗

    陆刚-刚刚 回复:
    这还不是数学题
  • 2023-10-26 12:32

    国产都是阉割版,最终都只能走山寨,难堪大用。

  • 2023-11-08 09:06

    我让文心一言帮我查带某两个字的古诗,结果给了我三首诗一个都不对,我说这些古诗里不含有我要的词,它说抱歉里面的确没有,我再给你三首,结果里面还是没有。。。

  • 2023-11-19 05:27

    看了,chatgpt也在糊弄事,中听不中用,还不如百度老老实实算数学

    好名出不来 回复:
    确实,一个汽车系统不是按代码分的,是按系统分类来算的,而且人工的失误率也没算进去
  • 2023-12-22 06:23

    同等于二、三十年前华强北二手手机市场

  • 2024-01-06 23:26

    加油干!中国科技!!

  • 2023-10-25 02:42

    起码国产AI还是一天比一天强

    大乘根性 回复:
    持续做一件事情总有改善的地方,这自然规律,有什么可说的。
  • 2023-10-29 11:11

    百度的文心一言还是很可以的,某些方面不比chatgpt差了

  • 2023-11-02 21:40

    一个程序员一天只能写出几十行高质量代码

    用户94xxx45 回复:
    真的吗,那跟我一个业余门外汉有何区别
  • 2023-11-08 15:50

    一年以后,你们喷的应该不是这方面了,国外0到1国内1到无限

  • 2023-11-13 23:31

    荷鬼抄粉

  • 2023-11-27 04:37

    名字都挺好的![鼓掌]

  • 2023-12-31 23:29

    你知道个天井,要水煮

  • 2024-01-04 10:49

    实测百度文心一言比通义千问差一大截。

  • 2023-10-25 10:51

    你把盘古大模型吃了吗

    笔记 回复:
    盘古还没怼普通人开放,测试不了
  • 2023-11-04 07:53

    昆仑的天工可以

  • 2023-11-26 01:15

    是谁让你在评测国产AI了,要评测就认真评测

  • 2024-01-04 11:29

    豆包,呵呵,

  • 2023-11-03 14:04

    免费让你用,还挑三拣四

  • 2023-10-31 16:05

    把小编拉上去,反正小编啥都能答

  • 2023-11-04 00:00

    捏一把汗说明你要去洗澡!国内AI语言模型与国外比有差距,但也不是小编说的那么不堪😂……

  • 2023-11-04 08:03

    我以为你捏一把💩呢,还捏一把汗

  • 2023-11-07 20:29

    国内主要没有顶级英伟达显卡,拿不到货,AI需要算力的

    洪水的爱 回复:
    我国的量子计算机不是超越美国么?用量子计算机代替传统运算不就行了
  • 2023-11-18 14:43

    我在一本正经地胡说八道

  • 字节的从没听过

  • 2023-11-09 07:12

    你的问题就很有问题 让不同的人来看 他们心中有不同的答案