跟美国怎么比?真的是为国产AI大语言模型捏一把汗! 阿里的通义千问、腾讯的混元、科大讯飞的星火认知、背靠清华大学的智谱AI、百川智能,目前它们都是属于“不及格”的水平。相较而言,在“及格”水平以上的国产AI模型恐怕是,百度的文心一言、字节跳动的豆包。 对于这样一个提问:我们知道一个程序员一天可以写1024行代码,一个汽车智能驾驶系统估计需要有2千万行代码,我需要在一年内开发出一套这样的高质量系统,请问需要多少程序员? OpenAI的GPT-4回答得最好,能够根据人类真实世界的实际情况,进行合乎逻辑的推理和运算。其次就要属微软Bing Chat,直接从人类现实世界角度出发和作答,虽然没有进行数学运算,但依然是较为令人满意的参考。谷歌Bard给出的答案,就显得十分勉强。最起码,OpenAI的GPT-4和微软Bing Chat表现出了智能的特征。 再回过头来看国产AI大模型。百度文心一言直接当成小学算术应用题目进行处理,整个推理和运算过程详细、清晰且正确。字节跳动豆包则学会了从实际角度考虑和作答,跟微软Bing Chat一样回避了数字运算(认为这样的数学运算并无多大意义)。而阿里通义千问、腾讯混元、科大讯飞星火认知、智谱AI ChatGLM、百川智能,它们暴露出来的问题包括,语言表述在逻辑上混乱,推理和运算错误,等等。 只用一个提问来测试不同厂商的AI模型,肯定显得以偏概全;但是好的AI大语言模型在应对具有一定挑战性的问题时,一般都能给出相对好的答案。
一个是潜心研究好多年,一个是赶鸭子上架催出来的,不好比!
任何大模型的基础是云计算!这才是根本,中国目前有阿里云和华为云,美帝多一些!其他国家没有,所以未来就是中美之争!至于模型只是一种算法和高成本投入,只要有需求这些都不是问题!看看华为的盘古大模型!人要学会看到本质!
讯飞星火模型经常答非所问,问的次数多了就简单重复上次的回答,纯粹是机器,没有人工的感觉
有锤子用,都是垃圾!!说穿了就一个资料库。包括美国的一样是垃圾,吹嘘过头,如同区块链现在还有几个人提??
认真对比,字节的和阿里巴巴的最好,成本最合理,适合投资建设。而小编说的1,2适合投简历,专业对口,适合当个人事部经理
如果说GPT是博士生,那国产AI就是幼儿园小小班,而且永远长不大,因为有各种条条框框捆绑着
都是拿人家开源的抄袭模仿的,拿什么比啊。
目前是豆包领先,但与GPT还有很大差距,功能没文心一言多,文心一言功能虽多,但限制也多,废物一个,准备卸载了
十年前,你敢想象国产车现在的红火吗?此消彼长,大势所趋,已经不容易了,时间上看,国家只要稳定,结果就不会差
百度文心一言4.0版本基本和chatgpt4.0相差无几,可以说各有千秋,但是总体还是不如4.0,我觉得博主过于悲观了
我觉得文心一言把这个当成一道数学题目,你没发现这个题目和小学数学很像吗
国产都是阉割版,最终都只能走山寨,难堪大用。
我让文心一言帮我查带某两个字的古诗,结果给了我三首诗一个都不对,我说这些古诗里不含有我要的词,它说抱歉里面的确没有,我再给你三首,结果里面还是没有。。。
看了,chatgpt也在糊弄事,中听不中用,还不如百度老老实实算数学
同等于二、三十年前华强北二手手机市场
加油干!中国科技!!
起码国产AI还是一天比一天强
百度的文心一言还是很可以的,某些方面不比chatgpt差了
一个程序员一天只能写出几十行高质量代码
一年以后,你们喷的应该不是这方面了,国外0到1国内1到无限
荷鬼抄粉
名字都挺好的![鼓掌]
你知道个天井,要水煮
实测百度文心一言比通义千问差一大截。
你把盘古大模型吃了吗
昆仑的天工可以
是谁让你在评测国产AI了,要评测就认真评测
豆包,呵呵,
免费让你用,还挑三拣四
把小编拉上去,反正小编啥都能答
捏一把汗说明你要去洗澡!国内AI语言模型与国外比有差距,但也不是小编说的那么不堪😂……
我以为你捏一把💩呢,还捏一把汗
国内主要没有顶级英伟达显卡,拿不到货,AI需要算力的
我在一本正经地胡说八道
字节的从没听过
你的问题就很有问题 让不同的人来看 他们心中有不同的答案