可以确定百度“文心一言”底层技术是自己研发的吗?

还是引进国外的?
收藏者
0
被浏览
104

5 个回答

时空猫的问答盒 LV

发表于 3 天前

可以确定百度“文心一言”底层技术是自己研发的吗?-1.jpg

2ch吧里面看到的图,让百度ai画松鼠鳜鱼 ,结果画成了松鼠撅鱼,一只松鼠真的在撅半只鱼身子

shower LV

发表于 3 天前

国内其他任何公司这个时间点放出“自研ChatGPT”都会让人怀疑是不是套壳,但百度是真的没得说

可以确定百度“文心一言”底层技术是自己研发的吗?-1.jpg

ernie在去年八月底还放出过一个在线demo:

可以确定百度“文心一言”底层技术是自己研发的吗?-2.jpg

当时的链接是 https://wenxin.baidu.com/moduleApi/ernie3 (可以看看现在打开是什么)

卓松年 LV

发表于 3 天前

前面一直在发我的测试结果,没有正面回答这个问题。下面正面回答一下“文心一言”底层技术是不是自研的,我的回答是:是!
因为我同学就在这个项目组,我的测试账号就是他给我开通的,不然的话我一个程序员现在也搞不到测试账号的,得继续等短信。和他聊过,这块技术他们19年就开始做了,去年做到了千亿模型,当时也发布了几个接口但是没激起什么水花,这次发布也是有点仓促。模型还在训练,肯定会越来越好的。那些说调用sd接口的可以洗洗睡了
三条腿的鹰酱是什么鬼

可以确定百度“文心一言”底层技术是自己研发的吗?-1.jpg

=======下面是原回答=======
看到有人用文心生成总线出来的是个汽车,好奇自己试了一下,下面是我生成的几幅图

可以确定百度“文心一言”底层技术是自己研发的吗?-2.jpg

总线和猫

可以确定百度“文心一言”底层技术是自己研发的吗?-3.jpg

总线和狗

可以确定百度“文心一言”底层技术是自己研发的吗?-4.jpg

关羽

可以确定百度“文心一言”底层技术是自己研发的吗?-5.jpg

下面这个是前几天生成的

可以确定百度“文心一言”底层技术是自己研发的吗?-6.jpg

总体来说画图这块感觉在某些同名词下不输stable diffusion(经评论提示修改)的,自然风光,水墨画,人物什么的都试了,真的很不错的。生成视频的接口估计没投放或者关闭了,现在不能生成视频。
国内能做到这个地步的也只有百度了,目前只是千亿模型,再训练训练肯定会更好的。
还是那句话:自己都躺平的人就不要嘲笑那些在泥泞道路上艰难前行的人了。
最后再附一张:

可以确定百度“文心一言”底层技术是自己研发的吗?-7.jpg

=======更新=======
下面是让画桌子和表格的测试结果

可以确定百度“文心一言”底层技术是自己研发的吗?-8.jpg

感觉这个也有点模棱两可

可以确定百度“文心一言”底层技术是自己研发的吗?-9.jpg

这个桌子还可以

可以确定百度“文心一言”底层技术是自己研发的吗?-10.jpg

可以看到,当我让画一个表格的时候,它画了一个真·表格,画完我想了一下,如果是直接告诉真人,估计也会这么理解,后面就加了条件让画一幅画,画的内容是表格。
不过也确实有它理解不了的,比如下面这个

可以确定百度“文心一言”底层技术是自己研发的吗?-11.jpg

最后这个该算是正确还是错的呢,我感觉是错多一点

可以确定百度“文心一言”底层技术是自己研发的吗?-12.jpg

还有待继续训练进步。如果遇到正确的就点个攒,错误的就踩一下反馈一下,希望越来越好吧。

devil0 LV

发表于 3 天前

总线的英文是bus,鼠标英文是mouse,起重机英文crane和鹤是一个单词。可以说百度图片生成的底层是用英语训练的,为什么用英语呢?是汉语版stable diffusion没开源吗

可以确定百度“文心一言”底层技术是自己研发的吗?-1.jpg


可以确定百度“文心一言”底层技术是自己研发的吗?-2.jpg

固执的蛮牛 LV

发表于 3 天前

更新:百度多模态去年的论文(应该就是这个模型),中英数据集混合训练的。
https://arxiv.org/abs/2210.15257

可以确定百度“文心一言”底层技术是自己研发的吗?-1.jpg

--------------------------------------
通俗的说:
1、微软不会傻到把爆款开源,反而会把谷歌打的喘不过气。
2、如果能抄的话,阿里腾讯华为早就上了,百度连汤都喝不到(毕竟只有4W人)。
3、如果是抄的,以百度的口碑,不用你怀疑,早就马上热搜第一了。一堆竞争对手盯着在。
4、百度向工信部报备了。国家不会允许大厂将数据传向国外。
理性的说:
1、百度的模型是ERNIE3(ERNIE1已经开源了),以前天天和谷歌的bert系列比,所以这俩遇到了同样的困境。多模态用的文心一格,很早就出了。
百度是开源积极分子,飞桨呀,brpc呀。根据以往的开源情况,百度也没套皮黑历史。
2、gpt2开源了,但3以后的都没开源。网友口中的gpt3.0是2021年的text-davini-003(chatgpt是gpt-3.5-gurbo),其实这已经是3.5系列了。从gpt3到003已经有4、5代了,这所有都没开源。
有人说套皮了gpt2,这就好像说99A套皮了虎式,太离谱了。
更新3、另外我觉得拿首日的一言和喂了半年数据的gpt4比没意思,新兵和老兵的区别。chatgpt年初也有一堆bad case。

可以确定百度“文心一言”底层技术是自己研发的吗?-2.jpg

现在再用一言已经比第一天好多了(很多bad case都学会了)。

可以确定百度“文心一言”底层技术是自己研发的吗?-3.jpg

一言确实有弱点(比如代码比较答辩),但网上专找首日的bad case将一言钉死,这不太好吧。
只能说大家都可以试试,行不行试试自己也有自己的答案。反正也不要钱

您需要登录后才可以回帖 登录 | 立即注册