可以确定百度“文心一言”底层技术是自己研发的吗？

还是引进国外的？

发表于 2025-4-16 14:51:12

2ch吧里面看到的图，让百度ai画松鼠鳜鱼，结果画成了松鼠撅鱼，一只松鼠真的在撅半只鱼身子

发表于 2025-4-16 15:01:12

国内其他任何公司这个时间点放出“自研ChatGPT”都会让人怀疑是不是套壳，但百度是真的没得说

ernie在去年八月底还放出过一个在线demo：

当时的链接是 https://wenxin.baidu.com/moduleApi/ernie3 （可以看看现在打开是什么）

发表于 2025-4-16 15:13:22

前面一直在发我的测试结果，没有正面回答这个问题。下面正面回答一下“文心一言”底层技术是不是自研的，我的回答是:是！
因为我同学就在这个项目组，我的测试账号就是他给我开通的，不然的话我一个程序员现在也搞不到测试账号的，得继续等短信。和他聊过，这块技术他们19年就开始做了，去年做到了千亿模型，当时也发布了几个接口但是没激起什么水花，这次发布也是有点仓促。模型还在训练，肯定会越来越好的。那些说调用sd接口的可以洗洗睡了
三条腿的鹰酱是什么鬼

=======下面是原回答=======
看到有人用文心生成总线出来的是个汽车，好奇自己试了一下，下面是我生成的几幅图

总线和猫

总线和狗

关羽

下面这个是前几天生成的

总体来说画图这块感觉在某些同名词下不输stable diffusion（经评论提示修改）的，自然风光，水墨画，人物什么的都试了，真的很不错的。生成视频的接口估计没投放或者关闭了，现在不能生成视频。
国内能做到这个地步的也只有百度了，目前只是千亿模型，再训练训练肯定会更好的。
还是那句话:自己都躺平的人就不要嘲笑那些在泥泞道路上艰难前行的人了。
最后再附一张:

=======更新=======
下面是让画桌子和表格的测试结果

感觉这个也有点模棱两可

这个桌子还可以

可以看到，当我让画一个表格的时候，它画了一个真·表格，画完我想了一下，如果是直接告诉真人，估计也会这么理解，后面就加了条件让画一幅画，画的内容是表格。
不过也确实有它理解不了的，比如下面这个

最后这个该算是正确还是错的呢，我感觉是错多一点

还有待继续训练进步。如果遇到正确的就点个攒，错误的就踩一下反馈一下，希望越来越好吧。

发表于 2025-4-16 15:24:23

总线的英文是bus，鼠标英文是mouse，起重机英文crane和鹤是一个单词。可以说百度图片生成的底层是用英语训练的，为什么用英语呢？是汉语版stable diffusion没开源吗

发表于 2025-4-16 15:38:10

更新：百度多模态去年的论文(应该就是这个模型)，中英数据集混合训练的。
https://arxiv.org/abs/2210.15257

--------------------------------------
通俗的说：
1、微软不会傻到把爆款开源，反而会把谷歌打的喘不过气。
2、如果能抄的话，阿里腾讯华为早就上了，百度连汤都喝不到(毕竟只有4W人)。
3、如果是抄的，以百度的口碑，不用你怀疑，早就马上热搜第一了。一堆竞争对手盯着在。
4、百度向工信部报备了。国家不会允许大厂将数据传向国外。
理性的说：
1、百度的模型是ERNIE3(ERNIE1已经开源了)，以前天天和谷歌的bert系列比，所以这俩遇到了同样的困境。多模态用的文心一格，很早就出了。
百度是开源积极分子，飞桨呀，brpc呀。根据以往的开源情况，百度也没套皮黑历史。
2、gpt2开源了，但3以后的都没开源。网友口中的gpt3.0是2021年的text-davini-003(chatgpt是gpt-3.5-gurbo)，其实这已经是3.5系列了。从gpt3到003已经有4、5代了，这所有都没开源。
有人说套皮了gpt2，这就好像说99A套皮了虎式，太离谱了。
更新3、另外我觉得拿首日的一言和喂了半年数据的gpt4比没意思，新兵和老兵的区别。chatgpt年初也有一堆bad case。

现在再用一言已经比第一天好多了(很多bad case都学会了)。

一言确实有弱点(比如代码比较答辩)，但网上专找首日的bad case将一言钉死，这不太好吧。
只能说大家都可以试试，行不行试试自己也有自己的答案。反正也不要钱

可以确定百度“文心一言”底层技术是自己研发的吗？

本周热门