这段时间,ChatGPT成了全球科技企业“群起而攻之”的风口,几乎打开每一个社交媒体平台、每一个微信群,都在激情讨论ChatGPT。
不过我发现,经过一段时间的发酵,大家的情绪不再只是猎奇和兴奋,一部分AI业内人士,已经率先进入了ChatGPT冷静期。
一位长期从事NLP/AI的研究人士告诉我,NLP本来属于长期坐冷板凳的领域,ChatGPT对话中错误随处可见,LLM大语言模型的商业模式还不清晰,认知智能刚刚划过了冰山一角,对目前ChatGPT的一波波信息轰炸已经审美疲劳了,是时候给ChatGPT降降温了。
降温是不可能降温的,但找回常识和理性是必须的。
大胆预测,今年会是一个ChatGPT大年。
国产化的必然选择,股市与投资者的热捧,大量中国科技企业已经切实在跟进类ChatGPT,而且“chat”问答天然的低门槛和娱乐性,确实会吸引大量原本不关心技术的人开始玩AI。所以,尽管围绕ChatGPT,有很多疯狂炒作和无稽之谈,但热度势必还会持续一段时间。
当然,如果你已经对ChatGPT资讯有点审美疲劳了,好消息是,大部分人在“调戏”ChatGPT之后,猎奇心理也会消失。加上ChatGPT在应用和体验上还需要迭代,个人关注度会下降,而能够用ChatGPT带来业务价值的产业关注度,还会持续保温。
所以,ChatGPT接下来的发展,不是“要么火要么凉”那么两极分化,而是会经历一个恒温培育孵化的发展期。
担心中国做不好ChatGPT的,不用急,一切才只是刚刚开始;认为中国ChatGPT可以弯道超车的,不用嗨,新技术还是要按照规律按部就班地发展进步。
从第一代生成式预训练模型GPT-1到GPT-4,这条路OpenAI走了五年。可以说,没有对大模型的长期投入与探索,是不可能一步登天,做出ChatGPT这样的产品的。
那么,中国有没有类似的AI企业,拥有支撑起类 ChatGPT的综合实力呢?
通过国际权威咨询机构IDC新近发布的《2022 中国大模型发展白皮书》,我们可以一窥国内大模型实力分布。
评估结果显示,百度旗下的文心大模型表现非常突出,在市场格局中处于第一梯队,产品能力、生态能力、应用能力全面领先,给百度即将发布的生成式对话产品文心一言,提供了强大的技术支持。
让我们暂时排除“支持国货”的民族情绪,带着理性和常识去探究一下,文心大模型的水平到底怎么样?文心一言等类ChatGPT产品,究竟能为用户和市场提供什么样的价值?
拆解ChatGPT:一匹以大模型为骨架的“特洛伊木马”
ChatGPT的出现,代表了大语言模型的突破,将对话式AI与NLP技术带到了一个全新的高度,展现了AI的更多可能性和商用潜力。
上个世纪,信息哲学领军人卢西亚诺•弗洛里迪就说过,“人工智能就像特洛伊木马, 把一种更具包容性的计算/信息的范式引入哲学的城堡。”而ChatGPT就是一匹看起来极其神奇的特洛伊木马,令人类啧啧称奇,担心自己不再是城堡中唯一的万物之灵。
当然,归根结底,AI也好,ChatGPT也好,都是一匹人造的木马,由人类创造,也为人类所驱使。
ChatGPT这匹“特洛伊木马”的出现,更大的意义在于,它代表了一个标志——通过大模型这种方式,人工智能的知识瓶颈,是可以被打破的。
我们知道,算力、算法、数据,这AI三要素在当下基本得到了满足,带来了AI技术应用化的突破。但许多自然语言处理NLP任务,如机器翻译、情感分析、问答系统、语言生成等,需要模型具有一定的语言知识和理解能力。张钹院士曾提出:AI最重要的能力是知识。但知识,始终是AI的一个瓶颈。
ChatGPT的出现,标志着知识瓶颈是可以被打破的。通过大模型,学习海量的语料库,可以获取丰富的语言知识,对语言中的复杂结构、语义和逻辑,进行识别和处理。
大家感觉ChatGPT特别神奇,好像真的有自主思维一样,正是源自知识能力融入大模型后,在泛化性、通用性、迁移性上的强大表现。
它是一个标志,也只是一个标志。
因为ChatGPT也并没有彻底解决知识瓶颈,还存在一些局限性。比如由于中文语料不够多,获取的深度中文知识少,所以对中文的理解和问答效果都不如英文,经常出现常识性错误。
那么,问题来了。OpenAI又不向中国大陆开放服务,对于优化ChatGPT的中文能力显然不会投入太多资源。同时,AI又广泛应用在安防、识别、智慧城市等重要领域,安全性和可靠性也决定了,发展国产化ChatGPT,成为了必然的选择。
好消息是,机会总是留给有准备的人,中国AI过去多年间不断积累升级,并没有在大模型时代令我们失望。
自2018年预训练大模型成为风潮后,中国AI领域快速跟进,已经积累了大模型所需要的全产业链要素,包括算力基础设施、数据集、算子库、深度学习开发框架、AI开发工具,以及多个领域的大模型产品。
人家牵出了盘亮条顺的“特洛伊木马”,中国科技企业将自家拉磨的驴包装成汗血宝马,显然就不太合适了。国产大模型必须足够优秀,才能让国人和企业放心支持。
IDC此时发布《2022中国大模型发展白皮书—— 元能力引擎筑基智能底座》,首提大模型评估框架,是一个大模型比武的好契机,让我们可以综合评估国产大模型的实力。
从文心的三轮驱动,称称国产大模型的重量
投资市场有句话,“在短期,市场是个投票器;在长期,市场是个称重器。”遇到短期风口“猪也能在天上飞”,但长期来看,任何公司和概念都要靠扎扎实实的核心能力,长出翅膀,才能穿越风雨,持续腾飞。
放到ChatGPT概念上也一样,各种国产类ChatGPT产品出现,到底是骡子是马,得拉出来遛遛。
此次《白皮书》中,IDC搭建了大模型评估框架V1.0,选取国内主流厂商(N=9),从模型能力、工具平台能力、开放性、应用广度、应用深度、应用生态共6大维度的11项指标,进行打分评估。结果显示,百度文心大模型的产品能力、生态能力达到L4水平,应用能力达到L3水平,处于第一梯队。IDC中国副总裁兼首席分析师武连峰认为,百度文心大模型是其打造文心一言的坚实基础。
现实进展来看,百度率先打开局面,即将推出类ChatGPT的生成式对话产品文心一言。
《白皮书》中提到,“模型+工具平台+生态” 三级协同,是OpenAI在开发GPT大模型过程中的核心思路,经过长期的积累,也更容易形成竞争壁垒。
我们不妨从这三个角度出发,去称称百度文心大模型的重量,究竟与OpenAI有何差距?
第一,大模型的产品能力。
模型层,是大模型的核心引擎,也是相关产品的主要优势和竞争赛点。
ChatGPT的成功,得益于大规模的数据集,较强的模型开发和算法调优能力,在NLP领域的长期积累,以及来自微软的计算资源支撑等。总的来说,打造一个像ChatGPT这样的大模型产品,需要对算法和技术有深入的理解,以及数据、算力等支持。
这方面,我们可以看到,百度要打造类ChatGPT产品,不是从零开始,而是有着长期积累和综合优势。
百度自2019年开始深入研发预训练模型,发布了知识增强的产业级大模型文心ERNIE1.0。在深度学习的基础上融入知识,将海量的知识积淀和自研的多源异构知识图谱,投入到文心大模型的预训练中,在知识的指导下,文心大模型的效率更高、效果更好,可解释性更强。用于训练的数据量级也有显著优势,模型参数达到万亿级别。2020年开始将文心大模型应用到搜索业务,可以说,百度在破解AI知识瓶颈这一问题上的探索,并不比OpenAI落后,更比国内很多科技企业要早得多。
目前,困扰国产ChatGPT的算力资源和成本问题,百度也在开发文心大模型的过程当中,与国内外硬件伙伴合作寻找解决方案,百度飞桨深度学习平台向下适配各种硬件,以支持文心大模型的开发、高性能训练、模型压缩、服务部署的各种能力。
可以说,百度在大模型方面有着贯通全产业链的积累,能够满足类ChatGPT产品的开发需求,具有较强的先发优势。
第二,应用工具平台。
大模型的落地应用,是海外AI研究机构很少提及,却是产业智能化不可规避的问题。真实的产业应用场景中,企业和开发者接入大模型的方式多种多样,有的需要产品级的API接口,有的希望能够开放深度定制,有的则对成本非常敏感。
所以,要让大模型广泛应用,就必须平台提供完善的成体系的全栈工具链,包括深度学习框架、基础模型库、数据集、端到端开发套件、API接口等,才能让更多行业人员或开发者,能够低门槛甚至零门槛的将大模型应用于自己的业务中。
目前,ChatGPT还是没有开源的,想要基于ChatGPT打造集成化的行业应用产品,还不现实。这一点上,和飞桨深度学习平台生态共享的文心大模型,可以借助飞桨庞大且丰富的工具平台,以及AI开发社区,加速大模型的产业化应用,更快建立起商业闭环。
第三,行业生态。
正如OpenAI的首席执行官山姆·奥特曼所说,ChatGPT的技术不应该被保留在科技行业的狭小范围内,而应该拥抱真实世界。
但是,大模型与千行百业的融合,充满了未知的领域,要一个行业、一个行业去探索,与开发者、行业用户、上下游产业共创,这是一个苦活重活,确实大模型走向产业、拥抱真实世界的更优解。
生态建设上,百度文心大模型与飞桨深度学习平台生态共享,前期已经做了大量的工作。《白皮书》显示,百度飞桨生态已经凝聚了535万开发者、服务20万家企事业单位,与12家硬件伙伴联合发布飞桨生态发行版、推动深度学习平台与更多硬件适配,还与国内科研院所、实验室以及高校强强联手,一同攻克AI技术难关,目前赋能了389所高校,服务747名教师,学分课培养10万余名AI学子 。
在此基础上,文心大模型与众多头部企业合作,融合了通用数据和行业特有知识,推出行业大模型系列,比如能源行业NLP大模型国网-百度·文心、金融行业NLP大模型浦发-百度·文心等,显著提升了大模型在行业任务上的应用效果,也在重点行业形成了大模型落地应用的参考路径,给全球大模型走向商业化,起到一定的示范作用。
“模型+工具平台+生态”,三轮驱动下,一点点将大模型推向广阔的产业天地。
化解中国AI焦虑的另一种思路:大模型的产业突围
ChatGPT火爆之后,大家可能听到了类似的声音,认为中国科技企业不像OpenAI这样长期投入,中国AI缺乏元创新、底层创新,中国在ChatGPT上已经落后了追赶要花很多钱……
其实梳理百度文心大模型的进化史会发现,这些都是一种科技自立焦虑心理的“晕轮效应”,即因为某个细分领域、垂直领域的短板,而放大到对中国AI整体能力的质疑和虚无论,这显然是不客观的。至少在大模型这个领域,中国技术自信是很真实的。
ChatGPT热潮也体现出,大模型成为发展AI技术的必然选择。这也为化解中国AI焦虑,提供了另一种思路,那就是大模型的产业突围。
IDC认为,大模型将会助推数字经济,为智能化升级带来新范式。对行业用户而言,大模型已表现出巨大的潜力,企业应该尽早关注,在业务中布局。
但ChatGPT虽好,这类新技术在与行业融合时,实际中还会面对一系列适配问题,比如:
1.原始模型太大,难以在产线、矿山、园区等终端侧部署。
2.需要与行业专精知识相结合,开发定制程度更高、更安全可靠的垂直应用。
3.服务商自行开发类ChatGPT成本太高,难度很大,商业效益难保障。
所以,要打通ChatGPT等新AI技术向产业释放的一系列关节,真是“寻龙分金看缠山,一重山是一重关”,有着千山万水要过。这时候,围绕文心大模型这样的产业级平台,去撬动新技术的可能,或许才是真正的机遇所在。
在这个过程中,百度这样的AI头部玩家,接下来还需要做好三件事:
1.夯实AI基础设施。通过文心大模型与飞桨深度学习平台,夯实AI基础设施底座,加速类ChatGPT产品的开发,持续技术创新的同时,提供基础模型、丰富工具栈、API接口等必要资源,成为各行业都可以低门槛引入AI的创新底座。
2.进一步加强生态开放。有活力的创新开发环境,才有中国AI应用的百花齐放,头部企业有责任为生态赋能,不断向开发者释放资源和支持。近日来,爱奇艺、集度汽车(通过Apollo)、小度、宇信科技、汉得信息、金蝶软件、宝宝巴士、智联招聘、太平洋汽车网等知名企业,都已经加入了百度文心一言生态圈,获得该AI技术的“加持”。据说,文心一言还将会推出生态伙伴计划,全面支持伙伴,共同发展商业市场。
3.探索无人区,不断推动新技术与行业问题的结合。尽管每次AI领域的技术突破都会引发很大的舆论关注,但AI在行业当中的渗透率只有10%左右,还有大量空白地带是可以与AI相结合的,需要头部企业去引导和探索,形成示范案例。
总之,中美AI或许在顶级科研、底层技术上有差距,但中国科技企业、从业者、开发者以及无数行业和企业,从来没有“躺平”过,一直在追逐着新技术的脚步。这些要素叠加在一起,是文心大模型的重量,也是中国AI的重量。
来源: 脑极体