“大模型本身不会淘汰任何人,不会用大模型的人只会被那些用大模型的人所淘汰。”8月26日,在2023亚布力中国企业家论坛第十九届夏季高峰会上,嘉宾们围绕“世界需要怎样的人工智能”展开高端对话。360集团创始人、董事长周鸿祎表示,大模型在各行各业的应用已成不可逆转的潮流,而把大模型做“小”,是未来产业数字化的关键。
大模型带来大机遇
【资料图】
大算力+大模型基础+大数据+大用户流量=大模型,这是周鸿祎对于大模型的理解。他表示,OpenAI最大的创新,是突破了所有公司的局限性。它尝试把人类所有的知识都训练到大模型里,“书读千遍,其义自现”。
人工智能其实并不是很新鲜的概念,一度被炒得很热,却一直没有得到广泛的应用,周鸿祎认为,这是因为人工智能在每个领域用的算法都不统一。而在他看来,OpenAI最大的突破就是用一种处理数据的方法,将很多人工智能垂直领域的问题给统一起来了,这是具有划时代意义的。
“跟智能音箱对话过的人都有一种感觉,就是聊几句就聊不下去了,人们因此调侃人工智能是人工智障。而这次大模型解决了一个对人类自然语言理解的问题。”周鸿祎表示,这是另一个巨大的创新突破。但他同时提醒大家,不要误解大模型只适用于语言处理。他认为,有了自然语言的处理基础之后,计算机视觉、机器人控制等课题也将拥有无限可能,甚至蛋白质分析、基因分析等复杂问题都可以通过大模型来解决,“这是非常了不起的”。
尝试把大模型做“小”
大模型进入百行千业已成不可逆转的趋势。周鸿祎表示,在种种因素制约下,中国企业与其像OpenAI一样追求“大而全”,不如结合自己的产业、企业,将大模型做“小”。
“大家都有体会,ChatGPT似乎是万金油,无所不知,但是一旦被问及行业的深入问题,它就开始绕圈子,说明它缺乏对行业深刻的理解。大部分应用都是拿通用的数据去训练的,它对你的企业了解吗?企业为了提出很多要求,就要把企业很多的数据传给它,但这可能就会导致企业数据的泄露。此外还涉及一个成本问题,ChatGPT4号称训练一次的成本高达2000万美元。这样的话,人工智能离所有的企业还非常远”。周鸿祎提出,现在需要把大模型“拉下神坛”。
周鸿祎认为,可以从行业化、企业化、专业化、垂直化四个方面入手,把大模型做得“小而精”。“在一个公有大模型的基础之上,再来加入企业内部很多知识的训练。这个大模型,我认为未来是企业数字化最核心的数字资产,所以一定要私有化控制,私有化部署。”周鸿祎表示,这种小型化的大模型不需要太高的成本,也不需要太大的数据支撑,企业完全可以结合自己的需求去训练。“每个企业甚至可能拥有若干自己的大模型,这种方式也有助于解决算力的矛盾。中国已经是‘百模大战’了,未来‘万模群舞’的时候,就能实现这个设想——只需要少数的公司用大规模的投入把基础模型训练出来,然后提供给很多企业。企业用小规模的算力进行微调和部署,一样可以进行推理和计算。”
周鸿祎提出,中国虽然在原始创新方面尚需要时间去追赶,但人口多、企业多、场景多,这是我们的优势。“深圳就有几十万家这种企业,如果都训练出来自己的小规模的大模型,那么大模型无处不在。这里面会产生很多产业创新的机会”。周鸿祎说。
如何拥抱大模型?
360涉足研发大模型,有人调侃他们是不务正业,周鸿祎在对话中也给出了正面回应——“如果360不了解大模型,我们就没有办法去解决大模型的安全问题。大模型要面临的最重要的一个挑战就是在面向用户的时候,大模型可能会胡说八道。这是未来在企业应用中需要去解决的。如何保证它的真实性和正确性?这些内容安全的问题也都需要行业去探讨、解决。”
在汹涌而至的大模型潮流下,未来企业的各种业态可能都会被重塑,周鸿祎建议企业家们不要逃避,“你不做大模型,不利用大模型,你的同行会利用”。很多企业面对大模型还很迷惘,不知该如何在自己企业落地,周鸿祎给他们的建议是:“Just do it(尽管去做),大模型目前虽然不是万能的,虽然有很多缺点,但是我发现它有两个能力非常成熟,大家都应该尝试结合自己企业的场景去用:一个是知识问答,企业里的知识管理,还有一个是企业里面各种各样文书的辅助写作。先从这两个小切口、大众化的场景出发,先让员工都用上自己的大模型。然后再过半年,当企业对大模型都接受的时候,再来设想自己的业务与大模型更多的结合。”