周鸿祎:构建安全可信可控易用的企业级AI大模型 资讯
DoNews7月4日消息,周鸿祎日前在2023全球数字经济大会人工智能高峰论坛上发布演讲,他认为大模型还是有机会,并且在中国,在产业侧。
周鸿祎认为大模型不是所谓泡沫,而是一场新的工业革命。不能把大模型比喻为操作系统,而是像数据库一样,成为每一个数字化系统的标配。
在中国发展大模型,应该搭上产业数字化的顺风车。
(资料图)
下面是周鸿祎发言实录。
《构建“安全可信可控易用”的企业级AI大模型》
尊敬的各位领导、各位嘉宾,大家下午好!由于时间有限,下面我分享一些对人工智能大模型的应用前景。
前几个月大家都在讨论OpenAI和中国什么时候能够做出自己的大模型,这几个月大模型层出不穷,我看到很多投资人开始急了。前两天朱啸虎和付盛在网上吵了一架,主题就是对很多创业者和公司来说,大模型的商业场景在哪里?
听了姜局长的讲话,我感觉这一页是多余的,但在外面开会的时候还要跟人讲,很多人不相信大模型是真人工智能、强人工智能或者通用人工智能,这些是我们所有讨论的前提。让我非常感慨的是,人类第一次让计算机完整地理解人类的语言,理解语言就可以理解世界的知识和模型。
有人认为,大模型是不是像之前流行的概念一样,就是一个风口和泡沫?我认为应该不是,而是一场新的工业革命。大模型直接提高每个人、每个组织的劳动生产力,同时实现了一种通用人工智能能力的赋能。
可以想一想,电脑刚发明的时候也没有带动工业革命,刚开始只是一些物理研究、气象预报,高精尖的领域才要用到电脑,距离普通人、普通企业很远,后来PC走入家庭和企业才改变了这个世界。行业应该争取这个目标,只有大模型走进千家万户、赋能百行千业,才能真正推动人工智能带来的这场革命。
有人觉得,模仿OpenAI的话,将来中国和全世界可能就是一两个大模型,因此把大模型比喻为操作系统,大部分公司可能就没有机会了。我认为未来大模型的趋势不会只有一个,而是会像数据库一样,变成每个数字化系统的标配,小到手机上的部署,中等规模的汽车上的部署,当然也包括在企业和政府内部的部署。
国家当前的重要战略之一是产业数字化,就是利用数字化技术帮助传统产业,特别是制造业赋能转型。要在中国发展大模型就应该顺势而为,为产业数字化赋能。最近我经常出差,跟很多省市的主官交流,大家的认知是一致的,大模型真正的机会在中国,我觉得是在企业级市场,包括政府和城市,中国做大模型最应该抓住产业互联网发展的机会。
但是当我们带着通用大模型API走到政府、城市和企业,就会发现光有大模型,直接用起来是有很多问题的。光有大模型是通才,但缺乏行业深度。ChatGPT刚开始的时候很惊艳,觉得什么都能回答,但如果真的是行业专家提出很深度的问题,它的能力是有限的。行业内部、企业内部真正有价值的知识,公开渠道是拿不到的,光有大模型没有办法满足行业和企业的场景垂直专业性的要求。
刚才朱军院长讲到,公有大模型存在很多数据安全隐患。每个企业自己内部的Knowhow是核心资产,肯定不会训练到公域大模型。公有大模型使用会有数据泄露的问题,因为很多想法和计划都要告诉它,它才能写出一篇好的文章。公有大模型是生成式AI,本身算法的特点就是会胡说八道,而且是一本正经、理直气壮地胡说八道。
这个特点用来做小说、写剧本,作为聊天机器人逗闷子效果很不错,但放在企业级场景问题就很大,要是真的拿医疗大模型开的药方,你敢不敢相信?敢不敢吃?公有大模型无法实现成本可控,因为大模型成本之高也被渲染得很厉害,训练一次要一千万美金,需要多少算力、多少显卡,企业内部做垂直大模型不用追求知识的全面,也不用追求能力面面俱到,百亿模型可能就足够了,千亿到百亿看起来参数做小了十倍,节省的训练和部署成本可远远不止十倍。
因此对很多企业来说,训练企业级大模型的成本已经在急剧降低,我们的目的就是把大模型拉下神坛,变成每个企业、政府部门都感觉能够直接使用的东西。
针对以上这些问题,我们思考一下,企业、政府、市场到底需要什么样的大模型?可以简单总结为五化。
行业化。一定要有行业深度训练的数据才有价值。
企业化。需要和企业内部知识库进行配合,而且做到实时迭代更新,从而保证大模型更懂企业。
垂直化。我们不要试图用一个大模型解决所有问题,大模型未来在企业落地形态一定是多个垂直模型组合,垂直模型解决专业问题的能力更强。最近有一个谣言,大家都在感慨ChatGPT4.0很强大,可能是超万亿参数的大模型,这样的大模型成本和微调都会比较困难,牵一发而动全身,后来有人说是八个千亿模型组成,真的是这样的话就证明模型垂直还是非常重要。
小型化。Google Lamma发展方向的趋势就是拼命把大模型做大,不到万亿都不好意思说自己是做大模型的,但还有一个趋势就是把大模型架构的参数、训练数据集做小。一台最新的苹果电脑,可以运算大规模的300多亿的模型。未来小规模的大模型可能也是一个趋势,未来如果一个大模型管理自动驾驶、智能座舱,不可能在云端瞬时响应,可能每辆车都有一个大模型架构。
专有化。中国市场不会是全部都是公有云的市场,公有云会占到一部分,很多大型央企、国企、政府机构对Location很在意,对数据在哪里存储看得比较重,所以专有部署能够保证安全可控。
前几天,我在山东参加世界互联网大会,也有提出另外三个原则,就是产业化方案需要遵循安全、可信、可控。
安全。刚才朱军老师已经提到,我就不多提了,传统的网络安全、网络攻击、漏洞、算法安全、数据安全问题都能够找到方法解决,最可怕的是生成内容不安全。最早我也很鄙视别人录屏,每次现场演示的时候我也忐忑不安,不知道下一句话会回答什么结果。
确实有人利用AIGC生成各种以假乱真的内容诈骗,这种治理要比搜索引擎公众号的管理复杂很多,所以人工智能安全问题从现在开始着手研究。
插播一个广告,360也是中国第一的安全公司,我们也在做大模型,把人工智能的黑箱子打开,所以大模型也是我们要和大家一起努力攻克的方向,保证人工智能的发展底线。
可信。大家并不需要打八十分的模型,另外二十分乱说,需要百分之百准确和精确。如何解决幻觉的问题?如何解决输出内容准确的问题?现在可以通过向量数据库、企业搜索和外部知识库进行校正。
可控。大模型目前还有点不靠谱的情况下,政府和场景利用起来步子要小一点,不要一上来就是主驾驶、插件和函数模式。不要轻易向大模型开放API,因为这只是一个助手,最后还是要人来决策。
企业大模型如何落地找场景?我们要用好通用能力。
首先要把大模型目前最擅长、最成熟的能力用好。以现在的大模型为例,生成与创作、代码能力、逻辑推理、知识问答,总结下来,最擅长的其实就是两点:一个是问答对话,一个是写作生成。政府和企业使用的时候应该先从几个成熟的角度切入,上来就和企业业务系统紧密耦合在一起,做成很复杂的应用,我的经验是恐怕难以收敛。
其次是从痛点刚需选择场景,小切口,大纵深。真正用大模型,你会天天算奥数题、脑筋急转弯吗?其实不会,真正需要的场景还是跟大多数人相关,说明办公场景是刚需。面向员工有企业知识搜索、知识管理和培训,面向领导有信息决策和舆情分析,对内有办公生成办公协作,对外有提高用户体验的智能客服。目前企业的数字化、智能化程度不高的情况下,这些场景是企业办公的痛点,也是大模型最能够提高效率的地方。
大模型不是万能的,有些企业家激动地说,有了大模型,企业中的ERP、CRM都可以丢掉了,实际上很多数据库存的核心业务是取代不了的,大模型只能打辅助。微软给大家提供一个很好的例子,所有的场景都是副驾驶,可以给你导航、给你建议、给你指点,但不会乱抢方向盘。
我觉得让大模型刚开始先开启副驾驶模式,与现有的业务系统保持相对独立和隔离度,做到安全可控、安全落地、快速执行。如果非要和现有系统结合在一起,很多单位的API可能都没有人维护了。
AI普惠。不能只给领导用,很多业务系统都是给领导做一个大屏展示,这当然也很重要,但人工智能真正的价值是每个人都要用得上,科技平权。很多领导问我到底怎么用人工智能赋能?我说如果企业的每个员工、每个产品经理、每个业务骨干都不熟悉人工智能,没有用过大模型,产生很多想法是根本不切实际的。
如果一个企业从领导到中层和基层,所有人都能够简单上手使用人工智能大模型的基本功能,半年以后很多人对大模型逐渐熟悉就会主动思考如何与业务系统结合,怎样改善自己的工作,作为人和大模型的双向赋能。
大模型发展要以人为本,好用、易用。老是有人渲染应用大模型就要大裁员,搞得很多员工对大模型很抵触。我坚决反对这个观点,大模型目前想独立完成一项工作还是很难的,更多的定位是人类很好的工具、知识的助手,所以大模型的发展要以人为本。
但模型真的好用吗?各位专家可能觉得自己写Prompt都很战场,但指望变成Prompt的专家,大模型用到八九十分也很难。360的建议就是在大模型的基础上跟企业一起打造有灵魂的数字助理,定义为数字员工、数字专家、数字顾问。
因为跟通用的对话框打交道还是不如跟各种业务定义的数字员工聊天符合日常习惯,我们通过数字人的方式进一步引导大家轻松利用大模型完成工作。数字人跟目前网上直播从头到尾念固定稿子的数字人不一样,背后一定是大模型驱动,有着专业背景和长期积累的数字助理。未来谁能把基于大模型的数字人定义好,可能是大模型在企业内部用得好的关键。
最后总结一下:大模型的发展要真正和国家战略相结合,一方面是要发展核心技术,另一方面要找各种应用场景。作为投资人,一个纯粹的技术只有和应用场景相结合才能创造持续不断的商业价值。大模型在城市、行业、企业数字化转型到智能化的过程中大有可为,进化迭代刚刚开始,相信未来会成为数字化系统的标配。
未来可能不是百模大战,而是万模穷舞,无论是To B、To G还是SaaS化的企业都有很多机会。我们会和生态合作伙伴一起打造可信、可控、安全的大模型解决方案,为网络强国和数字中国建设保驾护航。