世界观热点:大模型 + 大算力融合 云计算能为 AIGC 做什么
【飞天商业老谢】AIGC,即 AI Generated Content,人工智能生成内容,通常包括写作、绘画、音乐、视频等领域,有文生文、文生图、文生音视频等多种功能。在 ChatGPT 横空出世后,AIGC 产业迅速成为世界焦点。
AIGC 产业爆发
不过,ChatGPT 这类大模型运行的背后,需要强大的算力来支撑。据相关资料,OpenAI 的 GPT-3 参数量达 1750 亿,预训练数据量达 45TB。ChatGPT 日常用户访问对应算力设施初始投入成本,据测算约 30-40 亿美元。ChatGPT 经常因访问量激增而宕机,这些都体现出了 AIGC 产业对于算力等基础设施的海量需求。
(相关资料图)
除了 AIGC,各行各业也都开始打造适合各自领域的大模型。面对 AIGC、大模型落地带来的海量市场需求,云计算行业也相应动作起来,不少云服务厂商都推出了相关产品。云计算能为 AIGC 提供什么
AIGC 产业需要处理大量的数据、进行复杂的计算,云计算平台可以提供高效、稳定的服务。云计算可以提供构建大模型算力底座的计算资源、网络连接、数据存储和模型管理等能力,解决大模型的托管、存储、部署、运行等,帮助用户快速创建和部署模型等。
算力:大模型运行时对算力要求很高,需要性能强大、稳定的计算资源。云平台的优势是可基于通用服务器和专属硬件,统一提供 CPU、GPU 等多种异构计算资源的调度及管理,通过虚拟化管理能力,一键部署底层计算资源并运行模型,充分利用不同异构资源的硬件加速能力,加速模型的运行及生成速度。AIGC 的计算需求通常是不确定的,可能需要一些弹性计算能力,以应对高峰时期的需求。云计算能提供按需分配计算资源的能力,需要时可进行伸缩。数据存储:大模型运行时会使用和生成大量数据,需要可靠的数据存储和备份机制。云平台的分布式存储,支持多存储类型协议,可提供稳定可靠、开放兼容、弹性扩展的块、文件和对象存储服务。同时结合多副本、多级故障域、故障自恢复等数据保护机制,可保证模型和数据安全稳定运行。
网络:AI 模型的训练和推理需要大量数据的传输和存储,对于基础底座的网络性能要求较高。云计算可提供算力资源的网络和存储,并通过分布式网络机制进行转发,透传物理网络性能,基于 25G、40G 网络可显著提高模型算力的效率和性能。
安全保障:云计算可从多个层面保障模型和数据的安全。云平台支持多租户和 VPC 隔离网络,结合云防火墙,可严格进行数据隔离和访问权限控制 ; 在模型托管方面,对模型仓库实行严密的权限管理机制 ; 在数据存储方面,通过私有化部署和数据磁盘加密保证安全可控 ; 在模型分发和运行过程中,也提供全面的账号认证和日志审计功能,全方位保证模型和数据的安全性。模型管理:云厂商可提供大模型统一托管服务和大模型仓库,AI 企业用户可自定义模型的上传、下载、权限控制、分发部署及运行。提供多种模型部署模式,可灵活定制 API 发布和一键打包应用,方便用户管理 AI 模型。
市场潜力巨大AIGC 正在成为数字内容创新的引擎。展望未来,AIGC 发展加速,算力、通信及存储需求的提升,将带动云计算等相关产业的发展。
据 IDC 数据,2021 年全球人工智能 IT 投资额为 929.5 亿美元,预计 2026 年将增至 3014.3 亿美元,复合年增长率约 26.5%。这是一个相当大的市场。据中国信通院数据,2021 年全球计算设备算力总规模达 615EFlops,其中基础算力 369EFlops,智能算力 232EFlops,超算算力 14EFlops,预计 2030 年全球算力规模将达到 56ZFlps,平均年均增长 65%。
总的来说,云计算可以为 AIGC 产业的相关企业和机构提供高性能的基础设施,高效、安全的 AI 模型管理和服务,有效保护数据隐私和模型安全,促进 AI 创新。