华为云发布盘古大模型3.0和昇腾AI云服务

2023-07-07 22:17:11 来源: 光明网


(资料图片)

华为开发者大会2023正式揭开帷幕,华为常务董事、华为云CEO张平安重磅发布盘古大模型3.0和昇腾AI云服务。其中,盘古大模型3.0围绕“行业重塑”“技术扎根”“开放同飞”三大创新方向,持续打造核心竞争力,为行业客户、伙伴及开发者提供更好的服务。昇腾AI云服务单集群提供2000P Flops算力,千卡训练30天长稳率达到90%。

张平安表示:“盘古大模型要让每个行业、每个企业、每个人都拥有自己的专家助手,让工作更高效更轻松。我们始终坚持AI for Industries的战略,在深耕行业的道路上不断前行。我坚信大模型将重塑千行百业,而每一个开发者,都将是改变世界的英雄。”

大模型的创新不仅仅是模型自身的创新,更依赖于AI的各项根技术创新。华为在最底层构建了以鲲鹏和昇腾为基础的AI算力云平台,以及异构计算架构CANN、全场景AI框架昇思MindSpore,AI开发生产线ModelArts等,为大模型开发和运行提供分布式并行加速,算子和编译优化、集群级通信优化等关键能力。基于华为的AI根技术,大模型训练效能可以调优到业界主流GPU的1.1倍。

华为诺亚方舟实验室主任姚骏介绍盘古基础大模型全栈创新

算力是训练大模型的基础。在本次大会上,张平安宣布单集群2000P Flops算力的昇腾AI云服务在华为云的乌兰察布和贵安AI算力中心同时上线。昇腾AI云服务除了支持华为全场景AI框架昇思MindSpore外,还支持Pytorch、Tensorflow等主流AI框架。同时,这些框架中90%的算子,都可以通过华为端到端的迁移工具平滑迁移到昇腾平台。例如,美图仅用30天就将70个模型迁移到了昇腾,同时华为云和美图团队一起进行了30多个算子的优化以及流程的并行加速,AI性能较原有方案提升了30%。

此外,在大模型训练过程中经常会遇到GPU故障,研发人员不得不经常重启训练,时间长,代价大。昇腾AI云服务可以提供更长稳的AI算力服务,千卡训练30天长稳率达到90%,断点恢复时长不超过10分钟。

“为了帮助全球客户、伙伴、开发者训练和使用大模型,我们致力于为全球客户打造世界AI另一极,为所有AI开发者提供新的选择”,张平安表示。

此外,为了让企业在AI时代构筑更强的内容创新能力,华为云通过盘古基础大模型赋能MetaStudio数字内容生产线,打造了盘古数字人大模型,提供模型生成和模型驱动两大服务,并已经使用了20万小时音视频数据进行了预训练。基于这两大服务,开发者可以快速生成和驱动数字人模型,赋能在线教育、文娱直播、企业会议等行业应用,让每个企业员工实现“数字人自由”。例如,用户只需在华为云MetaStudio的服务页面上传20秒的个人视频,就可以快速生成个性化的数字人讲解视频,过去3个研发人员3天完成的工作,现在只需要3分钟就可以完成。

目前,华为云全球开发者数量已超过460万,云商店上架的商品已达10000多个。华为云提供了易用可靠的大模型工具套件、汇聚海量多行业场景API的开天aPaaS,以及包含丰富优质课程和技术认证的大模型专属社区,希望与开发者及伙伴一起,共同探索盘古大模型与行业结合的创新路径。(王经)

来源:光明网

标签:

[责任编辑:]

最近更新