语言模型
。
华为
开发者大会 HDC Cloud 在东莞召开,在刚刚进行的 Keynote 上,
华为
终于公布了盘古大模型的最新消息。
华为
常务董事 、
华为
云 CEO 张平安表示。「我们注意到了它们都有很好的对话能力。但我要说,盘古大模型不写诗,只做事。盘古大模型的目标是利用 AI 技术给各行业带来价值。」
华为
也首次对外公布了盘古基础大模型的全栈创新和行业大模型的技术细节。
揭秘盘古 3.0
华为
围绕深耕行业面向开发者持续打造了新的竞争力。
-
L0 层包括 NLP、视觉、多模态、预测、科学计算五个基础模型,提供满足行业场景中的多种技能需求。盘古 3.0 提供了 100 亿、380 亿、710 亿和 1000 亿
参数
等基础大模型,以匹配不同场景、时延、响应速度的行业多样化需求。同时提供全新能力集,包括 NLP 大模型的知识问答、文案生成、代码生成,以及多模态大模型的
图像生成
、图像理解等能力,这些技能都可以供客户和伙伴企业直接调用。无论多大
参数
规模的大模型,盘古提供一致的能力集。
-
L1 层是多个行业大模型,
华为
云既可以提供使用行业公开数据训练的行业通用大模型,包括政务,金融,制造,矿山,气象等大模型;也可以基于行业客户的自有数据,在盘古大模型的 L0 和 L1 层上,为客户训练自有的专用大模型。
-
L2 层提供了更多细化场景的模型,更专注于政务热线、网点助手、先导药物筛选、传送带异物检测、台风路径预测等具体行业应用或特定业务场景,为客户提供「开箱即用」的模型服务。
参数
大模型的训练,
华为
提出了多种高效训练新技术。
优化器
,还入围了 7 月即将举行的 AI 顶会 ACL 的杰出论文奖。
华为
云还为客户提供了大模型行业开发套件,通过对自有数据二次训练,客户就可以拥有自己的专属行业大模型。同时,根据客户不同的数据安全与合规诉求,盘古大模型还提供了公用云、大模型云专区、混合云多样化的部署形态。
华为
表示,在 AI 管道上存在数十个不同的模型,匹配了多行业的不同诉求。基于此,文案生成,对话语音、代码生成,以及
图像生成
、编辑等能力都可以供人们快速调用上线。
华为
表示,盘古大模型易落地的优势,在于提供了解耦设计。
参数
的大模型,都可以快速进行转换,」张平安表示。
华为
提供了基于昇腾的硬件,构建了昇腾芯片使能能力 CANN,在这其上则是 MindSpore AI 框架和 ModelArts
机器学习
平台。基于这样的全栈能力,
华为
提升了大模型构建、训练和部署的效率。
华为
使用自有算力设备,在昇腾云上,我们发现大模型的训练效率达到了业界主流 GPU 的 1.1 倍。
硬件能力
华为
云还宣布在乌兰察布和贵安上线昇腾 AI 云服务,可提供每秒 200 亿亿次浮点运算能力。现在缺乏 GPU 的科技公司有了新的选择。据介绍,
美团
利用昇腾 AI 云服务,AI 算子的工作效率提升了 30%。
华为
自家的 AI 框架 MindSpore 外,还支持 PyTorch、
TensorFlow
等主流 AI 框架,框架中的 90% 算子都可以通过
华为
的迁移工具从 GPU 平滑迁移到昇腾。
为行业而生
华为
轮值董事长胡厚崑表示,ChatGPT 的出现把 AI 推向了新的风口,
人工智能
将帮助改写身边的一切。
华为
现在的核心目标是在下个阶段,全力推进
人工智能
走深向实。
华为
盘古系列基础大模型于 2021 发布,包括 NLP、CV 和科学计算大模型,后续发布了矿山、药物分子、气象、海浪等行业大模型。
参数
即可完成千亿规模大模型的快速微调和下游适配。
华为
介绍,盘古大模型已经深耕超过十个行业,服务 400 余个业务场景。
华为
云盘古大模型研发团队独立研究并撰写的一篇论文《Pangu-Weather: A 3D High-Resolution Model for Fast and Accurate Global Weather Forecast》登上了《自然》杂志。
深度学习
开发的精准精确全球 AI 气象预报系统 ——
华为
云盘古气象大模型,这是首个精度超过传统数值预报方法的 AI 预测模型,突破了 AI 预报天气精度不及传统数值预报的世界性难题,对比传统方法预测速度提升 10000 倍,可秒级完成对全球气象的预测
华为
介绍了一系列大模型在其他领域的落地进展。
华为
云携手深圳市福田区政务服务
数据管理
局上线了政务智慧助手小福,其能够精准理解民众咨询意图,改变了传统的一网通办模式。
感知
、认知到决策处置的全流程能力。
华为
构建了金融大模型(网店助手),新的模型把生成能力和检索能力进行了结合,可以为柜台流程形成规范的操作指导,降低了单词业务办理的操作次数,每次办结时间缩短了 5 分钟以上。未来,人们还希望在此基础上构建信贷系统、金融风控等组件。
华为
供应链中,盘古制造大模型提前学习了业务流程、制造规则,现在发给制造员的订单信息和邮件可以被大模型准确理解,转化为
调度
指令交由「盘古天筹求解器」,成为了未来三天的全局统筹最有
规划
。
华为
表示,这就是盘古大模型的理念。
自动编程
能力,
华为
盘古的代码生成工具名叫 CodeArts。
华为
展示了用 CodeArts Snap 开发一个未完成的应用。首先,我们用对话方式提出需求,把需求复制到代码注释位置,就可以命令 Snap 直接完成目标任务的开发。
华为
还介绍了数字内容生产工具 MetaStudio 的能力,拍摄一段 5 分钟的视频上传到
华为
云,一个小时后就可以构建出一个属于自己的数字人。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...