大模特开始“卷起”了。
去年底,ChatGPT向喧闹已久却未掀起任何波澜的AI“湖”里扔了一块“石头”,并在短短2个月内收获了1亿用户。
当学生用它写论文,程序员用它辅助生成代码,甚至我作为编辑用ChatGPT来造标题,大AI模型就像毛毛雨一样默默地融入到我们的日常生活中。
一石激起千层浪
“一石激起千层浪”。一时之间,国内大模型如雨后春笋般涌现。当3月份办公室里还在讨论百度的大模型是“文研一信”还是“文心一言”,4月份阿里巴巴的“统一千文”,5月份科大讯飞的“星火认知”,中科院的“紫动太初2.0”席卷而来。
近日,继中国联通正式公布“鸿鹄”大模式后,中国电信也宣称将发布“TeleChat”大模式,中国移动“九天”1+N大模式也“摩拳擦掌”,就连运营商也开始进入大模式市场。这是否意味着大模式市场真的成了互联网领域的“战场”?
今天,华为还发布了盘古大模型3.0,虽然业界大模型层出不穷,但华为大模型的一举一动依然受到业界关注,从注册“盘古”“PANGU”商标和专利华为盘古大模型,到爆料驳斥盘古大模型叫“盘古聊聊”的谣言。
其实华为在2020年就开启了大模型的研究,2021年4月,在两年前的HDC大会上,华为发布了盘古NLP大模型1.0和盘古视觉大模型,当时时任华为云CEO的余承东称赞华为云盘古大模型是AI行业非常非常非常震撼的产品。
2021年的盘古NLP大模型,不仅是业界首个千亿参数的中文大模型,而且在预训练阶段学习了超过40TB的行业文本数据和400万小时的行业语音数据,拥有1100亿参数。在大模型中华为盘古大模型,参数扮演着重要的角色。所谓AI大模型,就是将海量数据导入一个拥有数亿参数的模型,在完成类似“完形填空”的任务后,最终将机器训练成具有逻辑推理分析能力的人工智能。目前大模型的参数都是万亿级别,GPT-3就有1750亿参数(即175B)。随后,2021年5月,最大版本2000亿参数的“鹏城盘古”大模型也闪亮登场。2021年的盘古大模型,真正可以称得上是“厚积薄发”。
同时2021年的盘古视觉(CV)大模型也是一个拥有超30亿参数的CV大模型,预训练时就输入了10亿张图片,既能满足低层图像处理的需求,也能满足高层语义理解的需求。
此后,华为又相继推出了盘古科学计算大模型、药物研发细分场景大模型、盘古采矿大模型、盘古气象大模型、盘古波浪大模型、盘古金融OCR大模型等。
就在华为正式发布盘古大模型3.0的前一天,又一则重磅新闻刷屏——华为云盘古气象大模型研究成果在《Nature》杂志发表。据了解,该模型是首个精度超越传统数值预报方法的AI模型,速度比传统数值预报快上万倍以上。这篇论文是近年来第一篇中国科技公司作为署名单位在《Nature》杂志发表的论文,《Nature》审稿专家也对该成果给予了高度评价。这一好消息,让人们对盘古大模型3.0的发布又增添了期待。
期待已久的
“万众期待,终于等到了”。今天,华为常务董事、华为云CEO张平安正式发布了华为盘古大模型3.0。面对目前大模型“神争霸”的局面,他表示:“自从OpenAI发布ChatGPT以来,各种大模型层出不穷,据不完全统计,全球已经发布了几百个大模型,仅中国就发布了80多个。有的大模型能写诗、能画画。但华为盘古大模型不能写诗,它只能做事,因为它要深入各行各业,赋能各行各业创造价值。”
华为将基础大模型、行业大模型、细分场景大模型分为L0、L1、L2三个层次。张平安介绍,盘古大模型3.0是面向行业的大模型系列,包含“5+N+X”三层架构,“5”指L0层的自然语言、视觉、多模态、预测、科学计算五大基础大模型;“N”指L1层的N个行业大模型。华为云可以提供用行业公开数据训练的全行业大模型,包括政务、金融、制造、矿业、气象等大模型,也可以在盘古大模型的L0、L1层基于行业客户自有数据为客户训练自己的专有大模型;“X”指L2层为客户提供了更细化的场景模型和无限的“X”种可能。 L2更加聚焦于具体的行业应用或者具体的业务场景如政务热线、分支机构助理、铅毒筛查、传送带异物检测、台风路径预测等,为客户提供“开箱即用”的模型服务。
值得一提的是,盘古大模型采用完全分层解耦的设计,能够快速适应和满足行业变化的需求。客户可以为自己的大模型加载独立的数据集,单独升级基础模型,也可以单独升级能力集。基于L0、L1大模型,华为云还为客户提供了大模型行业开发套件,通过对客户自有数据的二次训练,客户可以拥有自己专属的行业大模型。同时,根据客户不同的数据安全合规诉求,盘古大模型还提供了公有云、大模型云区、混合云等多样化的部署形态。
目前“神仙打架,盘古来啦!”华为盘古大模型3.0正式发布,盘古大模型已经在金融、制造、医药研发、煤炭、铁路等多个行业发挥着巨大作用。在政务领域,华为云联合深圳市福田区政务服务数据管理局,推出基于盘古大模型的福田政务智能助手小福,可以精准理解民众的咨询意向,改变传统的一站式服务模式,将民众的话语转化为政务的语言,让城市更有爱;在煤炭开采领域,盘古矿山大模型已经在全国8个矿山规模化使用,一个大模型可以覆盖煤炭开采、掘进、机械、运输、通讯、洗选等业务流程下的1000多个细分场景,让更多的煤矿工人能够下地工作,不仅可以让煤矿工人的工作环境更加舒适,还可以大大减少安全事故;在药物研发领域“神仙打架,盘古来啦!”华为盘古大模型3.0正式发布,过去研发一种新药平均需要10年时间、耗资10亿美元。 盘古药物分子大模型助力西安交通大学第一附属医院刘兵教授团队发现全球40年来首个抗生素新靶点、新产品类,将先导药研发周期缩短至1个月、降低研发成本70%……
“盘古为行业而生,所以我们也要为行业着想,更好地服务千行百业的客户。”张平安表示,盘古大模型会让每个行业、每个企业、每个人拥有自己的专家助手,让工作更高效、更轻松。我们始终坚持行业人工智能战略,在深耕行业发展的道路上持续前行。我坚信大模型会重塑千行百业,每个开发者都会是改变世界的英雄。
结论
在中国古代传说中,盘古“开天辟地”给混沌宇宙带来了生机。希望华为盘古模式在人工智能的潮流中,也能给行业带来更加智慧、更加光明的未来,开创“新宇宙”!