王恩东院士:释放多元算力价值,计算系统创新是关键
来源:IT之家 发布时间:2021-10-27 16:13 作者:宋元明清
人工智能从五六年前的“黑科技”变成今天的“热科技”,离不开计算能力的巨大飞跃。2020年,以GPU为代表的AI加速芯片交付的总算力已经超过通用CPU,预计到2025年,加速芯片提供的算力可能超过80%。可以说,随着人工智能的大规模发展,计算能力成为决定性力量,智能计算是智能时代的核心生产力。

“人工智能带来计算能力需求的指数级增长,计算行业面临多元化、海量量化、生态离散化的趋势和挑战。一方面,多样化的智能场景需要多样化的计算能力,庞大的量化模型、数据和应用规模需要巨大的计算能力,成为人工智能持续发展的重中之重;另一方面,从芯片到算力的转化还存在巨大差距,多重算力的价值还没有完全释放。如何快速完成从多芯片到计算系统的创新,成为推动人工智能产业发展的关键环节。”在10月16日举行的2021人工智能计算大会上,中国工程院院士、Inspur首席科学家王恩东阐述了在计算向智能计算转型的新产业格局下,计算系统创新的重大意义。
从多芯片到计算能力的转变,计算系统的创新是关键。
随着人工智能在算法领域的不断突破,不同的数值精度带来了更大的计算类型跨度,对计算芯片的指令集和架构的要求也更加细分。图灵奖获得者约翰汉尼斯和大卫帕特森共同发表了《计算机架构的新黄金时代》,提出当摩尔定律不再适用时,更加以硬件为中心的DSA架构设计将占据主导地位,这种设计的核心在于针对特定问题或特定领域定义计算架构。基于DSA设计的AI芯片在特定AI工作负载下表现出远超通用芯片的处理能力,极大地推动了AI芯片的多元化发展。为确保此次宣传活动能够高效展开,该行加强组织领导,精心部署,成立了活动宣传小组,制定了活动方案,并对方案进行了具体的布置,对参与宣传的营业网点,宣传方式,宣传内容进行了详细的安排,明确;央行支付,中流砥柱;的宣传主题,积极主动宣传推广支付清算系统新业务,新功能,突出其产品服务安全,稳定,快捷的特点,介绍央行支付在保障和改善民生方面发挥的重要作用,展现了人民银行和我行良好的金融服务形象。
芯片的多样化为AI的加速提供了重要的产业基础和更丰富的选择。然而,芯片的制造和大规模使用之间仍然存在巨大的产业差距。一方面,计算能力的供给需要搭建计算能力平台,解决架构设计、核心部件、高速互联、散热设计等一系列问题。以一个AI服务器的开发为例,整个系统需要经历30多个开发流程,使用150多个制造工艺,严格控制280多个关键工艺控制点的质量,并借助算法框架和AI应用实现优化适配。另一方面,面对大规模AI算力部署,AI算力平台建设面临高功耗、高电流密度、高总线速度、高系统复杂度等新问题。
“我们可以制造强大的火箭发动机,但如果我们想制造安全和高性能的运载火箭,我们仍然需要在循环、控制和结构等许多领域做大量的工作。芯片到计算系统也是如此,它需要大量的系统设计工作,例如架构、信号完整性、散热和可靠性。”王恩东院士用生动的比喻诠释了计算系统创新在从芯片到计算能力过程中的价值。
以巨型模型为代表的巨型量化是AI发展的一大趋势。
“人工智能如何像人类一样发展逻辑、意识和推理的认知能力,是人工智能研究一直在探索的方向。目前,通过大规模数据训练大参数的庞大模型,被认为是实现通用人工智能的重要方向。”王恩东院士认为,随着海量模型的兴起,海量量化已经成为人工智能未来发展的一个非常重要的趋势。
目前全球知名的AI龙头公司都在巨量机型上投入巨资,谷歌、微软、英伟达、Inspur、致远研究院、百度、阿里等公司都相继推出了自己的巨量机型。
巨型量化的核心特征之一是模型参数多,训练数据量大。以Inspur人工智能研究院开发的全球最大中文AI模型袁1.0为例,其参数量高达2457亿,训练数据集规模达到5000GB。与GPT3模型的1750亿参数和570GB训练数据集相比,Source 1.0的参数规模增加了40%,训练数据集增加了近10倍。
此外,宏观量化也表现在模型的大规模应用上。互联网头部公司的AI开放平台吸引了超过百万的AI开发者。这些AI开放平台每天承载着数万亿的通话,数百万小时的语音识别,超百亿的图像识别,超万亿的自然语言理解句子等等。如此庞大的调用数量给计算能力中心的应用支持能力带来了巨大的挑战。
生态离散化制约着人工智能的上层次、上尺度、上台阶。
“很多人会困惑,人工智能这么好,但是如何与我的业务和应用场景相融合,并想通过AI技术进行智能化改造,却发现没有人懂算法和模型,并且缺乏一个易用的AI开发平台。同时,算法模型这么多,如何在应用中找到不同算法的最佳组合?知道这些事情的人往往集中在科研机构或者头部公司。这些地方集中了最优秀的AI人才,但对传统行业的需求场景和业务规则缺乏深入了解。”王恩东院士形象总结了AI从技术到应用面临的困境。
埃森哲的一份研究报告显示,超过70%的技术研究机构和技术公司缺乏需求场景、领域知识和数据,超过70%的行业用户缺乏技术人才、AI平台和实践能力。
同时,生态分散也与AI芯片多元化的发展趋势密切相关。目前AI芯片架构多样,指令集不同,互不兼容,而面向芯片的编程库绑定在芯片上,灵活性较差。小公司只做其中一个环节,导致生态的纵向不通;大公司想建立一个封闭的系统,这导致了一个横向的生态屏障。。
王恩东院士认为,目前人工智能的技术链和产业链脱节,生态离散化成为制约人工智能技术水平、应用规模和产业先进性的瓶颈。
多样化、巨大量化和生态化给整个计算行业带来了前所未有的挑战。“如果你想释放多样性,
算力价值、促进人工智能创新,一是要重视智算系统的创新,加大人工智能新型基础设施建设,把从技术到应用的链条设计好,从体系结构、芯片设计、系统设计、系统软件、开发环境等各个领域形成既分工明确又协同创新的局面;二是要加快推动开放标准建设,通过统一的、规范的标准,将多元化算力转变为可调度的资源,让算力好用、易用。”王恩东院士强调说。