博天堂真人赌场
新闻排行
相关阅读
「重庆永利会小费」华为Atlas900揭秘:集成数千颗昇腾910芯片,算力堪比50万台PC
「重庆永利会小费」华为Atlas900揭秘:集成数千颗昇腾910芯片,算力堪比50万台PC
点击数:2087     更新时间:2020-01-11 18:26:23

「重庆永利会小费」华为Atlas900揭秘:集成数千颗昇腾910芯片,算力堪比50万台PC

重庆永利会小费,9月18日,华为副董事长胡侯坤在华为全连接大会上正式发布基于阿森松岛910的全球最快人工智能训练集群atlas 900,预示着“人工智能计算”时代的全面加速。与此同时,华为还在崛起的华为基础上发布了云ei集群服务,进一步释放了人工智能计算能力,为行业带来了助力。胡侯坤宣布华为的全堆栈和全场景人工智能解决方案已经开始全面实施。

“人工智能”时代即将到来

众所周知,超级计算机是一个国家科研实力的体现。这对国家安全、经济和社会发展具有重要意义。它也是一个国家科技发展水平和综合国力的重要标志。如果计算不充分,就很难保持科学技术发展的持续领先。

长期以来,中美一直是超级计算领域的主要竞争对手,近年来,中国在超级计算领域的实力甚至一直保持着对美国的长期关注。自2013年以来,中国的“神威太湖之光”和“天河二号”长期占据世界超级计算机500强的前两位。直到2018年,美国能源部橡树岭国家实验室的顶级超级计算机才重新获得世界超级计算机500强的榜首。

根据今年6月17日在德国法兰克福举行的国际超级计算大会(International Supercomputing Conference)发布的最新全球超级计算机500强名单,美国峰会超级计算机再次获得第一名,而中国的超级计算机“神威太湖之光”和“天河二号”分别排名第三和第四。

Summit连续获得第一名,主要是因为它是一台完全采用新计算架构设计的超级计算机。众所周知,超级计算机过去主要依靠大规模cpu核心进行计算。summit虽然也有一些ibm power9 cpu,但主要依靠gpu进行计算。内置27,000多个nvidia gpu芯片,支持机器学习和神经网络计算,同时提供强大的计算能力,可以运行大量人工智能应用。与单独的cpu计算相比,使用gpu进行ai计算可以大大提高性能和降低功耗。

Summit采用这样一种新的架构设计,一方面是为了进一步提高计算能力,另一方面是为了应对对人工智能计算日益增长的需求(超级计算总是旨在服务于实际应用)。

作为计算的硬件载体,虽然cpu和gpu可以进行人工智能计算,但相比之下,专用人工智能芯片在性能、功耗和效率方面表现更好,这也是近年来云人工智能芯片市场和终端人工智能芯片市场爆炸性增长的关键。

我们可以看到,许多数据中心最初使用cpu进行计算,但是随着ai计算需求的增加,数据中心的计算架构开始向cpu+fpga转移,以满足ai算法快速迭代的需求,或者cpu gpu被用于大量ai模型训练,而随着ai算法开始成熟和稳定,相应的服务器应用也清晰可见,新架构的CPU+专用ai芯片将成为云智能计算领域的主流。

华为进入价值2万亿美元的蓝海市场

链接和计算被认为是智能世界中的两项关键技术。在过去的30年里,华为在连接方面取得了卓越的成就,但这并不意味着华为只能做连接。华为也在计算领域投资了10年,也取得了不错的成绩,如移动终端用麒麟处理器、智能屏幕用红谷处理器、数据中心和云用鲲鹏处理器等。

然而,如前所述,当前的计算模型在不断演变,以机器学习和推理计算为代表的人工智能计算逐渐成为主流。数据显示,82%的企业已经将人工智能直接应用于与生产相关的场景,并带来了显著的效益(> 15%)。40%的企业开始尝试将人工智能应用到认知和决策层面。根据其他数据,人工智能计算到2025年将占全球总量的80%以上。到2023年,全球计算行业的市场规模将达到2万亿美元。这也意味着人工智能计算有巨大的市场空间。

为了满足对人工智能计算能力的巨大需求,抢占2万亿美元的蓝海市场,胡侯坤表示,华为将坚定不移地投资于计算行业,尤其是人工智能计算。

胡侯坤表示,过去的计算主要是基于“规则”,而现在的人工智能计算已经开始转向“统计”,这本身就是一种暴力计算,高度依赖计算力。为了让计算机认识一只猫,它需要数百万张训练照片,这对计算能力的消耗来说是非常惊人的。对于自动驾驶、天文探测、气象预报等更复杂的场景,对计算能力的需求将会更大。传统的计算依赖于处理器的效率和摩尔定律的进步。然而,随着摩尔定律接近极限,需要一种新的计算体系结构来释放计算力。此外,计算和智能将在未来无处不在,而不仅仅分布在中心端,因此也需要端缘云之间的高效协作。因此,也对智能计算提出了更高的要求。

因此,我们可以看到华为去年推出了基于自主开发的达芬奇架构的培训和推理芯片——瑞星310和瑞星910。今年华为在手机芯片麒麟810和麒麟990系列上应用了达芬奇架构上升的ip,增强了华为在终端方面的人工智能能力。在今天的华为全连接大会上,华为正式发布了基于阿森松岛910的全球最快人工智能训练集群atlas90,进一步增强了华为在云中的人工智能计算能力。

Atlas90,世界上最快的人工智能训练集群

根据华为发布的官方数据,华为此次推出的atlas 900由数千个相互连接的910内核组成,是世界上最快的人工智能培训集群。

此前的数据显示,作为单芯片计算密度最高的芯片,常升910的人工智能性能远远优于谷歌TPV2、谷歌TPV3、Avida v100等竞争对手。基于成千上万个上升的910内核,atlas90会有多强大?

根据会议上发布的信息,atlas900集群的最终强度将达到256-1024 pflops@f16,相当于500,000台电脑的计算能力。

目前,华为在华为云上部署了atlas 900人工智能培训集群,集群规模为1024个,增加了910个人工智能处理器。根据华为发布的数据,在restnet-50 v1.5和imagenet-1k网络下,这样一个atlas900集群的准确率为75.9%。在同样的精度下,完成典型网络的训练只需要59.8秒。业内其他两家主流制造商的测试结果分别为70.2秒和76.8秒。在同样的精度下,atlas 900 ai训练集群比第二个快15%。

这里提到的imagenet-1k数据集包含128万张图片,resnet是近年来非常流行的卷积神经网络结构,其中50层网络结构(resnet-50)的效果优化已经引起学术界和工业界的广泛关注。胡侯坤说restnet-50是测试人工智能能力的黄金标准。

胡侯坤还引用了天文学领域的一个例子:“为了扫描20多万颗恒星并定位特定的恒星,过去一个人使用传统的计算系统和手动方法需要169天才能完成,而华为的atlas900集群只需要10.02秒就能完成”。这显示了atlas90的性能。

胡侯坤表示,atlas900强大的计算能力可以广泛应用于科学研究和商业创新,如天文探测、天气预报、自动驾驶、石油勘探等领域。

此外,华为还发布了基于atlas 900的云ei集群服务,并宣布将以极其优惠的价格向全球科研机构和大学开放。进一步释放其强大的云人工智能能力,增强行业和合作伙伴的能力。

结合鲲鹏系列推出arm服务器市场

虽然英特尔的x86架构目前仍然主导着服务器市场,但基于arm架构的服务器市场也由于高能效、低功耗和低成本的优势而快速增长。华为和中国腾飞已经成为arm架构服务器市场的支柱。

早在2004年,华为就开始开发arm架构相关芯片,覆盖了华为的许多产品线。今年1月7日,华为正式发布了业界性能最高的基于arm的服务器芯片鲲鹏920,以及基于鲲鹏920的三台泰山服务器和华为云服务。

鲲鹏920基于armv8指令集的授权,由华为独立设计和完成。其主频可达2.6ghz,单芯片可支持64核,集成8通道ddr4,内存带宽超过行业主流46%。该芯片集成了100克以太网卡的功能,大大提高了系统的集成度。在典型的主导频率下,特定基准得分超过930,超过行业基准25%。同时,能效比行业基准高出30%。鲲鹏920以更低的功耗为数据中心提供更强的性能。此外,鲲鹏920支持pcie4.0和ccix接口,提供640gbps的总带宽。单槽接口速率是行业主流速率的两倍,有效提高了存储和各种加速器的性能。

迄今为止,华为基于arm的服务器相关产品包括:hi16系列cpu、鲲鹏系列arm CPU和泰山服务器。此外,可用于服务器端的云人工智能芯片rose 910和刚刚发布的全球最快的基于rose 910的人工智能培训集群atlas90进一步增强了华为在云和服务器市场的实力。随着人工智能计算时代的到来,华为在服务器市场的竞争力将进一步释放。

华为的全堆栈和全场景人工智能解决方案开始落地

早在去年10月的华为互联大会上,华为轮值首席执行官徐志军就首次公布了华为的全堆栈全场景人工智能解决方案,并基于自主开发的“达芬奇架构”正式推出了两款人工智能芯片:最强大的瑞星910和最节能的瑞星310。

今年7月,华为首次将基于达芬奇架构的Ascent ip引入智能手机市场麒麟810处理器,并成功推出商用Glory 9x智能手机。然而,麒麟810一旦发布,它就成功超越高通小龙855,荣登人工智能基准评分榜榜首。

8月23日,华为正式宣布成功商业化使用阿森松岛910,并推出全场景人工智能计算框架mindspore。徐志军表示:阿森松岛910和mindspore的推出标志着华为已经完成了完整堆栈和完整场景人工智能解决方案(组合)的构建,也标志着华为人工智能战略的实施进入了一个新阶段。

9月6日,华为正式发布麒麟990 5g芯片,该芯片内部集成了全新的达芬奇架构npu内核,由两个ascend d110 lite和一个ascend d100微内核组成,类似cpu大小的内核架构。这样做的优点是,根据不同人工智能模型的需要,部署相应的npu来处理它,从而实现更高的能效。

华为表示,麒麟990 5g的人工智能性能比麒麟970高出12倍,比麒麟980高出6.7倍。eth 3.0最高可达76206点,是高通小龙855的2.78倍。它可以被称为最强的移动人工智能处理器。

随后麒麟990 5g也进入了人工智能基准运行得分榜的榜首,人工智能运行得分高达76206,是第二名的两倍,远远超过了其他soc。不久,华为与麒麟990 5g的mate 30系列智能手机也将正式发布。

从华为去年10月在达芬奇框架下开发的Ascent 910/930系列人工智能芯片的正式发布到今年8月的商业登陆只花了10个月的时间(基于Ascent芯片的阿特拉斯系列卡、模块和服务器已经上市)。与此同时,华为还实现了面向云的新兴系列人工智能芯片的人工智能能力向手机终端侧的部署和商业登陆。这一次,全球最快的基于升序910的人工智能培训集群atlas90的发布,以及基于升序华为云(在华为云上,提供相应的推理和培训服务)的人工智能集群服务的推出,是华为向高端云市场的进一步突破。迄今为止,华为的人工智能解决方案已经实现了云、边缘和终端侧的全面覆盖和商业登陆。

除了上升的处理器系列ip和芯片,华为还在ai应用中提供cann(芯片运营商库和高度自动化的运营商开发工具)、应用使能工具模型艺术以及培训和推理框架mindspore,实现ai解决方案的全栈覆盖。

与合作伙伴携手共建开放生态。

尽管华为本身是一个巨大的生态系统,但它不仅设计自己的芯片,还制造自己的终端和系统,形成一整套垂直整合的产业链。然而,即便如此,华为仍然需要合作伙伴来营造生态环境。

为了加快生态建设,华为早在2015年就发布了沃土计划1.0版。目前,有130万开发人员和1400个si。胡侯坤在今天的会议上还宣布了一项新的肥沃土壤计划,宣布将投资15亿美元,希望吸引更多开发商加入,目标是将开发商数量增加到500万,并推动全球合作伙伴开发应用和解决方案。

此外,华为正积极与其合作伙伴合作建设鲲鹏工业生态基地。目前,华为已登陆北京、上海、重庆、深圳、成都等城市,并在平台建设、人才培养、应用示范等领域全面合作。

在业务战略方面(主要指云),胡侯坤表示,他不会直接向外界销售处理器,而是将重点放在面向客户的云服务和组件上,优先支持合作伙伴开发完整的机器。同时,华为还将投资于关键技术和产品,如主板、服务器、操作系统、数据库、编译器等。突破整个生态链,完成系统级验证,帮助合作伙伴更好地销售完整的机器。

胡侯坤强调,华为将坚持开放电路板和模块等硬件,开放软件。“华为不申请,但它会加入团队,制造好工具,并帮助其合作伙伴申请和迁移。”

“未来的计算将无处不在,智能将无处不在。在人工智能时代,需要一种能够支持各种场景下智能计算的新架构,这是当前计算行业发展面临的巨大挑战。然而,挑战和困难也意味着更多的机会。华为擅长长距离行走,用最好的技术解决最困难的问题,让不可能成为可能,并为合作伙伴开辟空间。华为希望与大家一起开创一个导航的新时代,探索计算行业的新机遇,并为双赢结果而共同努力。我们希望千帆能够参与竞争,而不是孤军奋战。”胡侯坤最后说。

作者:辛志勋-浪客健

上一篇:航母海试需要多久?美国只用3月,英国6月,中国最长但精益求精    下一篇:流浪地球、红海行动、建党伟业…70周年成就展一天两场经典电影免费看
© Copyright 2018-2019 elsadressup.com 博天堂真人赌场 Inc. All Rights Reserved.