神威太湖之光每秒计算多少次?
“神威·太湖之光”由国家并行计算机工程技术研究中心研制,全部采用中国国产处理器构建,是世界上首台峰值计算速度超过十亿亿次的超级计算机,其峰值计算速度达每秒12.54亿亿次,持续计算速度每秒9.3亿亿次,性能功耗比为每瓦60.51亿次。依托“神威·太湖之光”,在天气气候、航空航天、海洋科学、新药创制、先进制造、新材料等重要领域取得了一批应用成果
神威太湖之光最大的亮点是什么?
运算速度快。
1997年,世界上首台万亿次超级计算机在美国圣地亚国家实验室落户,2016年,十亿亿次超级计算机“神威·太湖之光”问世。短短20年间,超级计算机单台性能整整提高了10万倍。“神威·太湖之光”超级计算机的最大特点就是运算速度快,其整机系统峰值性能可达每秒12.5亿亿次,它1分钟的计算能力相当于全球72亿人同时用计算器不间断计算 32年。计算性能、持续性能和性能功耗比这三项关键指标在系统发布时均居世界前列。
拓展资料
如果说光刻机是人类工业文明皇冠上的明珠,那神威·太湖之光毫无疑问就是我国超算行业的皇冠,曾凭借霸道的算力优势一举夺得全球超算四连冠,近年来,伴随着美国前沿(Frontier)和日本富岳(Fugaku)的异军突起,一度令众网友好奇,神威的E级超算新品为何迟迟未能问世?
神威·太湖之光沉默了?
北京时间11月15日,第60期全球超级计算机TOP 500强榜单重磅出炉,排名第一的是来自美国橡树岭国家实验室的Frontier前沿超算,它凭1.102EFIop/s(百亿亿次)的HPL得分傲视群雄 ,理论峰值性能是第二名Fugaku富岳超算的3倍多。
来自中国的太湖之光和天河二号位列第7、第10名
曾几何时,神威·太湖之光在全球超算圈可以说是风光无两,自2016年面世后,便创造过一连串辉煌篇章:
它是世界第一台峰值运算性能超过每秒10亿亿次浮点运算能力的超级计算机;
2016年,神威·太湖之光轻松斩获TOP 500世界第一;
2016年,神威·太湖之光荣获戈登贝尔奖;
2017年,神威·太湖之光再获TOP 500世界第一;
2017年,神威·太湖之光再获戈登贝尔奖;
如果用通俗的比喻来理解创造四连冠的神威·太湖之光的算力的话,那就是,它运算1分钟,相当于全球72亿人不间断运算32年!
彼时神威·太湖之光的计算性能、持续性能和性能功能比三项关键指标均处于世界前列。
从今年的榜单来看,Frontier的稳定速度是榜单上排名第二的Fugaku的2.49倍,理论速度快了3.14倍,单以稳定速度来看,Frontier是榜单上TOP 2~8的性能之和,在如此彪悍的算力性能下,它的功耗却仅有Fugaku的71%。
仅看数据的对比,神威·太湖之光确实与冠军的成绩有差距,但很多网友没搞明白的一点时,神威·太湖之光是2016年的产物,已经过去6年了,而富岳和前沿呢?
2019年12月13日,富岳首批6台计算机顺利抵达神户理化学研究所计算科学研究中心,由此可见其研制时间在2019年前后,2020年6月,当期公布的全球超算TOP 500榜单中,富岳排名第一;
而在2022年5月30日和11月分别公布的全球超算TOP 500榜单中,均斩获冠军的前沿,其最早的研制时间也刚好在2019年,也就是说,我国的神威·太湖之光投入运行3年后,这些后来者才着手研发新一代超算。
隔着3年的时差,6个代际的排名,但即便如此,我们的超算总体成绩仍然令人瞩目。
就拿这届TOP 500榜单的前十来说,我国的神威·太湖之光和银河2号仍然都进了前十,并且总上榜台数达到162,实力超越了欧美,也就是说,我们实际上仍然获得了总榜第一的好成绩。
即便PK算力,我们也是世界前列。
超算对于大国的意义巨大!
HPE(Frontier运营商)执行副总裁、高性能计算和人工智能部门总经理Justin Hotard曾表示,前沿在速度和性能方面取得了突破,让我们有机会解答那些以前甚至都不知道要问的问题。
美国橡树岭国家实验室相关负责人Jeff Nichols表示,来自世界各地的科学家和工程师都将利用该套系统(指Frontier)非凡的计算速度,来解决我们这个时代全人类最具挑战性的一些问题。
神威·太湖之光的典型应用场景有药物的分子动力学模拟、3D渲染、数字水池和大气动力学等,比如天气预报、雾霾预警、3D大片、新型材料和新型药物的研发等,也就是说,这些超算们的应用场景会涉及到国防、军事、医疗、高能物理、工程设计、地震预测、气象观测、航天技术、国家高精尖科研的方方面面,无论实际需求还是长远意义都很重大。
这也是各大国不遗余力搞超算军备竞赛的真相!
我国超算,们早就拥有了设计一流芯片的能力。
我国的科研人员也早就想到了硬件上的限制,为了不被美国卡脖子,当初超算项目立项之际,就刻意避开了X86\ARM\Risc-V\MIPS四大主流芯片架构,转而选择了有点冷门却系出名门的Alpha 21364架构,基于Alpha开发拓展出了一套有自主知识产权的指令集,也就是后来的申威指令集。
2006年,国家超算无锡中心(江南所)设计出自主微结构的申威1,基于130nm制程工艺,单核心CPU,主频只有900MHz,集成了5700万晶体管;
2008年,江南所推出了申威2,基于130nm工艺,双核心CPU ,主频抬升到1.4GHz;
2010年,申威1600横空出世,基于65nm工艺,但是性能与功耗却超越了当时的Intel,i7 980xe 6核心功耗130W,申威1600功耗仅70W,申威1600在1.1GHz的主频率时,双精度浮点运算能力达140.8G,而i7 980xe 6核心运行在3.2GHz频率时,双精度浮点只有107.55G;
2016年,神威·太湖之光用的申威26010,双浮点峰值已达3.06TFIops,与Intel的Kight Landing处在同一水平,申威26010用落后英特尔和AMD几乎2整代的工艺却做出了不低于后两者的性能,足见当初选择Alpha 21364架构的明智与后续自研拓展指令集的优势。
如今,制程工艺上,限制较明显,但可以选择在功耗控制和堆核心上下力气,花更多的精力,利用与代工厂深度合作的主频优化、自研架构&指令集方面的优势缩短硬件性能差距。
回到了前文的问题,这几年,神威和天河们发展得怎样了?
早在2018年节点,我国已经正式布署了神威、天河和曙光三种不同技术路线的E级超算(跟Frontier同水平线的百亿亿次/秒),其中天河3号原型机更是在当年7月就通过了验收,同年8月5日,神威E级超算也顺利通过了科技部专家组的验收,同年10月24日,来自经济日报的一篇报道显示,神威E级原型机、天河三号E级原型机和曙光E级原型机系统全部完成交付。
这说明什么?说明我们早已掌握了E级超算的相关技术链啊。
2022年4月,中国科学技术大学、国家海洋科学与技术试点实验室 、北京大学数学科学学院、无锡国家超级计算中心和中国海洋大学组成的联合团队,公布了一篇超算模拟复杂量子多体的文章。
据该文描述,在介绍高性能计算环境时提及了申威26010 Pro的架构,该CPU为申威26010的升级改进款,拥有6个计算组,每个计算群有1个管理核心和64个计算核心,较之于仅有4个计算组的申威26010,单片性能至少提升50%,文章称呼为新一代神威超级计算机,似乎也印证着该台超算大概率即为神威·海洋之光。
11月15~17日,第24届中国国际高新技术成果交易会在深圳召开,深流微智能科技有限公司CTO Jerry在演讲中直言“深流微作为国内唯一自研高能性图形渲染GPU的厂商,拥有完全自主知识产权的GPU架构与微架构设计,其自研的XTS系列GPU可广泛应用于AI计算、虚拟现实和元宇宙等领域”。
随着我国算力网络的进一步布局,超算的应用前景将会更加广阔,除了国家队主导的超算之外,民企的算力中心发展速度也十分为惊人,据《河北日报》消息,阿里云于8月30日正式启动了张北超级智算中心,总算力高达逆天的12EFlops,一举超过了9 EFlops的谷歌和1.8 EFlops的特斯拉,有了这样的算力做保障,AI大模型训红、自动驾驶、空间地理等人工智能探索都将如鱼得水。