第A04版:科创周刊

超算互联网——让算力可以自由调度

  想象一下这样的画面:距离无锡西北方向1000公里之外的某台超级计算机,需要推算遥远至500年前的气象;某个创新药的研发,需要计算相当复杂的分子组合。两个项目都需要几百万核并行,但目前随着用户的增加,单个超算已经被占用了很多算力资源,无法满足现有的计算需求。对于迫在眉睫的两个项目,如何能更快更好地完成?

  记者从国家超级计算无锡中心获悉,当前该中心正依托超级计算机和高速互联网为基础的先进计算基础设施打造超算互联网。即通过高速网络连接分布各地的超算中心,聚合多个超算中心的软硬件资源,并通过建设超算资源共享与交易平台,支持算力、数据、软件、应用等资源的共享与交易,同时向用户提供多样化的算力服务。

  “超算互联网搭建完成后,我们可以搭建一个链接各个超算设备的超算互联网平台,有效调动有空档期的超算资源,让相隔数千公里的计算机同时运行一个项目,甚至客户可以自主选择上海的超算或者是北京的超算。”超算无锡中心高级工程师叶跃进说。在神威·太湖之光超级计算机的基础上,项目组正在计划链接盐城超算中心,未来将对跨超算集群算力调度进行测试,计划于今年10月完成测试。“盐城超算中心的链接只是第一步,未来我们会打通更多个国家或地方的超级计算中心,实现每秒千亿字节的高速网络互联互通,聚合每秒不少于200亿亿次浮点运算的计算能力和1艾字节的存储能力。”叶跃进表示。

  超算互联网的搭建,意义不仅是算力的高效互联互通,更是超算从提供硬件类算力支持到提供更软的算力服务的改变。据悉,超算互联网将以超算无锡中心近日升级完成的“神工坊”2.0平台为入口。“在以前,我们和远景能源有限公司、中航商用航空发动机有限责任公司这样的大型企业合作,他们拥有自主研发的仿真软件,但是软件性能不够,我们对其进行高性能改造,提高仿真的并行规模和效率。根据调研,很多中小企业都需要使用超算的算力,尤其像无锡这样制造业面临飞快升级转型的城市,对工业仿真的需求很多。”“神工坊”平台负责人周捍珑介绍。这就需要超算来转变思路提供平台服务,降低超算使用者的门槛。

  这些年,超算无锡中心在和头部企业的合作过程中也积累了一定的技术,未来将把这些技术转成一个个成熟的产品,集成至“神工坊”平台,用户登录平台可直接使用。“我们针对特定行业、特定场景开发了多款定制APP,就像一个计算公式,简化了仿真和超算的使用流程,用户只要输入参数就可以基于超算强大算力完成工业仿真。”周捍珑说。比如最近与超算无锡中心建立合作的大连星派科技有限公司,就使用了该中心的软件支持,降低人力投入完成软件升级改造的同时,方便了产品的商业化推广。

  目前,我国超算互联网原型项目研究已取得初步成果,将于近期对外正式发布。今后,这些成果将进一步支持智能计算中心的互联,并在更高层面上支持未来算力网的构建与营运。

  (崔欣润)