搜索 解放军报

算力网络:计算资源中的“交响乐团”

来源:中国军网-解放军报 作者:江 冉 姚昌松 杨翔瑞 责任编辑:王韵
2024-04-26 08:15:02

算力网络:计算资源中的“交响乐团”

■江 冉  姚昌松  杨翔瑞

前不久,世界互联网大会国际组织在西班牙巴塞罗那举办了以“算力网络:智能网络赋能智慧世界”为主题的专题论坛。

事实上,我们生活中的许多方面都与算力息息相关:当你坐在电脑前,沉浸在大型游戏的虚拟世界中时,流畅的游戏体验背后正是计算机算力在默默提供计算支持;当你在线观看一部高清电影时,算力帮助你感受到高清的画质和震撼的音效,让你不错过任何一个精彩瞬间……

算力网络概念图。制图:江  冉

当今时代,经济社会数字化转型升级进程不断加快,5G、大数据、人工智能等新技术新应用对算力的需求越来越高,算力在经济社会发展中的支撑作用愈发凸显。时至今日,传统的计算模式已无法满足大量计算资源的需求,“算力网络”应运而生,并呈快速发展之势。

那么,什么是“算力网络”?“算力网络”有哪些优越性?未来的发展前景如何?请看本期解读。

让“云”更有序,让“云”更易于落地

算力是指设备根据内部状态的变化,每秒可以处理的信息数据量,简单来说就是计算能力。

早在东汉末年,中国社会就出现了一种基于人力的算力——算盘。有了算盘,人们的计算速度明显提升,解决了当时社会绝大多数的计算问题。

17世纪中叶,法国数学家帕斯卡设计出一种能通过机械运动自动完成计算的机器,这就是世界上第一台机械计算机。步入20世纪40年代中期,美国宾夕法尼亚大学电工系为美国陆军军械部某弹道研究实验室,研制了一台用于炮弹弹道轨迹计算的“电子数值积分和计算机”。

同时,集成电路的发展和冯诺依·曼体系结构的提出,让计算机产业发展进入“快车道”,计算机成为当时世界范围内最具战略价值的产业。英特尔公司创始人之一戈登·摩尔曾提出“摩尔定律”来归纳当时信息技术进步的速度:当价格不变时,集成电路上可容纳元器件的数目,平均约每隔18~24个月便会增加一倍,性能也随之提升一倍。

随着技术的进步,摩尔定律所描述的增长趋势逐渐面临物理限制,芯片制程技术的物理极限使得集成电路上的晶体管数量增加速度放缓。人们对计算机性能的需求越来越高,单纯的芯片制程技术进步已经无法满足需求。

在此背景下,2006年,谷歌前CEO埃里克·施密特第一次提出了云计算的概念。云计算通过互联网将网络上的服务器、存储等资源集成为“云”,将所运行的巨大数据计算处理程序分解成无数个小程序,交由计算资源共享池进行搜寻、计算及分析后,再将处理结果回传给用户。简单地说,云计算就是将任务分解成不同的部分,在不同的服务器上计算完成,然后再合并起来。

算力网络是云计算的升级版、应用版。通俗地讲,算力网络更加立体、泛在,以算力集群的形式,实现算力的协作化、集约化、普惠化。从云计算升级为算力网络,“云服务”变得更优质、更精准,“云应用”也有了更多、更丰富的应用场景。

让“云”更有序,让“云”更易于落地。算力网络的出现和发展,为当前火热的人工智能大模型提供了更好的算力支撑。面对当前全网算力利用率较低,以及不同用户的多元化算力需求,算力网络成为一种新的更富有效率的解决方案。

作为数字新基建的核心底座,算力网络就像是一个庞大的“交响乐团”,海量算力资源参与其中,共同汇聚成一个有机整体,以数据为乐谱音符,共同合奏出一曲优美的“算力乐章”。

“做大做强”与“灵活精准”并行不悖

算力网络实际上由三个部分组成,除了“算”和“网”以外,还引入了“脑”。“算”由CPU、GPU等计算资源组成,用于生产算力;“网”则是指路由器、交换机这些网络设备,用于连接算力;“脑”是一个控制设备,就像整个算力网络的“军师”,对算力网络和资源进行统一编排、调度、管理和运维。

算力网络就像是一台“超级计算机”,先汇聚全网的算力,再用“脑”把数据合理地分配到“超级计算机”的每个计算单元中。

由于汇聚了全网的计算资源,算力网络最显著的优点就是拥有大规模的计算能力,支持大规模的计算任务。同时,算力网络还具有卓越的弹性和可扩展性,能够灵活应对各种复杂场景和需求。

一方面,算力网络可以根据用户的实际需求,为用户弹性提供最为合适的计算资源:如果是小型数据计算任务,算力网络就提供小规模的算力;如果用来训练大型深度学习模型,算力网络也可以迅速调动资源,提供相对应的计算能力。有一个生动的比喻这样说:“算力网络就像一个‘万能水龙头’,用户无需顾虑其他限制,只需要按照自己的需求调节‘开关’,即可实现随取随用的计算服务。”

例如,2023年联通公司自主研发算网大脑管控系统,为客户提供超低时延、泛在接入、智能敏捷的算力网络。据悉,该算力网络协助华山医院成功开发了首个手术导航医疗算法模型,用以模拟手术操作过程、辅助医生制定手术策略、协助分析和挖掘海量医疗数据、发现医疗领域的趋势和规律,等等。

另一方面,算力网络允许网络随业务需要无缝增加新节点,通过灵活扩展提升算力。这种动态扩展能力确保了系统的稳定,使之在面对突发流量或大规模数据处理任务时也能够迅速响应,尤其在云计算、大数据、人工智能等领域,其广泛的应用更加令人瞩目。

例如,谷歌公司的GFS、HDFS等分布式文件系统,以及MapReduce、Spark等计算框架,就能够实现轻松扩展,支持大规模数据的存储、访问和处理,确保了其发展的可持续性和韧性。

与云计算和边缘计算相比,算力网络融合了两者的优势,使得数据处理更加高效、灵活。云计算模式虽具备强大的计算能力,但将所有数据上传至云端处理,增加了传输数据的时间延迟;而边缘计算虽然通过将数据处理工作移至网络边缘,有效降低了时延,不过其计算能力却相对有限。算力网络则汲取了两者的精髓,通过智能的任务分发和资源调度,能够迅速判断任务类型并合理分配资源。这种精准的任务处理策略不仅提高了计算效率,还确保了数据的实时性和安全性。

“做大做强”与“灵活精准”并行不悖。算力网络在应对大规模复杂计算任务时,展现出的精准高效的计算执行力,让各行各业想要快速获取可靠算力的人趋之若鹜。

“算”“网”“脑”融合,军事应用前景广阔

随着军事现代化步伐加快,信息化和智能化已经越来越成为现代化战争的重要特征。算力网络作为数据资源调度平台、未来的信息基础设施,也将逐步融入信息化联合作战、军队组织形态建设与军事科研发展当中,发挥重要的“赋能”作用。

训练决定战斗力。利用“科技+”的方式进行模拟化训练,不仅可以降低资源消耗、装备磨损和伤亡的风险,还可以不受时空限制营造出近似实战的对抗环境。当前普遍采用的VR虚拟仿真技术,其模拟的环境越贴近实战,越需要庞大数据的支撑。利用算力网络提供的庞大算力,可以实现对模拟环境精细的场景建模、真实的物理仿真、逼真的光影效果,为军事人员提供身临其境的虚拟训练体验,帮助指战员熟悉各种作战场景。

例如,上世纪90年代,美国陆军投资近10亿美元研制的网络化作战模拟训练系统,是迄今为止美国陆军最大的分布式交互模拟系统。如今在算力网络的加持下,结合分布式交互仿真技术,该系统能够建立更加精细逼真的虚拟作战环境,更加智能、高效地支持军事训练,部队的实战能力和应对复杂情况的能力也因此得到有效提升。

如今,海量的战场数据要求更快速的信息存储、处理和分析能力。算力网络可充分发挥自身优势,快速处理海量的情报信息,通过加速信息融合、辅助决策制定和作战指挥,提高作战效率和精度。例如,在雷达探测领域,雷达系统产生的大量信号数据,需要进行复杂的信号处理和目标识别,此时算力网络强大的计算能力可以帮助系统更准确地识别和跟踪目标。

此外,大模型的广泛应用进一步凸显了算力网络的重要性。算力网络可以借助复杂机器学习算法和人工智能模型进行训练推理,以便更好地从庞杂的数据中提取有用的信息,进而加快指挥决策进程。

例如,美国Scale AI公司的大语言模型Scale Donovan就可以帮助作战人员、分析人员和决策者提高对战场态势的理解和行动速度。2023年5月,美国陆军将Scale Donovan系统置于其第18空降师的加密网络,主要用于帮助该空降师部队制定决策。

算力网络的关键在于“互联”。从世界范围看,算力网络目前还面临资源调度技术存在瓶颈、产业生态尚未成熟等发展挑战,其军事应用也处于刚刚起步阶段。尽管如此,算力网络将“算”“网”“脑”融为一体,其发展趋势是毋庸置疑的。随着技术不断进步和应用不断拓展,算力网络作为信息化时代的关键“基础设施”,将影响甚至决定着各个领域的数字化、网络化、智能化发展进程,带动各行业转型升级,在带来巨大发展机遇的同时,催生超乎人们想象的应用与改变。