做一个网站花费多少钱,深圳企业网站备案,wordpress缓存清除,律师事务所网站制作方案整理 | 夕颜出品 | AI科技大本营#xff08;ID:rgznai100#xff09;【导读】12 月 21-22 日#xff0c;OpenI/O 启智开发者大会在深圳召开。在大会上#xff0c; 国家超级计算广州中心总工程师、“天河二号”总工程师杜云飞发表了题为《星光超算应用平台》的主题报告… 整理 | 夕颜出品 | AI科技大本营ID:rgznai100【导读】12 月 21-22 日OpenI/O 启智开发者大会在深圳召开。在大会上 国家超级计算广州中心总工程师、“天河二号”总工程师杜云飞发表了题为《星光超算应用平台》的主题报告系统地介绍了星光超算平台包括该平台的架构、开发和运行等环节。天河二号也是大会主办方鹏城实验室规划建设中的“云脑”分布全国的异构超级脑计算集群的广州合作共建节点。2016 年 12 月国家超级计算广州中心成功发布了“天河星光”云超算平台。使用天河星光只需要一个网页浏览器即可登录“天河二号”。“天河二号”是一组由中国人民解放军国防科技大学研制的异构超级计算机为“天河一号”超级计算机的后继。“天河二号”于 2013 年底入驻广东省广州的国家超级计算广州中心并进行验收2013 年底交付使用后对外开放接受运算项目任务用于实验、科研、教育、工业等领域。“天河二号”造价达一亿美元从 2013 年 6 月起至 2016 年 6 月之前它都是世界上最快的超级计算机。来源维基百科 杜云飞是“天河二号”超级计算机的设计者之一他用十年的时间见证了超级计算机从“天河一号”向“天河二号”的进化之路也见证了中国超算技术的不断飞跃。此后他和团队又陆续构建了天文物理、大气海洋、工业设计制造等应用软件平台“天河星光”。基于“天河星光”超算中心已经和各大院校、科研院所合作共建大气海洋环境、CFD与工业制造、生物医药健康大数据、视频交通大数据、深度学习与认知智能等平台。 以下为演讲内容AI科技大本营ID:rgznai100整理 我今天带来的报告为《星光超算应用平台》这是我们目前正在做的一个项目目前部署在广州超算中心并已经应用到实践中。今天的会议和开源相关我们在开发过程中也得益于整个开源社区。现在做 CS 开发的人人都得益于开源社区我们不仅能够从整个社区中的大量开源代码中学习到很多而且我们的一些系统也在从这些开源项目中获得开发上的启发。反过来我们也会对开源社区有相应的反馈才形成了目前良好的开源生态环境。 建设背景 介绍一下我们这个平台的建设背景这是国家重点研发支持的一个项目。应该说我们依托超算中心来支持超算中心和新型应用的融合。大家都知道超算中心传统是以高性能计算为主。高性能计算的主流计算方式包括浮点计算为主的计算方式比如双精度浮点、高精度浮点。到了 AI 时代单精、半精甚至更低精度的计算成为主流但是应用如何更好地融合是目前超算面临的应用挑战另一方面也给超算带来一些机遇。在这种背景下我们开发了这个项目以为传统的高性能计算带来便利性建立从软件开发到管理、到运行的一体化平台。平台架构 星光超算平台架构采用微服务的软件架构这更便于程序员做相关开发和功能切分包括相应功能的升级。我们建立了以应用中心为主在此基础上的相应的资源管理、工具流数据管理和开发环境等功能以及辅助功能。整个平台采用微服务分成这几大功能来对外提供服务。 图片上是我们现在的网址见PPT通过这个网址可以访问我们的平台。星光开发 另外我们整个开发过程中使用了微服务容器化 DevOps 方法。一个科研机构做开发如何去开发一个完整的生产级产品对我们来说是巨大的挑战。我们借鉴了很多企业界的方法包括目前企业界成熟使用的开发流程可以看到星光的整个开发流程基本上是依托这些开源软件来建立的从代码开发到测试和生产环境管理整个开发过程依托开源的生态建立严格的开发流程以保证系统的可用性和可靠性。虽然我们做的是学术研究但是研究的目的是做一个可用的系统所以我们采用了非常严格的开发方法。平台运行 另外整个平台运行上我们利用目前 K8s 和容器的方法来管理平台在资源调度、部署运行、服务发现、扩容缩容方面都非常便利而且整个系统运行在 K8s 集群上通过这个系统管理不同的 HPC包括 K8s 的 CPU 集群和 GPU 集群并能够对外提供服务。应用开发环境 这是我们的应用开发环境。星光平台要支持高性能计算从应用开发到应用管理、应用服务的整个流程面对着如何提供一个传统的高性能开发环境的问题。目前我们基于容器技术的定制化云端开发环境为什么用这个大家也知道现在所有开发环境都面临一个挑战即要处理的体系结构越来越复杂包括多样化的 CPU 体系结构不同的加速器环境如何在不同体系结构下提供统一的开发环境很难。所以星光基于容器技术的定制化云端开发环境让我们可以根据自己的需求自动生成一个面向不同体系结构的开发环境便于程序员做相应的开发。 此 demo 显示在我们平台上你可以进入到相应的云端开发环境依托开发环境进行相应的应用代码编写到编译包括和后端的超算资源的对接都可以通过这个开发环境融合在一起提供一个便利的开发和调试环境。应用全生命周期管理 这是应用生命周期的管理。对于一个开发者来说超算从最开始的应用开发到完成开发的整个生态都希望他们开发的软件能够为人所用尤其是同一个领域的用户能够使用。 所以对于开发者来说经过应用开发、管理员应用审核到发布到使用者面前它就是一个应用运行的环境。我们的平台贯穿了整个应用的生命周期管理开发完之后就可以用各种各样的形式发布应用。传统的 HPC 环境下可以以命令来使用这些软件也可以用定制化容器来运行软件环境。 这是应用发布的管理当应用发布完之后可以在这个平台上通过软件界面来定制软件使用的输入和输出环境知道如何发布你的软件。管理员对应用进行相应的审核以确定可知性、安全性等相关问题因为超算不仅仅是面向计算机领域使用的还包括很多应用领域比如材料、大气海洋等所以按照相应的领域发布到这样的平台里领域用户就能够更好地找到相应的软件。基于容器的定制化运行时环境 这是一个应用运行环境如果用户想使用某个软件根据定义需要的参数就可以将应用提交到系统上运行。同时我们也使用容器技术不仅仅是 HPC包括大数据和 AI 环境都可以进行相应的定制用户可以更加便利地创建自己的以工具框架为核心的软件环境。在这个平台上可以非常便利地使用和申请相应的资源包括存储生成一个你所需要的环境入口这个入口可以进行程序编写包括需要处理的数据。处理完数据之后你还可以通过服务的形式进行发布让有需要的人通过 Web 服务的方式来访问你所获得的这些数据结果。 对整个传统的高性能计算的前后处理的全流程支持实际上计算只是 HPC 中的一部分计算的前端和后端也需要相应的支持包括模型建模到计算结果可视化整个过程在星光平台上都可以提供支持。 从上图中可以看到针对一个计算访问的任务可以直接对结果在平体上进行可视化的处理然后提交相应的任务。工作流管理系统 工作流的管理系统支持工作流从基本的编排到运行的完整功能而且支持循环结构的工作流。很多情况下我们需要一个循环结构的工作流于是我们通过对工业仿真的特征抽取设计了循环结构的工作流。另外整个流程与资源管理、数据管理进行了很好的结合并对整个工作流的任务状态做实时的监控提供可视化展示。这个过程中工作流还支持断检查和自动化的处理以支持不同领域的使用。 我们以实例来展示面向领域的工作流。这是一个汽车安全设计的工作流整合整车的碰撞模拟。这个设计过程是一个典型的多目标优化的问题。什么是多目标优化它实际上是有大量参数需要不停地寻优并需要根据结果进行反馈对上一次输入进行调整直到得到一个最优化的结果。这个过程的人工成本很高需要对结果进行人工分析然后再自动地调整上一次的输入整个过程非常复杂。所以我们把它做成一个领域的工作流可以在图形界面上定义工作流它会自动根据定义的工作流生成大量任务这些任务将对输入的参数进行自动化寻优极大地提高了整个生产过程。工作流在实际车企中得到了实际应用并极大地提升了生产效率。 在平台上我们面向调度做了一个融合调度系统。大家在云计算中使用资源调度较多的是 K8s但是我们是以 HPC 为主的调度器。现在的调度器无法在一套硬件资源上进行共存需要支撑不同场景下不同资源管理系统管理这一套计算资源不同计算资源之间无法进行共享而且是隔离的状态。为了支持不同的场景我们做了一套融合调动以实现两套管理系统之间的调度能够提高资源利用率并支持不同应用场景对资源管理系统的需求。这样是一个很好的应用用户可以多种方式使用同一套硬件资源避免了不同资源之间数据的迁移过程。面向HPC应用的镜像仓库 另外以前面向 HPC 应用的镜像仓库在云化的场景中用得非常少所以在 HPC 场景下用户自己部署应用提供了基础的环境但用户在迁移软件时面临巨大的挑战。依托这个项目我们面向 HPC 应用建立了一个镜像仓库以在不同资源之间进行迁移而且是面向公众开放的镜像仓库环境。它不仅支持传统的云服务更多是面向 HPC 场景比如 Groupmax 是面向材料、生物处理、分子动力学的场景我们把它以容器化的方式面向公众提供服务让用户可以更便利地迁移自己的软件。如果用户自己开发应用也可以多样化的形式对外提供服务。HPC 受益于开源社区不同领域都有大量科研人员贡献着自己的开源代码不管是大气、海洋还是材料计算领域很多都有相应的开源社区、开源代码在这里做贡献所以通过这种方式来建立开源社区的镜像仓库可以让用户更便利地在不同硬件资源上迁移自己的软件资源实现快速部署。 在这里用户可以发布自己的软件而且可以构建自己的镜像和镜像的运行环境这样就可以在超算上部署自己的软件环境并快速地使用这些软件资源避免传统上需要用户手动部署的麻烦。 很多 HPC 领域的用户是非实验计算机领域的装一个软件是非常耗时的过程镜像仓库可以帮助他迁移软件环境。小结 对整个平台做一个总结星光平台支持传统的应用从开发到整个运行的全生命周期的管理从应用的开发到最后应用的发布、运行整个平台上可以无缝地做完。而且通过资源管理、数据管理技术可以支持 HPC、大数据、深度学习的应用在超算系统上都可以运行这些环境。随着技术的发展传统的 HPC 领域也在逐渐使用大数据和深度学习做相应的处理。因为很多数据可能是来自于 HPC 的仿真计算或通过一些科学装置得到的数据而这些数据需要使用大数据和深度学习的技术来进行相应的处理。我们通过这些技术能够在相应的资源上很好地支持 HPC 计算和深度学习计算的融合并实现更加便利的处理。 另一方面在整个平台上我们将容器技术应用的从平台的运维到整个应用的支撑环境中。最后依托星光平台我们建立了一个 HPC 应用容器的镜像仓库未来会面向所有公众开放成为中国的高性能应用容器镜像中心HPC 用户可以非常便利地使用软件迁移应用软件。 在整个星光开发的过程中我们受益于开源软件社区虽然目前我们还没有做到很好地给开源社区做很多反馈的阶段但是在这个过程中我们从开源社区中学习到很多对于科研单位如何研究开发一个生产级的系统启发很大。 我的报告就到这里谢谢大家。 *本文为AI科技大本营整理文章转载请微信联系1092722531◆精彩推荐◆2020年由 CSDN 主办的「Python开发者日」活动Python Day正式启动。我们将与 PyCon 官方授权的 PyCon中国社区合作联手顶尖企业、行业与技术专家通过精彩的技术干货内容、有趣多元化的活动等诸多体验共同为中国 IT 技术开发者搭建专业、开放的技术交流与成长的家园。未来我们和中国万千开发者一起分享技术、践行技术铸就中国原创技术力量。【Python Day——北京站】现已正式启动「新春早鸟票」火热开抢2020年我们还将在全国多个城市举办巡回活动敬请期待活动咨询可扫描下方二维码加入官方交流群~CSDN「Python Day」咨询群 ????来~一起聊聊Python如果群满100人无法自动进入可添加会议小助手微信婷婷151 0101 4297电话同微信推荐阅读集五福我用 Python2019中国Python开发者调查报告AI 没让人类失业搞 AI 的人先失业了为什么 k8s 在阿里能成功| 问底中国 IT 技术演进好扑科技技术副总裁戎朋从海豚浏览器技术负责人到区块链揭秘区块链技术之路你点的每个“在看”我都认真当成了AI