郑州网站设计多少钱,济南优化联系电话,房地产开发公司招聘,网站基础内容StorageReview实验室团队利用先进的计算系统#xff0c;成功将π计算至202.112.290.000.000位#xff0c;刷新了自己之前保持的105万亿位的世界纪录。这一成就突显了现代高性能计算#xff08;HPC#xff09;和精心设计的商用硬件平台的卓越能力。 关键技术组件#xff1a…StorageReview实验室团队利用先进的计算系统成功将π计算至202.112.290.000.000位刷新了自己之前保持的105万亿位的世界纪录。这一成就突显了现代高性能计算HPC和精心设计的商用硬件平台的卓越能力。 关键技术组件
计算平台 搭载Intel Xeon 8592处理器提供强大的计算能力。存储解决方案 使用了28块Solidigm P5336 61.44TB NVMe SSD总存储容量接近1.5PB展现了极高的存储密度和带宽。计算周期 近乎连续的85天计算显示了系统的稳定性和持续运行能力。
技术挑战与解决方案
内存与存储限制 面对大规模数字运算的内存需求团队通过优化的算法和高效的存储解决方案克服了这一难题。计算π所需的大量算术操作特别是乘法对内存访问速度提出了极高要求团队通过高密度SSD和优化的I/O管理来缓解这一压力。算法选择 利用Chudnovsky算法该算法基于快速收敛级数适合处理大量数字计算且对存储和计算资源的需求进行了有效平衡。系统设计 专门定制的Dell PowerEdge R760服务器配备24个NVMe直连驱动器背板优化了I/O性能减少了外部硬件依赖提高了系统的整体稳定性和效率。
关键发现
存储密度与带宽的重要性 QLC SSD虽在速度上可能不占优势但其高密度和并行读写能力在大规模数据处理任务中展现出优势成为本次计算的关键因素。直接连接NVMe的优势 直接连接的NVMe存储解决方案提供了最高水平的性能确保了计算过程中数据交换的高速度成为计算瓶颈的主要解决方式。系统集成与优化 系统级的优化包括CPU到存储的匹配比例2:1驱动器到计算比率以及对硬件的直接控制通过y-cruncher软件对于实现最佳性能至关重要。
结论 StorageReview实验室的这一壮举不仅代表了π计算领域的重大突破也为高性能计算、大规模数据存储与处理技术的研究提供了宝贵经验。通过精心设计的硬件配置和算法优化团队展示了如何克服传统内存与存储限制实现前所未有的计算成就。未来此类技术进步有望促进科学、工程等领域内更多创新应用的发展。 在探索测试大容量SSD的有趣方法时自然而然地想到了在CPU和系统评测中常用的工具y-cruncher。当进行大量计算并使用交换空间时所需的空间大致是数字大小的4.7:1这意味着计算100万亿位π大约需要470TiB的空间。简而言之y-cruncher采用的Chudnovsky算法基于模函数理论和椭圆曲线理论衍生出的一个快速收敛序列。该算法的核心是一个无限序列 关于100万亿位和105万亿位π计算最常见的疑问是“这有什么大不了的为什么需要这么久和这么多内存”这个问题伴随着对开源软件及开发者Alex Yee编程能力的其他质疑。从系统层面来看计算如此庞大的π数字如100万亿位需要大量空间因为涉及到复杂的算术运算尤其是大数乘法这本身就要求大量的内存。最优的大数乘法算法大约需要4N字节的内存来处理N位数大部分用作临时存储空间。计算过程中多次访问这些内存使得整个过程更依赖于磁盘I/O而非CPU性能。 Chudnovsky公式因其在计算π的多位数字方面的广泛应用而闻名它要求大量的算术运算包括乘法、除法和平方等这些通常归结为大规模的乘法操作。过去超级计算机使用AGM阿贝尔-戈德纳-马斯刻若尼算法尽管速度较慢但易于实现且能借助多台机器的简单粗暴计算力。然而现代技术进步已将瓶颈从计算能力转移到了内存访问速度上。 处理器中的算术逻辑单元ALUs和浮点运算单元FPUs处理这些大数乘法的方式类似于纸上演算将其分解为更小、更易管理的操作。以前π的计算主要受限于计算能力但如今计算能力已超过内存访问速度使得存储和可靠性成为了创造π计算记录的关键因素。例如在我们的128核Intel机器和256核AMD Bergamo之间性能差异不大重点转向了磁盘I/O效率。 Solidigm SSD在这些计算中发挥着关键作用其重要性并非源自其内在的速度而是其卓越的存储密度。消费级NVMe驱动器能在较小体积内存储高达4TB的数据而企业级SSD则通过堆叠芯片进一步增加容量。尽管QLC NAND相比其他类型的闪存可能速度较慢但密集型SSD中的并行性提供了更高的聚合带宽使其非常适合大规模的π计算。 当我们面对超大数字运算这些数字无法一次性装入系统内存时计算机必须依靠软件算法来执行多精度算术。这些算法将大数分解成可管理的小块并采用特殊技巧进行运算处理。这里Solidigm P5336 61.44TB NVMe SSD 的重要性显现出来。y-cruncher 软件会利用这些可管理的数据块首先在系统内存中累积它们然后将这些数据块交换到临时存储空间scratch drive space中去。 需要注意的是由于上述复杂公式的每一个部分都需要由大量的比特来表示因此在进行数据交换时我们需要大约4.7:1的空间比率。 y-cruncher 内置了一个硬盘空间需求估算器即便这个标签还保留着“disk”的旧称我们在当前以及过去的计算中发现它非常准确。尽管你可以使用HDD或其他对象存储来应对大容量需求但在第一次尝试中我们就发现这只是复杂方程中的一个因素。随着AI应用的兴起如何在靠近计算设备的地方获得足够大且速度快的存储成为了我们StorageReview日常工作中反复出现的主题。在这一计算过程中交换空间的性能是最大的瓶颈。直接连接的NVMe存储提供了最高的性能选项尽管某些方案可能在单个设备的吞吐量上更快但我们使用的大型高密度QLC SSD阵列在总体上完全能满足这项任务的要求。 在消费者级硬盘和CPU性能方面y-cruncher同样内置了基准测试功能允许用户调整各种参数以找到最适配硬盘阵列的性能设置。这一点极为关键。上面的截图展示了这一基准测试为消费者系统提供的反馈信息包括CPU处理速度和SSD性能指标。 尽管开发者Alex提供了详尽的文档但经过数周的测试我们发现让y-cruncher直接与硬盘交互是最佳方案。我们尝试过网络目标、通过SAS RAID卡连接的硬盘、NVMe RAID卡以及iSCSI目标。当将硬件控制权交给y-cruncher时性能差异显著。iSCSI也表现出可接受的性能但我们仅在输出文件阶段测试了它这部分可以利用“直接I/O”进行交互。至于交换模式下的RAID代码显然经过了深思熟虑我们的测试结果及与开发者的交流表明它能够以较低层级与硬盘直接协作从而优化整体表现。