有专门做摄影画册的网站吗,百度上搜不到网站,设计网站多少费用多少,注册公司成本多少钱摘要 本文主要介绍了共享储能的 SCADA 系统大数据架构#xff0c;以及如何利用鸿鹄来更好的优化 SCADA 系统功能#xff0c;如何为用户进行数据自助分析赋能。 1、共享储能介绍 说到共享储能#xff0c;可能不少朋友比较陌生#xff0c;下面我们简单介绍一下共享储能的价值…摘要 本文主要介绍了共享储能的 SCADA 系统大数据架构以及如何利用鸿鹄来更好的优化 SCADA 系统功能如何为用户进行数据自助分析赋能。 1、共享储能介绍 说到共享储能可能不少朋友比较陌生下面我们简单介绍一下共享储能的价值及其未来的技术发展方向。 1.1 共享储能的价值 储能技术有着巨大的价值储能的四个基本作用一是削峰填谷二是虚拟同步三是准确控制性四是响应电网的指令和控制负荷。储能的商业模式原来电源侧是自己用的它是装在电源侧但2019年6月份移到了电网侧由电网统一调度叫共享储能共享储能就由电网调度。 “共享储能”商业模式充分考虑到了各方需求。 从国际来看2021年特斯拉部署的储能项目共4 GWh2030年1500GWh 的目标对比之下翻了375倍。由于市场需求仍持续高于产能特斯拉储能业务增长依然受到供应链挑战的限制。 2020年特斯拉美国官网正式上线Megapack 工业级电池储能系统定价100万美元起而且只面向企业销售但依旧卖得火爆。在当年第二季度财报电话会议上马斯克透露Megapack 在2022年底的产能已全部售罄。 从国内来看2021年4月21日国家发展改革委、国家能源局发布《关于加快推动新型储能发展的指导意见征求意见稿》以下简称《征求意见稿》。《征求意见稿》提出目标到2025年实现新型储能从商业化初期向规模化发展转变新型储能装机规模达3000万千瓦以上。 到2030年实现新型储能全面市场化发展。
下图是彭博社关于未来共享储能市场各国装机容量的预测我们可以看到无论是中国还是美国未来的储能市场都是一个至少万亿级的市场天花板足够高。在这个新能源风起云涌的时代共享储能已经跻身成为新型电力系统的基本要素。 来源彭博社 1.2 电池储能是技术发展的未来 一般来说目前共享储能包括机械储能、电磁储能和电池也叫电化学储能。通过下表我们可以看出基于锂电池的储能技术优点明显也是目前和未来共享储能的主流。 其他还有压缩空气储能、高能电容储能、液流电池储能、钠硫电池储能、铅酸电池储能等由于地理条件限制、比能量太低等各种不同原因并不是业界的主流技术。我们的共享储能 SCADA 系统也主要基于锂电池共享储能进行建设。 2、传统SCADA系统 所谓 SCADA ( Supervisor Control And Data Acquisition ) 数据采集系统是一种集测量技术、计算机技术、通讯技术于一体的综合性集成控制系统可实现共享储能系统的实时中央监控和管理调度。 典型的 SCADA 如下图分为场站端和管理端。场站端主要是三部分下位机、通信网络、上位机。管理端一般包括前置采集、SCADA应用。 由于早期的 SCADA 系统面对的数据量相对较小因此大部分采用单机或者 C/S 架构一般采用关系型数据库比如MySQL、SQL Server 等进行存储。随着采集数据的增多这样的系统不能保存过长时间的数据都会设置几个月的定期数据清理策略如果要进行长周期的数据对比分析则很难满足需求。 以下是一个我们客户之前用的传统 SCADA 系统 3、基于大数据平台的共享储能 SCADA 系统 随着各种新能源风能、太阳能电厂的建设电厂的数据采集层具有数据采集量大、采集频率高的特点历史库必将形成复杂、异构的储能大数据传统的SCADA系统开始面临计算机 CPU 升级、内存不足、计算机硬件扩充、成本增加等一系列的问题。传统的数据处理方式难以快速处理海量的共享储能大数据。 因此我们的共享储能客户提出要基于大数据平台进行共享储能 SCADA 系统的建设。 3.1 总体架构 一般来说共享储能电站主要由变配电设备、储能电池组、能源管理系统( EMS )、电池管理系统( BMS )、能量转换控制系统( PCS )及 SCADA 系统组成。 在建设中我们考虑到现有共享储能系统复杂、采集点比较多的特点采用了时序数据库进行主要数据存储。另外共享储能系统一般要求是在一个封闭的环境下无法连接互联网因此我们会通过一台基于 GPS北斗的时间服务器进行时间同步。 下图是我们共享储能 SCADA 系统的示意图 为了能更方便的集成一些第三方标准采集盒子我们采用了 MQTT 协议作为数据传输的主要协议这样对于第三方标准的采集盒子仅仅需要进行简单的配置就能把数据采集上来。 为了更加灵活的进行采集程序编写我们采用的是 Python 语言进行开发对于数据展示、分析端我们进行了前后端分离后端使用主流的 Java 框架 Spring Boot 进行开发前端采用 Vue 进行开发。 3.2 数据存储 采集的数据主要存储在 InfluxDB 中对于一些特殊的报表需求我们会定时ETL数据到 MySQL 关系型数据库中。 对于 InfluxDB 的存储结构有一些查询的效率会比较低因此会提前进行预计算以满足快速的数据分析需求。当然对于大数据系统这也是一个非常常用的要求好在 InfluxDB 提供 Rollup 的功能能很方便的通过编写 SQL 语句根据采样的精度和数据聚合方式进行预计算。 3.3 实景拍摄 这是第一个应用我们 SCADA 系统的共享储能电站实景拍摄图该共享储能电站基本上具备了一般共享储能电站的主要功能削峰填谷、响应电网的指令和控制负荷。 3.4 系统界面 下图是我们一个共享储能电站的主系统图图中所有的数据都是实时进行采集显示。此外根据客户的需求也能直接在系统图上进行一些简单的系统交互控制。 一般在共享储能电站的 SCADA 系统首页用户希望能看到储能系统响应电网计算机 AGC 指令的实时情况从而快速分析出当前储能系统的工作功率。下图是我们建设的一个典型的 SCADA 系统首页 4、利用鸿鹄优化共享储能 SCADA 系统 在了解到国内推出了一款新的大数据产品我们就希望能尝鲜体验当然之前我们也考虑过一些其他产品但是从价格、易用性方面比我们现有架构并没有明显提升。 4.1 我们的痛点 虽然我们之前基于大数据平台建立的产品比原有传统的 SCADA 系统已经有了很大进步但是仍然还是有一些不太令人满意的地方。 4.1.1 缺乏灵活性 对于共享储能SCADA系统来说除了和一般SCADA系统一样具有监控的功能外更重要的是共享储能SCADA系统必须响应电网的指令精准控制储能系统出力(也就是我们前面提到储能的四个基本作用的后面两个)提供数据分析服务和辅助决策。 共享储能系统建成后大约3-6个月的时间都处于电网指令响应算法的调试期为了针对算法模型进行调参优化电力工程师和算法工程师就会不断的有很多临时的想法在看到算法调整后的数据变化用户会进一步希望有一些新的指标或者统计图表呈现。 由于所有的统计分析功能都需要用Java代码进行实现一旦用户提出更多的数据分析需求就要重新对需求进行排期。如果能有一款所见即所得的辅助数据分析工具显然能更好的满足一些临时性、探索性的分析需求。加快共享储能系统的算法模型调试进度。 4.1.2 ETL依赖 虽然我们核心的采集数据都保存到了 InfluxDB目前一个储能电站的每日采集数据量大约是8-12GB目前我们建设第一个共享储能电站SCADA系统运行一年后大约有3TB的累计数据。有一些报表通过 SQL 直接查询 InfluxDB 效率就会比较低下因此我们就会把一部分统计报表的数据从 InfluxDB 通过 ETL 脚本抽取到 MySQL 中以应对相对复杂的分析报告需求。 4.1.3 扩展价格昂贵 随着数据量的增多未来如果要采用 InfluxDB 集群这个代价也是相当高的。由于社区版的 InfluxDB 不支持集群模式所以我们从相关渠道打听过支持集群模式的 InfluxDB 企业版据说价格能达到百万这显然对于一个SCADA 系统来说无法承受。 4.2 选型对比 基于提高灵活性、减少对 ETL 的依赖以及合理的成本等几项要素我们更多的偏向于 ElasticSearch、Splunk 等能够省去 ETL 过程、建模更加灵活的产品刚好最近从业界的朋友得知国内一个实力强劲的团队发布了一款比Splunk 更好的产品——鸿鹄社区版就忍不住想上手试试。尤其是当我们看到鸿鹄的读时建模和向量加速的特性的时候显然能解决我们之前的痛点。 4.2.1 读时建模 按照官方文档的解释“读时模式”是一种在搜索数据的同时从原始数据提取有用字段 field 的技术。由于可以省去ETL部分该技术可以极大的减少数据导入时候的开销。这一点非常适合我们 SCADA 系统用户的一些临时性、探索性的需求。 尤其是当数据采集进入平台的时候直接存储原始数据通过定义一些列字段提取规则在查询时动态的根据引用到的规则从原始数据中提取字段值。 此图来源于鸿鹄官方文档 4.2.2 向量加速 通过在使用中我们还发现了鸿鹄系统的一个非常重要的特性就是使用了向量加速计算向量计算能充分利用CPU的SIMD(Single Instruction Multiple Data)指令SIMD是一类特殊的CPU指令类型这种指令可以在一条指令中同时操作多个数据大大提升了数据处理的性能这也是鸿鹄在安装的时候为什么要求CPU必须支持AVX2 指令集的原因。 4.3 新的架构 我们新的架构将鸿鹄替代关系型数据库如果在装机容量不大的储能电站甚至可以做为主数据存储使用。 如下图所示通过和鸿鹄的整合提升了现有SCADA 系统的灵活性相当于直接给原有的系统进行了自助分析赋能。 在新的架构中我们会让鸿鹄和InfluxDB共同工作。使用鸿鹄一方面替代了MySQL的作用以及一部分InfluxDB的预计算处理另外一方面我们可以让用户直接登录鸿鹄的管理界面进行一些自助的数据分析这也是之前用户一直期望的。 4.4 项目集成 说了这么多已经迫不及待进行系统集成尝试了。 4.4.1 鸿鹄系统的安装 鸿鹄系统的安装非常简单基本上按照官方文档一步步下来很快就能搞定系统内存也只是需要 8G 的限制在如今手机内存都超过 8G 的年代还是非常良心的配置要求。 不过由于鸿鹄使用了矢量计算技术官方文档提示鸿鹄计算引擎使用了 AVX2 高级指令集做向量计算加速因此鸿鹄需要运行在支持 AVX2 指令集的 CPU 上。
当然官方文档给出了测试方法可以运行以下命令得知CPU是否支持AVX2 指令集 刚好我有一台现成的老服务器赶紧进行测试。不幸的是他……不支持。 很快我找来一台云主机完美解决。 安装需要安装docker以及其他一些相关组件不过安装过程非常简单完全按照官方安装文档https://yanhuang.yuque.com/staff-sbytbc/rb5rur/auwfm3?一步步进行即可。 这是安装完成后的界面确实是“大数至简”。 4.4.2 接收MQTT数据 为了能赶紧试试鸿鹄的功能我们需要先把数据灌进来当然如果只是试用你可以用 csv、json 等文件导入数据。 由于在之前的架构中我们会采用 EMQX 来采集各种设备的数据所以在试用的过程中我简单的开发了一个从EMQX 接收 MQTT 数据并转发到鸿鹄的服务并已发布到 Github 平台上。 开发过程就不细表大家可以到如下地址看到并下载
https://github.com/neulf/mqtt-honghu 4.4.3 数据预计算技术 由于数据量的增大我们在 InfluxDB 上一般会采用 Rollup 进行预计算以增强对大数据的处理能力提高查询性能。因此对于一款新的大数据产品很自然地我们对数据预计算方面也非常关切。 从官方文档上我们发现鸿鹄提供了多种数据预计算技术包括物化视图、预存查询、定时报表你可以在官方文档中看到这几种技术的应用场景我就不在这里一一赘述。 4.4.4 灵活的查询 鸿鹄提供简易查询和高阶查询的功能支持业界通用的生产力工具——SQL 进行查询这一点对于大部分工程师、数据分析人员甚至一部分资深的运营人员都是很方便的。 有关鸿鹄SQL的介绍请参考这里
https://yanhuang.yuque.com/staff-sbytbc/rb5rur/znakv0? 4.4.5 丰富的开箱即用图表 鸿鹄提供了非常丰富的图表对于一个使用过一些商业BI产品比如Tableau、PowerBI的人来说这款社区产品真的是非常给力我们尝试把之前需要进行定制开发的功能比如 AGC 指令、系统出力功率等指标的对比曲线用鸿鹄的高级查询功能实现真的是非常简单。 4.5 总结 从试用来看鸿鹄是一款安装非常方便具备丰富的图表分析功能的社区产品。由于我没有对鸿鹄和一些时序数据库进行插入性能方面的基准测试但是从其他搜索引擎和时序数据库的对比以及个人经验来看对于采集并发性能要求不是太严苛的新建共享储能 SCADA 系统可以直接采用鸿鹄做为主存储进行使用如果是已建项目的改造或者对性能要求非常高可以考虑架构上采用时序性数据库配合鸿鹄的方式。