河北黄骅市网站建设,网站外链的优化方法,交易网站建设计划书,学室内设计要多久能学会文 | SisyphusBJ源 | Pytorch Lightningwandb.aicomet.mlneptune.aiallegro trainsmlflowguild.aisacredtest-tubetensorboard相信很多同学看到上面这个列表的第一印象是懵的。我们先看下机器学习实验管理平台 到底是做神马滴#xff1a;一句话概括就是#xff1a;#xff0… 文 | SisyphusBJ源 | Pytorch Lightningwandb.aicomet.mlneptune.aiallegro trainsmlflowguild.aisacredtest-tubetensorboard相信很多同学看到上面这个列表的第一印象是懵的。我们先看下机器学习实验管理平台 到底是做神马滴一句话概括就是以下来自 comet.ml 对自己的说明 allowing data scientists and teams to track, compare, explain, and optimize experiments and models.接下来我们逐个盘点下当前市面上做机器学习实验管理平台的玩家。先看两个用的比较多但功能相对单薄的两个工具一个是Tensorboard包括用于 Pytorch 的 TensorboardX(https://github.com/lanpa/tensorboardX) Tensorboard 本身被设计成插件化的方式好处是轻量、轻耦合可以按需要很快的自定义一个新的 tab这种方式的缺点是缺少一个用户整体的视图用户很难在宏观视角上对整个训练流程有一个比较清楚的认识。出的比较早格式通用虽然是跟 Tnesorflow 出的但并不仅限于 Tensorflow实验全流程记录报表和跟其他系统的兼容性比较好因为出的早?...2. 另一个是来自 Pytorch Lightning 的 test-tube, 后者可以算是 PL(Pytorch Lightning) 自己的一个 logger 优化工具也放在这里一并比较了吧有兴趣的同学可以去PL(Pytorch Lightning: https://github.com/PyTorchLightning/pytorch-lightning) 查看细节。接下来看下主要的 SAAS 玩家当然基本上每家都同时提供 self-host 方式可选择毕竟 SAAS 号称主要是卖服务的。首先当然是 comet.ml,主要的功能如下 :假设你手头同时有十几个、几十上百个实验要做那么 comet 或者其他这些工具会必不可少团队协作把几个可能的方向分给其他同学实验过程、结果分享comet 兼容目前主流的 tensorflow、pytorch、keras、chainer 等等框架comet 支持你针对同一个实验里的不同超参数进行比较找出关键点comet 支持保存实验所用数据、上下文信息、代码等等各种类型的数据可视化懒不想自己部署实验管理工具。当然这里你可以找下 IT 组的同学看他们能否帮你搭建一套开源的类 comet 的系统。2. 接下来是 neptune.ai, 这个就很有趣了但从名字上看comet 是彗星neptune 是海王星从 neptune 的官方 blog 上看起来也大有针对 comet 的意思... 停止八卦下面看主要功能简介首先 neptune.ai 的定位是一个“实验管理和协作工具”Neptune is an experiment management and collaboration tool。当然也是 frame-agnostic 的。neptune 支持实验数据、模型、代码等相关数据的存储、获取、共享操作neptune 在团队协作上据说更有效率一些neptune 支持通过 notebook、python script 等方式触发的训练过程记录当然默认其实也就只记录一下你的主要损失函数 loss 值和 epoch 这种真要做到细致能指导自己实验思路的还是得花心思在配置代码上面。最后neptune 的 client 端 code 跟 wandb/comet 比写的是最简练的个人喜好。3. 然后是 wandb.aiwandb 就是 Weights Biases 谜底就在谜面上名字起的有点意思功能也不错Reports 功能很有特点基本上就是把你的实验整理成一个 blog 文档你做的什么实验、怎么做的、选的那些参数为什么这么选都可以有个记录形成文档之后可以把相关的实验附上去请团队的人或者其他感兴趣的人一起来探讨隐隐有点社区的意思赞其他功能中规中矩基本上 cover 了上面提到的几个基本功能用户和团队管理数据和实验过程分享UI 挺简洁跟其他产品的兼容性也不错毕竟是半开源因为他的 server 端提供的也是 docker 镜像。4. 最后是 guild.ai终端的 client 程序做的挺用心文档写的比较简洁其它基本跟上面三个一样to run, track, and compare experiments.通用性更好一些据说对模型实现语言、framework 中立方便重现效果对其他系统兼容性佳以上是几个主要的 SAAS 玩家下面说一下开源的几个选手:allegro trains 其实产品名字叫 Trains 是 allegro.ai 出的是这几个产品中唯一一个客户端、服务端都开源的产品基于 Apache 2.0 协议开源限制比较小企业部署的话可以考虑一下服务端也开源有兴趣自己折腾的企业可以优先考虑内网部署一下web 端风格比较贴近前端主流风功能跟其他 saas 基本没什么大的出入这家的思路基本是反 saas嗯这点也挺有意思2. sacred单机版没有团队分享功能但好处是兼容了几个其他的 frontend比如 neptune 就可以用作接受 sacred 发过来的数据。其他还有 Omniboard3. mlflow, Databrick 出品没错就是 Spark 家那个功能上跟其他项目比也没有他多的出入实验跟踪和记录项目管理模型管理以上这两个从产品上基本上都囊括在上面介绍的几个里面了这里就不再深入展开如有需要请自行去 github 上查看。后台回复关键词【入群】加入卖萌屋NLP/IR/Rec与求职讨论群有顶会审稿人、大厂研究员、知乎大V和妹纸等你来撩哦~