当前位置: 首页 > news >正文

天津建站管理系统价格ps做的网站怎么到网站上预览

天津建站管理系统价格,ps做的网站怎么到网站上预览,广州招聘网最新招聘,wordpress 锚点为了让模型迭代过程更加可操作#xff0c;并能够提供更多的信息#xff0c;Uber 开发了一个用于机器学习性能诊断和模型调试的可视化工具——Manifold。机器学习在 Uber 平台上得到了广泛的应用#xff0c;以支持智能决策制定和特征预测#xff08;如 ETA 预测 及 欺诈检测…为了让模型迭代过程更加可操作并能够提供更多的信息Uber 开发了一个用于机器学习性能诊断和模型调试的可视化工具——Manifold。机器学习在 Uber 平台上得到了广泛的应用以支持智能决策制定和特征预测如 ETA 预测 及 欺诈检测。为了获得最佳结果我们在开发精准预测机器学习模型上投入了大量资源。事实上对从业者来说他们通常把 20% 的精力放在构建初始的工作模型上而把 80% 的精力用来提高模型性能这就是所谓的机器学习模型开发 20/80 分配法则。 传统上数据科学家在开发模型时会使用汇总分数如 对数损失、曲线下面积area under curve简称 AUC 和 平均绝对误差mean absolute error简称 MAE 来评估每个候选模型。尽管这些指标提供了有关模型执行情况的见解但是它们没有传达很多关于模型为什么表现不佳以及如何提高其性能的信息。因而模型构建者倾向于依赖反复试验和误差来决定如何改善模型。 为了让模型迭代过程更加可操作并能够提供更多的信息我们开发了 Manifoldhttps://arxiv.org/pdf/1808.00196.pdf。它是一个用于机器学习性能诊断和模型调试的可视化工具。Manifold 利用可视化分析技术让机器学习从业者能够超越总体指标检测模型没能精准预测的数据子集。Manifold 还通过揭示性能表现较好和较差数据子集之间的特征分布差异来说明模型性能表现不佳的潜在原因。此外它还可以揭示对于每一个数据子集一些候选模型将有怎样的预测准确性差异从而为一些高级处理如模型集成提供根据。 在本文中我们将介绍 Manifold 的算法和可视化设计以及 Uber 是如何利用这工具来获得模型见解以及提高模型的性能。 Manifold 背后的动机 鉴于其复杂性机器学习模型本质上是不透明的。随着机器学习越来越成为 Uber 业务不可分割的部分我们需要为用户提供工具使模型更透明且易于理解。只有这样他们才能自信自如地使用机器学习生成的预测而新兴的机器学习可视化可以解决这个问题。 以前的机器学习可视化方法通常包括直接可视化内部结构或模型参数和受底层算法约束的设计导致无法扩展到可以处理公司范围内的通用用例。 为了应对 Uber 面临的这个挑战我们构建了 Manifold 来提供机器学习模型服务并从分类和回归模型开始。Manifold 通过揭示数据子集之间的特征分布差异为机器学习模型开发黑盒提供了更高的透明度。 借助 Manifold 的设计我们颠覆了传统机器学习模型的可视化。我们不检查模型而是通过以下方式检查各个数据点 识别影响模型性能的数据段以及这些数据如何影响模型的性能 评估这些数据段的聚合特征以便识别某些模型行为背后的原因。 这个方法有助于实现模型无关性这是在识别模型集成机会时特别有用的功能。 可视化和工作流设计 除了在《Manifold: A Model-Agnostic Framework for Interpretation and Diagnosis of Machine Learning Models》一文中所描述的研究原型之外我们专注于揭示大量高维 ML 数据集中的重要信号和模式。在以下部分中我们将讨论 Manifold 的界面和用户工作流深入介绍我们的设计考虑事项并解释支持此类可视化分析的算法。 图 1. Manifold 界面包括两个部分分别是性能比较视图左侧和特征属性视图右侧。 Manifold 的界面由两个可视化部分组成 性能比较视图由小提琴编码的多路图组成用于比较模型和数据段之间的性能。图 2. Manifold 性能比较视图的可视编码由 x 轴和 y 轴以及颜色组成x 轴表示用户选定的性能指标如对数损失或平方对数误差或者原始预测而 y 轴表示数据段颜色表示模型。曲线高度显示了在每个数据段上每个模型的性能分布。 特征属性视图由两套特征分布直方图构成用于比较两个选定数据段的特征。图 3. 特征属性视图的可视编码包含 x 轴特征值范围和 y 轴数据点的个数以及颜色数据段组。根据两个数据段组的分布差异对特征进行排序。 Manifold 通过以下三个步骤帮助用户发现模型需要改进的区域 比较首先给定一个具有一个或多个机器学习模型输出的数据集Manifold 比较并突出显示模型或数据子集之间的性能差异图 3a。图 3a 切片该步骤允许用户根据模型性能选择感兴趣的数据子集以便进行进一步的检查图 3b。图 3b 属性然后Manifold 突出显示所选数据子集之间的特征分布差异帮助用户找到性能结果背后的原因图 3c。图 3c 我们使用 Manifold 比较模型在不同数据点也即特征值上的表现。作为设计替代方案该可视化的直接实现如下图图 4所示图 4. 该可视化原型显示了数据空间中的模型性能根据其性能x 轴和其中一个特征的值y 轴定位每个数据点。 在图 4 中图中的每个点代表模型 x 在数据点 y 上的性能。尽管在理论上这个概念是成立的但实际上该方法存在 3 个主要挑战 因为有太多的点无法清楚地识别模式需要通过抽离或减少点来揭示模式。难以确定哪些特征对于 y 轴最有价值以便识别出相关模式。随着模型数量的增加不同模型之间的比较变得更难。 为了提前解决这些问题我们实现了一些聚合 / 简化操作。我们不单独表示每个数据点而是把它们组成子集。我们没有使用 y 轴来编码特定特征的值而是使用了表示不同数据子集的分类轴。该方法演变成我们最终的性能图表带来了以下两个好处 基本相似的数据点不会重复出现在图表上只突出显示最主要的高层差异。因为减少了图表中各种形状的数量可以在同一图表中绘制不同的模型以更好地加以比较。 在该工具的性能比较视图中揭示模式的关键在于把测试数据集分成子集。在 Manifold 中数据子集是基于一个或多个性能列的聚类算法自动生成的。这样对于每个模型具有相似性能的数据被分到同一个组中因为该算法确保模型 X 的性能对于子集 Y 中不同的数据点是一致的。图 5 和图 6 说明了这个过程 图 5. 所有的数据点收集自每个模型根据实际情况评估后给出性能度量。图 6. 左侧性能指标作为在 Manifold 中运行的聚类算法的输入。右侧用户可以调整集群参数来探索数据集中的模式。 Manifold 的架构 由于生成 Manifold 可视化涉及一些密集的数值计算聚类、KL 发散计算性能不足会拖慢用户界面的渲染影响到整个用户体验。因此我们开始使用 Python利用 Python 的 DataFrame 处理和机器学习库如 Pandas 和 Scikit-Learn实现所有重量级的计算。 但是不得不依赖 Python 后端降低了 Manifold 的灵活性难以进行组件化在将 Manifold 和 Uber 的机器学习生态系统比如我们的机器学习平台 Michelangelo集成时这成了一个缺点。因此除了 Python 计算外我们用 GPU 加速器添加了第 2 个用户工作流该 GPU 加速器完全是用更加灵活的 JavaScript 编写的。 图 7 描述了这两个工作流是如何和 Manifold 集成的。 图 7. Manifold 由 3 个不同的部分组成数据源、后端和前端。 对用户来说Manifold 的使用方式有 2 种通过 Python 包或 npm 包通过网页。由于代码可重用性和模块化对两个工作流的共存至关重要因此Python 和 JavaScript 代码库被组织成 3 个不同的功能模块 数据转换器一种将来自其他内部服务如 Michelangelo的数据格式转换为 Manifold 内部数据表示格式的功能计算引擎一种负责运行聚类和其他数据密集计算的功能前端组件Manifold 可视化分析系统其 Python 包使用了 JavaScript 前端组件的内置版本的用户界面。 与 Python 不同处理数据密集计算对我们的 JavaScript 计算引擎来说是个挑战。为了让用户看到有意义的模式需要大约计算 1 万个数据记录“行”。除了其他操作KL 发散的聚类和计算需要在前端进行可能会造成速度瓶颈严重影响用户体验。事实上根据我们的经验每次用户更新性能比较视图中的簇数量时使用纯 JavaScript 实现的计算可能需要 10 多秒时间。 相反我们把 TensorFlow.js 作为线性代数实用库来实现我们的 k 均值聚类和 KL 发散计算。因为这种类型的计算可以被矢量化因而可以利用 WebGL 加速所以更新同样数量的簇的任务可以在不到 1 秒的时间里完成超过原来性能的 100 倍。 通过组件化并将其包含在 npm 包中Manifold 具有更好的灵活性既可以用作独立服务也可以集成到公司的其他机器学习系统如 Michelangelo中。因为大多数用于机器学习的可视化工具需要额外的计算处理超过了模型训练后端具备的计算处理能力所以把它们与企业机器学习系统集成在一起可能很麻烦而且不可扩展。Manifold 针对这种情况提出了解决方案通过在可视化分析系统中分开处理训练模型所需的计算可以进行更快的迭代并得到了更干净的数据接口。 Manifold 在 Uber 的使用情况 在 Uber各个专注于机器学习的团队利用 Manifold 来处理所有事情从 ETA 预测 到更好地理解驾驶员安全模型。下面我们介绍最常见的两个用例识别机器学习模型的有用特征和消除模型结果中的假阴性。在这些示例中Manifold 让数据科学家能够发现引导他们完成模型迭代过程的见解。 识别有用的特征 Uber Eats 团队使用 Manifold 来评估 订单交付时间 预测 模型 的效果。在模型迭代过程中他们集成了一组附加的特征他们认为这些特征具有提高现有模型性能的潜力。但是在他们集成了这些特征之后模型的整体性能几乎没有改变。为什么这些新特征没有帮助他们是否应该放弃使用这些特征的想法还是这个低于标准的性能可以归咎于其他因素 为了回答这些问题他们使用了图 8 所示的模型其中初始模型绿色和用附加特征训练过的模型橙色作为 Manifold 的输入。这两个模型的所有其他方面是相同的。图 8. Manifold 可以比较两个模型使用或不使用新特征在 4 个数据子集上的性能。 图 8 描述了通过 Manifold 数据可视化来表示的分析结果。如图所示该测试数据集根据数据点中的性能相似性自动分为 4 个簇。对于簇 0、1 和 2具有附加特征的模型没有提高性能。但是在簇 3 中新模型具有附加特征的那个的性能稍微好了一点因为对数损失向左移动了一点。 由于最初的模型对簇 3 数据段的预测效果很糟糕对数损失比其他 3 个簇更高我们认为对他们的模型来说这些特征是有价值的因为它们似乎解决了一些最难的个案。 消除假阴性 在另一个例子中Uber 的安全团队利用 Manifold 提高了一个 二元分类 模型的性能该模型可以识别可能发生安全事故的行程。具体地说他们希望消除模型生成的假阴性的数量应该预测为具有阳性标签的实例但是模型未能捕捉到。为此他们需要确定在这些情形下模型将阳性实例预测为阴性的原因。 为了实现这个目的他们在测试数据集中过滤掉所有标记为阴性的实例然后与标记为阳性的实例之间进行对比。他们把性能比较图表中的 x 轴度量设置为“实际预测得分”增加了簇数量并比较那些值低于或高于决策阈值的子集如图 9 所示图 9. Manifold 比较数据集中所有阳性实例的性能以确定是否存在假阴性。 结果我们注意到有几个特征A、B、C、D、E显示了真阳性组灰色和假阴性组粉色之间的分布差异如图 10 所示。换句话说如果数据点在特征 A、B、C 或 D 上的值比较低且其真实的标签是阳性那么该模型往往不能正确地预测 E 的值。图 10. 在这种情形下Manifold 确定该模型的假阴性可能在特征 A、B、C、D 和 E 上具有较低的值。 为了进一步深入研究这些假阴性形成的根本原因我们直接比较了阳性组和阴性组的特征分布如图 11 所示图 11. Manifold 识别出从该模型产生的假阴性在特征 A、B、C、D 或 E 中往往具有较低的值。 我们注意到大多数真阴性实例在特征 A、B、C 或 D 上也往往具有较低的值。因此如果实例在这些特征上具有较低的值那么该模型倾向于将它们预测为阴性有时这是错的。在用 Manifold 进行了分析后他们意识到该模型对这些特征索引过度。为了提高性能他们要么找到更多能够有助于区分假阴性和真阴性的特征要么为低于某个阈值的数据分区单独训练模型。 接下来的工作 自从 2018 年 8 月推出 Manifold 以来该工具已经成为 Uber 机器学习开发过程的不可或缺的组成部分。Manifold 有 3 个主要优势 模型无关性模型性能评估的可视化分析超越了模型性能汇总统计以此来提高准确性将可视化分析系统和标准模型训练计算分开的能力帮助更快和更灵活进行模型开发。 目前Manifold 是一个独立的 Web 工具和 Python 包。为了增加 Manifold 的功能我们计划把 Manifold 工具集成到 Uber 众多的数据科学平台上进一步将该工具作为数据科学工作流的关键部分。通过这样做我们将能够真正发挥 Manifold 数据无关性的潜力以此来解决公司的各种数据科学使用场景问题。自此我们打算根据这些应用程序进行设计改进从而为这些用例提供更强大的支持。 英文原文https://eng.uber.com/manifold/
http://www.zqtcl.cn/news/259180/

相关文章:

  • 企业管理外贸企业网站优化
  • 免费图纸网东莞百度快照优化排名
  • 南宁网站建设培训学校青海网站建设加q5299丶14602做词
  • 鱼台做网站多少钱wordpress pot
  • 招聘网站建设维护人员怎样自己开发一款软件
  • 上海网站制作怎么选泰安网红人物
  • 企业网站建设义乌南靖网站建设
  • 抖音电商网站建设如何制作app推广
  • 关键词的选择网站提示网站建设电销异议处理话术
  • 南京建设网站内容网站打开速度慢是否需要升级带宽
  • 内容类网站如何 流量厦门市建设局网站住房保障专栏
  • 朝城做网站公司网站内容建设要求age06
  • 云南省城乡建设培训中心网站备份wordpress网站
  • 快速建站公司地址vr哪家公司做得好
  • 网站空间怎么更换网站营销如何做
  • 制作单页网站要网址wordpress更新显示失败
  • 阿里巴巴网站建设公司设计网站制作
  • 泰安网站建设有哪些常见的cms网站程序有哪些
  • 九寨沟城乡建设官方网站深圳的互联网公司排名
  • app可视化开发工具seo网站推广服务
  • 临近做网站网络营销方式哪些?
  • 网站数据分析案例怎样在网上做广告
  • 网站页头图片怎么做几个版面的网站
  • 网站 f型网站建设 大公司
  • 做网站最好选什么语言百度域名服务器
  • 网站维护一般多久西宁的网站建设
  • 网站建设需要什么工具投诉百度最有效的电话
  • 做家政网站公司策划公司英文
  • 自己建设个人网站要花费多少自己怎么制作微信网页链接
  • 邢台网站设计哪家专业php图书管理系统网站开发