门户网站seo前期,望牛墩做网站,网站建设素材图片,京紫元年深圳网站建设4、工具和库
工具和库是数据科学家的基础。我参与了大量关于哪种工具最好的辩论#xff0c;哪个框架会取代另一个#xff0c;哪个库是经济计算的缩影等等。
但有一点共识--我们需要掌握该领域的最新工具#xff0c;否则就有被淘汰的风险。 Python取代其他所有事物并将自己… 4、工具和库
工具和库是数据科学家的基础。我参与了大量关于哪种工具最好的辩论哪个框架会取代另一个哪个库是经济计算的缩影等等。
但有一点共识--我们需要掌握该领域的最新工具否则就有被淘汰的风险。 Python取代其他所有事物并将自己打造成行业领导者的步伐就是这样的例子。 当然其中很多都归结为主观选择但如果你不考虑最先进的技术我建议你现在开始否则后果可能将不可预测。那么成为今年头条新闻的是什么我们来看看吧
PyTorch 1.0
什么是PyTorch我已经多次在本文中提到它了你可以在Faizan Shaikh的文章中熟悉这个框架。 这是我最喜欢的关于深度学习文章之一当时TensorFlow很缓慢这为PyTorch打开了大门快速获得深度学习市场。我在GitHub上看到的大部分代码都是PyTorch实现的。这并非因为PyTorch非常灵活而是最新版本v1.0已经大规模应用到许多Facebook产品和服务包括每天执行60亿次文本翻译。PyTorch的使用率在2019年上升所以现在是加入的好时机。
AutoML—自动机器学习
AutoML在过去几年中逐渐取得进展。RapidMiner、KNIME、DataRobot和H2O.ai等公司都发布了非常不错的产品展示了这项服务的巨大潜力。你能想象在ML项目上工作只需要使用拖放界面而无需编码吗这种现象在未来并不太遥远。但除了这些公司之外ML / DL领域还有一个重要的发布-Auto Keras 它是一个用于执行AutoML任务的开源库。其背后的目的是让没有ML背景的领域专家进行深度学习。请务必在此处查看它准备在未来几年内大规模运行。
TensorFlow.js-浏览器中的深度学习
我们一直都喜欢在最喜欢的IDE和编辑器中构建和设计机器学习和深度学习模型。如何迈出一步尝试不同的东西我将要介绍如何在你的网络浏览器中进行深度学习由于TensorFlow.js的发布已成为现实。 TensorFlow.js主要有三个优点/功能
1.使用JavaScript开发和创建机器学习模型
2.在浏览器中运行预先存在的TensorFlow模型
3.重新创建已有的模型
2019年的AutoML趋势
我个人特别关注AutoML为什么因为我认为未来几年它将成为数据科学领域真正的游戏规则改变者。跟我有同样想法的人是H2O.ai的Marios Michailidis、Kaggle Grandmaster他们都对AutoML有很高期望
机器学习继续成为未来最重要的趋势之一鉴于其增长速度自动化是最大化其价值的关键是充分利用数据科学资源的关键。它可以应用到的领域是无限的信用、保险、欺诈、计算机视觉、声学、传感器、推荐、预测、NLP等等能够在这个领域工作是一种荣幸。AutoML趋势
提供智能可视化和解释以帮助描述和理解数据查找/构建/提取给定数据集的更好特征快速建立更强大/更智能的预测模型通过机器学习可解释性弥补这些模型的黑匣子建模和生产之间的差距促进这些模型落地生产
5、强化学习 如果我不得不选择一个我看到的渗透更多领域的技术那就是强化学习。除了不定期看到的头条新闻之外我还在社区中了解到它太注重数学并且没有真正的行业应用程序可供专一展示。
虽然这在某种程度上是正确的但我希望看到的是明年更多来自RL的实际用例。我在每月GitHub和Reddit排序系列中我倾向于至少保留一个关于RL的存储库或讨论至少围绕该主题的讨论。
OpenAI已经发布了一个非常有用的工具包可以让初学者从这个领域开始。
OpenAI在深度强化学习中的应用 如果RL的研究进展缓慢那么围绕它的教育材料将会很少。但事实上OpenAI已经开放了一些关于这个主题的精彩材料。他们称这个项目为“Spinning Up in Deep RL”你可以在这里阅读所有相关内容。它实际上是非常全面RL的资源列表这里有很多材料包括RL术语、如何成为RL研究者、重要论文列表、一个记录完备的代码存储库、甚至还有一些练习来帮助你入门。
如果你打算开始使用RL那么现在开始
Google Dopamine
为了加速研究并让社区更多的参与强化学习Google AI团队开源了Dopamine这是一个TensorFlow框架旨在通过它来使更灵活和可重复性来构建RL模型。 你可以在此GitHub存储库中找到整个训练数据以及TensorFlow代码仅15个Python notebooks。这是在受控且灵活的环境中进行简单实验的完美平台听起来像数据科学家的梦想。
2019年强化学习趋势
Xander Steenbrugge是DataHack Summit的代表也是ArxivInsights频道的创始人他非常擅长强化学习。以下是他对RL当前状态的看法以及2019年的预期
我目前看到RL领域的三个主要问题
样本复杂性代理需要查看/收集以获得的经验数量泛化和转移学习训练任务A测试相关任务B分层RL自动子目标分解
我相信前两个问题可以通过与无监督表示学习相关的类似技术来解决。目前在RL中我们正在使用稀疏奖励信号训练深度神经网络从原始输入空间例如像素映射到端到端方式的动作例如使用反向传播。
我认为能够促进强化学习快速发展的道路是利用无监督的表示学习自动编码器、VAE、GAN将凌乱的高维输入空间例如像素转换为低维“概念”空间。
人工智能符合伦理才更重要
想象一下由算法统治的世界算法决定了人类采取的每一个行动。这不是一个美好的场景对吗AI中的伦理规范是Analytics Vidhya一直热衷于讨论的话题。
今年有相当多的组织因为Facebook的剑桥分析公司丑闻和谷歌内部普遍关于设计武器新闻丑闻而遭受危机。没有一个开箱即用的解决方案或一个适合所有解决方案来处理AI的伦理方面。它需要一种细致入微的方法并结合领导层提出的结构化路径。让我们看看今年出现的重大政策GDPR。
GDPR如何改变游戏规则
GDPR或通用数据保护法规肯定会对用于构建AI应用程序的数据收集方式产生影响。GDPR的作用是以确保用户可以更好地控制他们的数据。那么这对AI有何影响我们可以想象一下如果数据科学家没有数据或足够数据那么构建任何模型都会还没开始就失败。
2019年的AI伦理趋势预期
这是一个灰色的领域。就像我提到的那样没有一个解决方案可以解决这个问题。我们必须聚集在一起将伦理问题整合到AI项目中。那么我们怎样才能实现这一目标呢正如Analytics Vidhya的创始人兼首席执行官Kunal Jain在2018年DataHack峰会上的演讲中所强调的那样我们需要确定一个其他人可以遵循的框架。
结束语
有影响力这是2018年来描述AI最佳的词汇。今年我成为ULMFiT的狂热用户我也很期待BERT。 原文链接 本文为云栖社区原创内容未经允许不得转载。