建设部人事教育司网站,谷歌竞价广告,淮海中路街道网站建设,苏宁易购网站建设分析文 | 卖萌酱这不是无脑吹#xff0c;也不是鸡汤。她让中国AI落地变得切实有解了。AI泡沫破了吗#xff1f;AI能落地了吗#xff1f;AI不是PPT问题吗#xff1f;AI终究只是梦一场#xff1f;面对行外的人#xff0c;每当卖萌酱说起自己是做AI的#xff0c;都… 文 | 卖萌酱这不是无脑吹也不是鸡汤。她让中国AI落地变得切实有解了。AI泡沫破了吗AI能落地了吗AI不是PPT问题吗AI终究只是梦一场面对行外的人每当卖萌酱说起自己是做AI的都经常收到以上“灵魂拷问”。做AI的这几年里卖萌酱也常常为AI技术的落地感到迷茫有时甚至觉得无解。AI最应该落到哪里去是互联网老牌业务搜推广吗还是激进的新型业务比如自动驾驶还是...传统行业诚然AI在互联网老牌业务上率先取得突破提升了一众互联网企业的流量分发效率和商业营收在自动驾驶这种新型业务上也取得了一些不错的里程碑但这些成果相比人们最初对AI的期待似乎少了些什么。都说AI是解放社会生产力提升行业生产效率的利器国家近几年也在大力号召“智能制造”要实现“产业升级”等。而社会运转是一台极其复杂的机器这种宏大的目标一定是建立在千行百业革新的基础上才可能实现的仅靠互联网传统业务和充满不确定的新型业务是一定无法充分释放AI技术的潜力。要颠覆就要像20年前为千行百业引入计算机一样引入AI技术实现巨大的社会生产力提升这才是AI技术真正的使命和价值。为什么为传统行业引入AI技术会这么难都说AI落地太难有人说是模型效果还是没那么好有人说是模型部署起来难度高成本大利润薄的传统行业玩不转也用不起。其实这些都只是部分原因而且都不是不可解的问题。回想一下20年前的传统行业大家普遍通过纸、笔和计算器完成各行各业的数字统计和数值计算效率极低、容易出错还不容易数据共享。计算机作为当时的高科技产品单单是会熟练打字五笔输入法、智能ABC了解一下、用word排版、用excel制作表格完成数据汇总和计算在传统行业里面就是大家眼里的“计算机大佬”了。要是还会重装系统、搭建网站那就是走起路来都带风的人物。直到后面出现了若干“智能输入法”且windows系统、office等各类平台软件都变得更加简单易用后让传统行业接受计算机才不是那么困难的事情了。今天的AI很像20年前的计算机。IT行内人知道它可以大幅提升生产效率玩好了就是神器但行外人眼里这就是个复杂无比的高科技产品非“我等凡夫俗子”能驾驭的住的东西。所以卖萌酱认为若要在传统行业现象级的引入AI技术关键点有二第一 破圈。对传统行业进行观念案例疏导让传统行业相信这是一场值得尝试的变革告诉大家“这螃蟹虽然长得丑但是可以吃而且很好吃。”第二 有谱。提供面向传统行业小白的系统级解决方案持续的易用性提升方案先来谈谈破圈。要破圈让传统行业像互联网行业一样相信AI关键的一步是在各个行业打造出成功案例。但这有点“鸡生蛋蛋生鸡”了如果每个客户都在蹲这么一个成功范例那肯定最终全行业都一直蹲着了。所以要打破僵局就需要有一个在中国公认的AI技术领头人下场号召传统行业吃第一批螃蟹打造出一批各行各业的成功范例库。有了范例库便会有更多的人愿意尝试吃螃蟹进而出现滚雪球效应。这便是破圈的一个关键点。但因此诞生了一个问题谁来做范例库做成了吗再来聊聊有谱。要解决本章开头提到的两个局部问题点其实都不算难甚至国内任何一家互联网大厂多投入点AI人才在具体的场景下可能都能搞定。但落地困难的地方在于把这两个问题解决了把AI框架、模型等丢给传统行业对方依然会一脸懵逼。这就是因为对传统行业来说需要的是一整套能让小白上手打怪的解决方案而不是零散的工具。下面来做一个直观的对比。在互联网行业用AI技术创造业务价值有哪些要素硬件有支持模型训练的硬件设备和支持部署的硬件设备传统行业无数字化数字化系统实现自动化的数据采集与处理传统行业经常无数据有标注数据和标注人力传统行业无部署有成熟的模型部署方案传统行业无迭代有专业的算法工程师做持续的模型优化和系统维护传统行业无而传统行业AI落地就是要把以上要素系统级的消灭掉让传统行业小白也能轻松无负担的把AI创造价值的全流程打通。这真的太考验一个企业的AI顶层设计能力和底层细节优化了。要同时实现“破圈”和“有谱”的问题着实是一件难度极高的事情。她要扛起大旗直到卖萌酱参加了上周五的Wave Summit 2022深度学习开发者峰会才发现原来AI在传统行业的落地可能真的有解了打开大模型在传统行业的想象力在前文提到的五点AI技术创造业务价值的要素中数据问题与模型问题无疑是阻碍AI在传统行业落地的重要因素但本届wave summit之后现在似乎出现了一种可行的解法——面向行业的AI大模型。为什么这里要突出“面向行业”呢以NLP为例无论是BERT、RoBERTa还是GPT-3归根结底都属于学术意义上的“通用”大模型它们都致力于理解人类语言但不一定具备很好的行业知识懂得“行业语言”。导致学术层面的通用AI大模型直接应用于传统行业时表现往往没有想象中的惊艳。而百度在本次峰会上一口气发布了10个AI大模型不仅包含通用大模型还包括任务大模型和业内首次发行的行业大模型甚至为大模型配套了专业的工具平台使得基于大模型的AI应用开发门槛得到进一步降低。这里重点说说行业大模型。在互联网上采集到的数据往往与传统行业相去甚远。例如车间中的某种零件质检时的缺陷件图片几乎无法在互联网中获取到在法律文书、病历等传统行业文案中也常常存在大量在互联网上很少见到的“专业术语”。因此这里的行业大模型的核心特色便是做了 “行业知识增强”先基于通用的文心大模型挖掘各行各业的知识而后结合实际行业的数据、知识以及百度文心技术团队设计的特有训练算法来进行大规模无监督联合训练。如此打造的大模型便可具备强大的零样本学习能力和效果提升可观的少样本学习能力在模型效果和数据依赖方面可谓一举两得。百度集团副总裁吴甜介绍在能源电力和金融领域百度文心联合国家电网研发了知识增强的电力行业NLP大模型国网-百度·文心联合浦发银行研发了知识增强的金融行业NLP大模型浦发-百度·文心目前已在电力、金融相关任务上取得显著的效果提升。除了行业大模型外此次还发布文心基础大模型和任务大模型共八个包括融合任务相关知识的千亿大模型ERNIE 3.0 Zeus多任务视觉表征学习VIMER-UFO 2.0商品图文搜索表征学习VIMER-UMS文档图像表征学习VIMER-StrucTexT 2.0语音-语言跨模态大模型ERNIE-SAT地理-语言跨模态大模型ERNIE-GeoL面向生物计算领域的化合物表征学习HELIX-GEM蛋白质结构分析HELIX-Fold。本次全新发布的融合任务相关知识的千亿大模型ERNIE 3.0 Zeus在学习海量数据和知识的基础上进一步学习了百余种不同形式的任务知识增强了模型的效果。另一方面ERNIE 3.0 Zeus通过融合层次化提示的预训练更好地建模不同任务的共性与特性再通过将不同的任务组织成统一的自然语言形式统一建模增强模型的泛化能力。相对其他模型ERNIE 3.0 Zeus在各类NLP任务上表现出了更强的零样本和小样本学习能力。与GPT-3这类基于语言模型训练目标的千亿大模型不同的是ERNIE 3.0 Zeus在训练过程中融合了100多个层次化的Prompt和相应的训练任务大类任务涵盖了问答、信息抽取、文本分类、情感分析、语义匹配、摘要、对话、创作、文本纠错等使得大模型的优化目标更加逼近应用时的下游任务因此ERNIE 3.0 Zeus相比学术界流行的BERT、RoBERTa等开源模型具备显著更优的下游任务零样本和小样本学习能力。这不仅提升了模型的下游任务表现而且大大缓解了模型对下游任务样本量的依赖直击传统行业的落地痛点。值得注意的是本次发布会还打造了一个基于文心大模型的创意社区——旸谷大模型创意与探索社区可以提供最新大模型的API试用零距离感受大模型在千行百业落地的潜力。可以预期的是大模型作为人工智能的“新一代基础设施”让AI在传统行业的落地变得愈加容易完成场景扩展、愈加有效提升应用效果并减少落地成本是推动产业智能化升级的重要组件。基于飞桨大航海计划2.0的三大共创计划在本次峰会上百度飞桨还基于飞桨大航海计划2.0发布三大共创计划包含飞桨产业实践范例库共创计划、飞桨AI for Science共创计划和飞桨硬件生态共创计划。其中AI for Science计划可以推动基础科学领域的科研创新与产业赋能而硬件生态共创计划和产业实践范例库共创计划则与AI的传统行业落地密切相关。在前文中提过范例库是实现AI技术破圈必不可少的关键成分一方面可以引导传统行业自发的拥抱AI另一方面可以为AI在传统行业的落地提供切实的指导。卖萌酱留意到本次发布会提及的产业实践范例库中的产业范例已经多达 47 个每个范例都覆盖了任务解析、算法选择、模型训练及优化、推理部署及结果可视化等产业落地全流程有完整的代码实现。这份范例库无疑将成为AI技术破圈的强有力技术支撑。而围绕硬件发起的硬件生态共创计划则致力于解决部署难题——传统行业的硬件环境复杂多变。截至2021年底已经有20个硬件厂家、30种的芯片适配了飞桨而本次发布会上飞桨与硬件伙伴联合推出了厂商版本飞桨框架让飞桨的硬件适配变得更加简单、高效、标准化让产业落地不再受困于“硬件未适配”。一份让落地变得有谱的导航图与工具链如前文所述缺乏系统级解决方案是传统行业开发者面对AI时无处下手的关键因素即使给予了先进的模型、海量的数据和强大的AI框架传统行业开发者也往往缺乏清晰的思路来解决具体业务场景中的问题。对此飞桨发布了一份源于产业实践经验的“训推一体导航图”。导航图就像一棵树根发达、树叶丰茂的大树。这棵树从树根到顶部分别描绘了各个任务场景的训练、推理、部署的路径。比如树干的部分是各种各样的模型以及支持的训练模式树冠的部分是该模型支持在怎样的硬件上做部署。可以说找到业务环境与业务目标对应的树叶和树根就可以找到一条路径来完成全流程的训练推理和部署。与训推一体导航图配套的还有训推一体工具链。不但可以方便的基于飞桨生态完成模型的高性能训练、模型压缩、部署乃至前端展示全流程而且支持将其他框架下研发的模型通过X2Paddle工具完成到该工具链的接入实现了对不同来源模型做统一的软硬件环境兼容。而在飞桨最新发布的v2.3版本中更是实现了自动调优的更性能训练、自动压缩与高性能推理部署让落地的全流程都得到了极大的简化降低了开发者的学习和使用门槛。而得益于训推的自动化飞桨充分发挥了软硬一体化的优势实现了在训练的关键环节感知硬件特性自动调优开发者无需了解硬件特性即可获得与专家级手工优化水平相当的性能在推理部署的关键环节可以感知硬件延时自动选择最优压缩方案压缩精度与手工方法相当代码量减少 50% 以上。可以说无论是行业大模型、行业范例库、导航图、工具链还是框架v2.3的新特征都从不同的维度上有力的缓解了AI在传统行业落地的痛点。而点连成线就是AI迸发真正社会价值的时刻。她叫百度飞桨她要扛起中国AI落地的大旗。