当前位置: 首页 > news >正文

南宁快速建站模板齐鲁人才网招聘网

南宁快速建站模板,齐鲁人才网招聘网,沈阳网站建设选网龙,网销每天需要怎么做2022 Tesla AI Day -特斯拉自动驾驶FSD的进展和算法软件技术之数据以及虚拟 附赠自动驾驶学习资料和量产经验#xff1a;链接 人工智能算法犹如电影的主演#xff0c;我们很多时候看电影只看到主演们的精彩#xff0c;但其实电影的创意和呈现都来自于背后的导演和制片等团队…2022 Tesla AI Day -特斯拉自动驾驶FSD的进展和算法软件技术之数据以及虚拟 附赠自动驾驶学习资料和量产经验链接 人工智能算法犹如电影的主演我们很多时候看电影只看到主演们的精彩但其实电影的创意和呈现都来自于背后的导演和制片等团队。而人工智能算法背后的有关数据的软件设施虚拟犹如电影的导演和制片等团队。他们是塑造算法成就算法的核心力量。 本文我将通过2022特斯拉AI Day发布的信息继上文Tesla AI Day -特斯拉自动驾驶FSD的进展和算法软件技术之算法 1. 路径以及运动规划算法当算法植入到终端车或者机器人终端通过算法感知环境规划路径确保安全平顺前进。 2. 环境感知算法 - Occupancy 算法也就是可活动空间探测 - Lane  Objects 车道以及物体算法交通中的信息语义层也就是车道线物体识别以及运动信息。**之后分享下算法背后的数据以及相关软件设施**大体框架如下 3. 训练算法设施以及软件 - 训练数据的设施超算中心用来支持数据处理算法训练。- 人工智能算法的编译器以及推理就是训练算法的框架以及软件方法。 4. 数据标注采集和虚拟 - 自动标注算法训练环境感知算法必须需要已经具有标签的数据自动标注算法就是标注数据训练环境感知算法识别这类场景或者物体。 - 环境虚拟合成制造虚拟场景。- 数据引擎现实场景车辆测试软件获取真实场景环境数据闭环数据引擎更正标签等。 3.训练算法设施以及软件 算法都是基于数据训练出来的也就是需要大数据喂出来。特斯拉表示需要训练Occupancy Networks算法特斯拉目前已经从采集视频中提取出14.4亿张图片需要训练这些数据需要10万个GPU满负荷工作一个小时到90度的计算。 但现实中特斯拉构建的3个超算中心采用了1.4万个GPU其中4000个用于自动标注数据其中10000个用于训练算法。 目前有30PB分布式视频缓存1PB1048576GB你想想30PB多大。其中抽取了1600亿张图片。而且这些数据不是静态的是动态流转的每天50万个视频轮流缓存更替每秒40万个视频转化。所以显然特斯拉当前这数据中心按照正常的方法肯定行不通同时可想而知特斯拉对于GPU超算的饥渴程度另外特斯拉还想加速他的计算能力这样决定了特斯拉必须自己搞芯片。但是仅仅有了芯片就行了显然海量数据的管理和训练方法都是难题。 那么怎么最优的训练这庞大的数据呢难点在哪里 就成了特斯拉现在考虑的问题特斯拉给出的答案是从数据的存储到数据的加载最后处理形成一个倒漏洞的形状最大限度的压榨计算资源。 要实现这些必须考虑数据量的分配数据流的带宽CPU内容机器学习的框架而多台GPU同步运算你要考虑延迟考虑GPU之间的带宽。这是非常复杂的。 特斯拉的方案是 首先视频是动态和复杂的不是简单的图片机器学习特斯拉的视频到图片再到学习处理过程是动态所以第一步加速视频库可以增加30%的训练速度。 特斯拉采用Pytorch 进行视频压缩类的工作加速视频库例如下图中I 帧帧内编码图片是完整的图像例如JPG或BMP图像文件。P帧预测图片仅保存图像与前一帧相比的变化。例如在汽车穿过静止背景的场景中只需要对汽车的运动进行编码。编码器不需要在 P 帧中存储不变的背景像素从而节省空间。P 帧也称为增量帧。 另外就是视频数据的归类说实话比较复杂以后有时间有价值再仔细看吧。 总的来讲通过这种方式特斯拉实现了2.3倍的训练速度增加现在特斯拉用1024块GPU可以实现几天内从头开始聚合这些数据。 另外数据源源不断的压进计算中心**就轮到了计算芯片如何最优处理算法呢**这里就提到了算法编译器compiler以及reference推理。 什么是算法编译器以及推理 了解这节时候我们先要了解什么是算法编译器compiler他将AI算法模型映射到高效的指令集和数据流。它还执行复杂的优化例如层融合、指令调度和尽可能重用片上内存。 为什么要优化编译器 其实特斯拉的人工智能算法代码运行会并行重复以及回滚那么特斯拉想要解决的问题是如何高效的让代码运行在芯片上面例如不重复计算计算之间编排紧凑不空闲不堵塞这样可以减少延迟降低功耗。 怎么做 特斯拉设计了一个Arc Max 以及一个中央操作来将稀疏例如车道的空间位置编码到首页然后选择学习算法过程链接到首页。然后在静态内存SRAM中构建一个查询表格把重复算法存入缓存这样就不需要重复计算只需要查询调用。 所以特斯拉表示就在FSD车道识别算法中这项编码提升了其算法9.6ms的延迟能耗大概只有8w。 特斯拉表示这种编码的思维贯穿到整个特斯拉FSD算法中特斯拉构建了一个新的算法编译器用来编译超过1000多个算法信号 这样特斯拉通过编译器和推理的优化确保优算力低功耗低延迟的AI 计算这也就是大家常说的不拼算力拼算法软件。 那么分享完算法优化计算优化接下来就是关于数据。 4.数据标注采集和虚拟 数据标注这个毋庸置疑人工智能的基础就是基于现实数据总结出规律然后产生公式用于预测这就是形成了算法。数据喂的越多那么算法公式也就越精准。所以海量数据是精准算法的基础而海量数据的前提是这些数据需要有标签也就是告诉机器这些数据是什么数据标注有两种方法第一种就是人类标注依靠人给数据打标签这是非常庞大的耗时耗人力的方式但现实中确实是这么干的还有些只有是人干。第二种就是自动标注还记得之前文章《被美国禁售的A100和H100 ,MI250人工智能芯片能干啥》中人工智能算法三个基础数学其中有一个是cluster你可以认为他是归类自动标注就是用归类方法去标注。自动标注显然是省时省力的事情所以看特斯拉如何利用自动标注。 困难点在哪里 拿上文的车道算法举例特斯拉认为他要实现十字路口车道算法大概需要几千万个驾驶旅程经过大概百万个十字路口。特斯拉目前大概每天有50万个旅程但是要把这些旅程转化成可训练的数据是非常难的课题特斯拉表示尝试了各种人工和自动标注方法显然不太可能。 所以特斯拉开发的新自动标注算法对一万个驾驶旅程的12个小时自动标注可以抵充500万个小时的人工标注。 特斯拉怎么做到的 特斯拉表示其车道算法的自动标注主要采用以下三个步骤来实施 首先通过车辆获取车辆的高精轨迹信息之后通过算法将多旅程重构到一张地图中然后自动标注车道信息网络。详细步骤如下 1. 高精轨迹获取上面提到特斯拉每天可以获取到50万个旅程这些旅程的采集信息为车辆的视频车辆运动IMU陀螺仪速度作为原始信号输入之后在车上的2个CPU线程所有开通FSD的车辆产生这些信息去跟踪优化特征提取输出车辆6个自由度100hz的运动轨迹以及3D结构的道路细节。 2. 多旅程重构因为所有的车辆信息都是来自于不同的车辆所以需要基于他们的高精轨迹信息进行旅程的道路信息的匹配重构接缝优化包面优化最后人工分析师最后把关形成了多重旅程的轨迹信息。 3. 自动标注旅程当然自动标注只会去标注新添加的旅程而不是去重构所有的片段所以大概半个小时标注一段旅程而不是人工标注的几个小时。特斯拉宣称这种标注方式极其容易规模化只需要有计算单元以及驾驶旅程信息如上图所示就视屏的时间内来自于53台车的数据就自动标注了50组数据。当然特斯拉也表示自动标注的方法应用在特斯拉算法的各个方面。 但特斯拉表示现实的数据获取困难同时很难去标注但是传统的3D的场景的重构却异常缓慢。 所以特斯拉表示在虚拟验证方面其应用新的方法5分钟就能够构建3D虚拟场景。 虚拟验证能做什么 特斯拉的建模是首先把场景的真值Ground truth输入3D建模软件Houdini先开始构建道路的边缘在构建路面地理特征之后将车道信息投影进入路面接下来使用道路中间的边缘形成绿化岛。这样基本的主要特征形成那么道路两边的树以及建筑物都可以随机构建。 有了这些基础之后引入地图交通信息例如红绿灯和停车车道信息甚至道路的真实名字。 之后偶发性的引入行人车辆交通形成了场景的基础。再后可以去改变场景的天气光线等形成模拟无穷无尽的场景供自动驾驶验证。当然特斯拉表示以上仅仅为基本的这个其实应该很多自动驾驶公司都能做到例如之前文章《Cruise以及其自动驾驶技术》中提到通用的Cruise 也采用特斯拉更进一步去改变道路的真值形成新的场景例如之前算法中将到的十字路口车道线场景可以改变里面的车道信息创建更多基于真实场景的变种场景来帮助算法训练而不是只能通过现实采集。 所以特斯拉有了虚拟数据可以快速的进行各种场景的虚拟测试去优化算法而省去实际测试费时费力的时间。**如何做到的呢**特斯拉表示其主要创新和亮点是虚拟验证的架构他可以确保所有的东西串起来运行。 如上文介绍虚拟世界的建模先有道路交通真值信息然后元素创造者将交通信息标签转换成元素例如上文将到的车道线马路牙子建筑物等都属于元素。再通过元素提取工具将这些信息分成几何信息和交通实例元素放到150平米Geohash中并给他命名ID 方便使用加载调用。 这样建模信息更加简洁更容易加载和渲染然后使用元素加载器工具特斯拉可以使用Geohash ID编码去加载任意数量的缓存切片一般虚拟的时间就加载感兴趣的地点以及周边。最后是虚拟引擎生成场景。 这样特斯拉就让一个工程师工作2周就可以生成旧金山的街道虚拟世界而非几个月甚至年来做单位。同样特斯拉可以利用此项PDG技术快速拓展到其他地方或者城市国家或者更新原有的虚拟世界确保数据依据现实动态发展。 数据引擎 - 现实数据采集器为什么 其实在看这一章的时候**想了想特斯拉的仿真能力这么强还要现实跑车去采集数据干啥**其实很多corner case 极端的场景都需要通过真实场景去发现然后优化数据帮助解决人员介入。 首先看这个场景特斯拉的FSD正在进入弯路口通过这里的时候看到旁边有一个车子现有算法下的特斯拉会认为有车子在等待通行所以特斯拉自动驾驶车子会减速但现实这是一个没有人在里面的奇怪停车。 这种场景估计任何脑洞大开的虚拟验证都不会想到必须要有实际场景来识别这类corner case极端场景所以自动驾驶真实场景数据的收割必须要有而且还是动态发展的不同时间不同城市不同文化的数据都会不一样。所以特斯拉构建了一个工具去识别错误的判断并去纠正标签并把这个片段归类为需要重新评估的系列。这个场景特斯拉把它诊断为挑战性的在转弯处有停车的场景目前特斯拉识别了126个这样的场景挖掘以及促进训练了1.39万视频数据来提升预测准确性。 需要解决这类场景特斯拉需要挖掘成千上万这种场景而特斯拉可以利用数据采集车辆客户的车或者自己试验车以及设备去采集和更正标签来解决这种琐碎的场景。 特斯拉把这种数据引擎框架实施到所有算法的持续优化中特斯拉的数据引擎是一个完整的从实验车型虚拟验证终端用户的流。无论它们是 3D多机位视频数据是否人工标记 自动标记或模拟数据无论是离线模型还是在线模型。 特斯拉能够大规模的的使用数据引擎的基础设施为特斯拉的算法提供数据食物的主要原因还有其庞大的车队终端用户汽车影子模式传输客户使用FSD时候的介入信息实验车队的再确认数据。总结 看完这个特斯拉的算法数据等结构之后我的第一想法是“高级的码农玩的是思维方式和艺术结构而不是按照规则去交付”。当然我肯定无法评价这个算法结构是好还是坏但可以肯定的是特斯拉的智能驾驶算法是一种坚定的态度思维。 特斯拉的算法态度和思维是“基于视觉的人工智能算法一定能够汽车或机器人自动驾驶和导航犹如人类仅仅使用眼睛和大脑实现安全驾驶或行走到达目的地”。这种态度和思维如人工智能算法的数学基础“任意两点之间一定存在一条可以将他们连接起来的直线”。当然特斯拉的最终理想是将此类算法拓展到AGI(Artificial general intelligence,通用人工智能( AGI ) 理解或学习人类可以完成的任何智力任务的能力。)让我们拭目以待不过可以肯定的是这条道路必定是坎坷的每一个人类基本上花大概18年才成年才具备进入社会独立的能力而且一生都不断的接触新东西不断学习所以何况是刚刚起步的人工智能。
http://www.zqtcl.cn/news/108664/

相关文章:

  • 爱用建站建设网站的报告
  • 网站关键字被百度收录网站开发asp.net
  • 内部卷网站怎么做的h5在线编辑器
  • 搞定设计网站做的图怎么下载不了网站死链接怎么删除
  • 济南企业建站怎么样在pc端预览手机网站
  • c 手机网站开发模板最好的建站网站
  • 防城港市网站建设成功网站建设案例
  • 成都公司网站制作公司实验一 电子商务网站建设与维护
  • 即墨区城乡建设局网站300m空间够用吗 wordpress
  • 成都软件开发培训机构7个湖北seo网站推广策略
  • 嘉定企业网站建设深圳网站制作费用
  • 外贸网站有必要吗wordpress远程保存图片
  • 苏州吴中网站建设wordpress中文版安装教程
  • wordpress 网站静态页面赶集网网站建设分析
  • 伊春网站开发大型网站建设兴田德润专业
  • 温州平阳县营销型网站建设榆林做网站
  • 沽源网站建设娄底网站建设工作室
  • 商场网站 策划医疗网站是否全部需要前置备案
  • 电商网站开发实训心得wordpress网络验证
  • 美图网seo 优化技术难度大吗
  • 知名的传媒行业网站开发天空网站开发者
  • 网站域名年费多少钱二手手表交易平台哪个好
  • 用易语言做抢购网站软件下载自己可以做企业网站吗
  • 公司网站续费帐怎么做互联网专业
  • 网站开发公司深圳外贸营销策略
  • 主要搜索引擎网站搜索结果比较wordpress novelist
  • 校园网站制度建设WordPress手机不显示
  • 胶州哪家公司做网站wordpress的html
  • 辽宁省建设厅网站江苏住房和城乡建设厅官方网站
  • 链接关系 网站层次结构南宁做网站找哪家公司