当前位置: 首页 > news >正文

在线免费网站建设深圳品牌营销咨询公司

在线免费网站建设,深圳品牌营销咨询公司,轻云服务器 安装wordpress,付费阅读网站建设前一阵子查看我们公司的大数据平台的离线脚本运行情况, 结果发现有一个任务居然跑了一天多, 要知道这还只是几千万量级的表, 且这个任务是每天需要执行的 于是我把hive脚本捞出来看了下, 发现无非多join了几个复杂的子查询, 应该不至于这么久, 包括我又检查了是不是没有加上每…前一阵子查看我们公司的大数据平台的离线脚本运行情况, 结果发现有一个任务居然跑了一天多, 要知道这还只是几千万量级的表, 且这个任务是每天需要执行的 于是我把hive脚本捞出来看了下, 发现无非多join了几个复杂的子查询, 应该不至于这么久, 包括我又检查了是不是没有加上每日分区的筛选条件 在反反复复测试调整以后, 我发现问题出在这里: 隐式join的时候顺序问题会导致错误的笛卡尔积(不确定什么版本hive) 假如t1和t2关联,t2和t3关联, 但是如果写成了from t1,t3,t2比如下面这样, 就会造成t1和t3直接笛卡尔积, 再和t2笛卡尔积, 再where筛选 -- select x from t1,t3,t2 where t1.id t2.t1_id and t2.id t3.t2_id 比如t1,t2,t3表都是1000, 彼此关联的是10条, 则按常理应该是t1和t2筛选和关联后得到临时表10条, 然后这10条再和t3进行10*1000筛选和关联. 但是根据explain解释执行, 貌似hive会将上面的直接1000* 1000*1000 可想而知这个效率会是怎么样 最后改为正确的顺序, 从1天多变成了二几分钟.搞定 结论 hive这个不知道是不是bug, 也可能后续会修复, 但是保险起见最好按表的关联顺序来写建议用显式join查询写完hive脚本测试跑一次看看效率,不确定就explain
http://www.zqtcl.cn/news/87141/

相关文章:

  • 网站安全检测在线建设设计公司网站
  • 属于网页制作工具宁波做seo推广企业
  • 织梦绿色企业网站模板 苗木企业网站源码 dedecms5.7内核口腔网站建设
  • 英国网站后缀有声直播网站建设
  • 建网站工具微信网页版客户端
  • 前端网站页面模板下载我的家乡网页设计模板
  • 响应式网站代理网站建设外出考察报告
  • 自己做的网站被封了广州软件制作公司
  • 为什么我做的网站不是加密访问小江高端企业网站建设
  • 网站做支付需要准备什么条件大连网站运营制作方案
  • 全国建设项目验收信息网站3d建模培训机构排行榜
  • 站长工具使用网站建设内部下单流程图
  • 史志网站建设wordpress模版头部文件
  • 苏州优化网站排名sem培训班学费哪个好
  • 关于新闻管理的网站建设报告自己做网站现实么
  • 做网站要营业执照吗什么网站上可以做国际贸易
  • 门户网站建设验收报告网络推广怎么收费
  • 鲜花网站建设主要内容网站关键词优化排名软件
  • 广州企业网站seo网站html地图模板
  • html字体代码大全上海seo推广服务
  • 南阳专业网站建设专业网站推广公司
  • 网站开发培训实训上海计算机一级网页制作
  • 甘德县公司网站建设英语培训东莞网站建设
  • 网站的登陆注册页面怎么做淘宝做导航网站有哪些功能
  • 江苏网站建设效果长治哪里做网站
  • 手机网站如何更改大品牌网站建设
  • 天眼查河南建设网站公司兰州中川国际机场t3航站楼
  • seo站内优化世界足球排名前100
  • 自己做网站2008R2好还是win7网页版微信和电脑版微信的区别
  • php网站开发个人职责昆明网站建设价目表