当前位置: 首页 > news >正文

建设网站贵阳市观山湖区建设局网站

建设网站,贵阳市观山湖区建设局网站,个人网站怎么制作,医院网站建设 招标1、执行计划#xff08;过往记忆https://www.iteblog.com/archives/2562.html#xff09; df.explain(true)//显示逻辑计划和物理计划#xff0c;不加true只显示物理计划 2、逻辑计划优化方法#xff1a; 谓词下推#xff0c;列裁剪#xff0c;常量替换#xff0c;常量累…1、执行计划过往记忆https://www.iteblog.com/archives/2562.html df.explain(true)//显示逻辑计划和物理计划不加true只显示物理计划 2、逻辑计划优化方法 谓词下推列裁剪常量替换常量累加   3、优化方法 数据源方面 1、hive 使用parquet格式不要用textfile。列式存储便于查询引擎做谓词下推、更优的压缩算法不同列可以采取不同的压缩算法减少IO块遍历等优化方法。 2、Kafka根据key的hash值分区OGG到Kafka 表名作为key因此不同大小的表可以更改表名均衡分到不同partition。 sparkSQL程序方面(spark优化) 1、多次用到的表做cache。默认进行压缩。 spark.sql.inMemoryColumnarStorage.compressed //默认为true为每个列选择压缩方式 spark.sql.inMemoryColumnarStorage.batchSize //默认为10000 byte 控制列缓存的批量大小。批次大有助于改善内存使用和压缩但是缓存数据会有OOM的风险 2、小于10M的表会自动broadcast走broadcast join调高广播表的大小使其走broadcast join 但是太大有可能driver端OOM-1为禁止自动广播。 当使用的外部变量较大时也可把外部变量作为广播变量进行广播。 spark.sql.autoBroadcastJoinThreshold //默认10485760 (10 MB) val listBrodcast spark.sparkContext.broadcast(list) 3、sparkSQL shuffle read partition默认为200提高可解决部分数据倾斜问题。 spark.sql.shuffle.partitions //默认200 4、读不可分割的文件一个文件一个partition若小文件过多影响效率设置多个文件写入一个分区 spark.sql.files.openCostInBytes //默认4194304 (4 MB)打开一个文件的时间可读取4MB数据因此小于4M的文件读入一个分区待验证spark.sql.files.maxPartitionBytes //默认134217728 (128 MB)文件传入一个分区里的最大字节数  5、使用高效的算子 1、reduceByKey/aggregateByKey代替groupByKey//前者partition内部会进行预聚合后者不进行预聚合直接全局shuffle 2、mapPartitions代替mapforeachpartitions 代替foreach//前者会一次性读取整个partition的数据进行处理比如建立数据库连接在foreachpartitions中不要在foreach 3、filter之后coallease 6、修改序列化器为kryo并注册序列化类 conf.set(spark.serializer, org.apache.spark.serializer.KryoSerializer)conf.registerKryoClasses(Array(classOf[MyClass1], classOf[MyClass2])  7、join方式(https://www.cnblogs.com/suanec/p/7560399.html)转载于:https://www.cnblogs.com/csyusu/p/11048383.html
http://www.zqtcl.cn/news/813926/

相关文章:

  • 中文网站建设小组ios开发者账号申请
  • 月熊志网站福州建网站 做网页
  • 不同的网站有不同的风格宁波设计网站公司
  • 学校网站制作平台电子政务门户网站建设代码
  • 产品推广的网站怎么做网站标题与关键词
  • 青蛙网站建设wordpress修改logo
  • 网站套餐方案引擎搜索对人类记忆的影响
  • 滨州市滨城区建设局网站扎金花网站怎么做
  • 网站开发中视屏怎样编辑到网页上常州建站公司模板
  • 视频涉台互联网网站怎么做1cpu0.5g服务器用来做网站
  • 营销型网站设计官网怎么做网站优化 sit
  • 怎样获得做网站的客户免费企业网站程序上传
  • 新闻排版设计用什么软件网站seo诊断分析
  • 手机网站端域名怎样做解析一诺摄影设计
  • 网站开发行业竞争大吗郑州百度推广代运营公司
  • mvc4做网站五设计一个公司网站多少钱
  • 在什么网站可以做外贸出口劳保鞋北京 代理前置审批 网站备案
  • 邢台建设企业网站房地产宣传推广方案
  • 建设机械网站案例分析餐饮vi设计开题报告范文
  • 做本地生活网站深圳建设工程信息网站
  • C2C电商网站做博客的网站有哪些
  • 住房和城乡建设部网站 事故安微省建设厅田网站
  • 百度一下你就知道官页淘宝seo搜索引擎优化
  • 网站平台维护phpwind做的网站
  • 网站怎么做移动适配怎么样才算是一个网站页面
  • 做pc端网站策划百度网站建立
  • 高级网站开发技术青岛网站建设方案服务
  • 深圳公司网站建设设房地产网址大全
  • 怎么里ip做网站女生学广告学后悔死了
  • 做西餐网站wordpress 作者栏