当前位置: 首页 > news >正文

株洲营销网站建设飞速网站排名

株洲营销网站建设,飞速网站排名,非凡免费建网站平台,しょうじょ少女直播文章目录 show#xff1a;数据显示distinct#xff1a;数据行数去重count#xff1a;看行数select#xff1a;查看具体列数据toDF#xff1a;对字段命名(搭配常用与groupby--agg--toDF)withColumn#xff1a;新增列名printSchema: 打印列名信息dropDuplicates#xff1a… 文章目录 show数据显示distinct数据行数去重count看行数select查看具体列数据toDF对字段命名(搭配常用与groupby--agg--toDF)withColumn新增列名printSchema: 打印列名信息dropDuplicates数据列数去重limit数据看前N条collect所有数据收集到数组headtake查看前N行数据sample随机采样fraction按比例采样selectExpr选择列名字段更改列名调整小数位unionByName: 两两之间相同列名进行合并describe查看数据个数、均值、标准差、最小、最大值summary查看数据个数、均值、标准差、最小、25%、50%、75%、最大值 在工作中用spark对数据查询所使用的常用语法进行整理归纳如下 show数据显示 data spark.sql(select * from temp.tables) data.show(3)# 转成pandas方式 # df data.toPandas() # df.head(3)distinct数据行数去重 data spark.sql(select * from temp.tables).distinct() data.show(3)#ordata spark.sql(select * from temp.tables) data data.distinct() data.show(3)count看行数 data spark.sql(select * from temp.tables) data.count()select查看具体列数据 data data.select(dt, order_money) data.show(3)toDF对字段命名(搭配常用与groupby–agg–toDF) data spark.sql(select * from temp.tables) df data.group(dt).agg(fn.countDistinct(user_id), fn.sum(order_money)).toDF(dt, user_uv_count, order_money_sum) df.show(3)withColumn新增列名 df df.withColumn(avg_money, (df.order_money_sum / df.user_uv_count).cast(decimal(14,4))) df.show(3)printSchema: 打印列名信息 df.printSchema()dropDuplicates数据列数去重 data spark.sql(select * from temp.tables) data.dropDuplicates([city]).show()limit数据看前N条 data spark.sql(select * from temp.tables).limit(10) data.show(3)collect所有数据收集到数组 data spark.sql(select * from temp.tables) data.collect().show(3)headtake查看前N行数据 data spark.sql(select * from temp.tables).head(5) data.show(3)data spark.sql(select * from temp.tables).take(5) data.show(3)sample随机采样fraction按比例采样 data spark.sql(select * from temp.tables) data data.sample(fraction0.5) data.show(3)selectExpr选择列名字段更改列名调整小数位 data spark.sql(select * from temp.tables) data data.select(dt, order_money) data.selectExpr(dt as date, coalesce(order_money, 4)) data.show(3)unionByName: 两两之间相同列名进行合并 data spark.sql(select * from temp.tables) data2 spark.sql(select * from temp.tables2) union_data data.unionByName(data2) union_data.show(6)describe查看数据个数、均值、标准差、最小、最大值 data spark.sql(select * from temp.tables) data.describe().show()summary查看数据个数、均值、标准差、最小、25%、50%、75%、最大值 比describe多个四分位数(25%、50%、75%) data spark.sql(select * from temp.tables) data.summary().show()
http://www.zqtcl.cn/news/155514/

相关文章:

  • 单位网站建设框架yellow网站推广联盟
  • html5和php做网站做网站租用服务器
  • 网站开发中效率较高的编程语言公司域名注册流程
  • 万户网站管理系统4.0cms监控系统手机版下载
  • 宁波专业网站建设怎么做如何做一个虚拟网站
  • 网站栏目建设调研公司怎么建立一个网站
  • 苍溪建设局网站网站建设和维护采购协议
  • 代做网站微信号下载 wordpress插件
  • 泉州住房建设局网站wordpress输入html代码
  • 为什么访问外国网站速度慢沈阳网站公司排名
  • 网站建设+泰安网站项目建设策划方案
  • 微信人生里面微网站怎么做wordpress 第三方登录 代码
  • 做商城网站哪里高端大气网站案例
  • 网站做项目网站设计公司深
  • 学校做网站及费用建设网站有何要求
  • 河北邢台移动网站建设宁波网站开发公司电话
  • 免费建立个人网站申请seo搜索引擎优化推广
  • 如何拷贝服务器里面网站做备份金融网站怎么做的
  • 什么网站做的比较好网上投资网站建设
  • 公司网站运营方案策划办网站怎么赚钱
  • 贾汪区建设局网站设计接单兼职网站
  • 东莞商城网站建设哪家便宜wordpress 插件路径
  • 网站服务器 安全快递系统专注快递企业网站开发
  • 旅游网站平台建设的方案深圳移动官网网站建设
  • 如何建设企业人力资源网站网站建设和网络优化的区别
  • 辽宁网站设计影响网站用户体验
  • cms网站如何修改黄山建设网站
  • 宾爵手表官方网站小熊源码网
  • 荥阳网站建设网站建设取得了
  • 江苏省住房和城乡建设厅 官方网站wordpress点击下载