当前位置: 首页 > news >正文

做创意网站海外网站建设推广最好的

做创意网站,海外网站建设推广最好的,企业网站建设的申请,做兼职去哪个网站目录 一、前言 二、介绍 Ⅰ.一个分类变量和一个连续变量 Ⅱ.两个分类变量的一个连续变量 Ⅲ.两个分类变量和两个连续变量 Ⅳ.一个分类变量和多个连续变量 ①.平行坐标轴 ②.矩阵散点图 三、结语 一、前言 在做数据分析的时候#xff0c;很少会遇到连续变量和分类变量…目录 一、前言 二、介绍 Ⅰ.一个分类变量和一个连续变量 Ⅱ.两个分类变量的一个连续变量 Ⅲ.两个分类变量和两个连续变量 Ⅳ.一个分类变量和多个连续变量 ①.平行坐标轴 ②.矩阵散点图 三、结语 一、前言 在做数据分析的时候很少会遇到连续变量和分类变量更多的是需要我们对同时包含连续变量和分类变量进行可视化分析。所以我们在在本篇当中要开始来学习如何处理同时包含连续变量和分类变量进行可视化分析的问题。 二、介绍 Ⅰ.一个分类变量和一个连续变量 import pandas as pd import seaborn as sns import matplotlib.pyplot as plt import altair as alt Irispd.read_csv(rC:\Users\asuspc\Desktop\program\data\chap2\Iris.csv) IrislongIris.melt([Id,Species],var_namemeasurement_type,value_namevalue) 开始之前还是老样子先导包和获取数据得到之后我们将数据变成长型数据用到melt方法Id和Species变量与其他数据的变化无关所以我们不将这两个数据进行融合。 我们就能得出如上的数据那么接下来就是开始使用可视化我们可以使用箱线图分析在不同分类变量下连续变量的分布情况。 plt.figure(figsize(10,6)) sns.boxplot(dataIrislong,xSpecies,yvalue) plt.title(Box) plt.show() 这里对X轴和Y轴的变量名称注释清楚然后将处理好的数据Irislong放入。 从图中我们可以发现三者的极差上下四分位数的距离趋于一致但是数据的集中位置在依次升高箱线图在这的确利于我们取理解数据构成的趋势。  Ⅱ.两个分类变量的一个连续变量 plt.figure(figsize(10,6)) sns.boxplot(dataIrislong,xMeasurement_type,yvalue,hueSpecies) plt.title(The Box of Divided-group) plt.show() 到了两个分类变量的一个连续变量时我们依然使用箱线图与一个分类变量和一个连续变量来说我们更加需要分组的箱线图进行可视化。 这里的参数中hue视为分类变量将数据分位不同组。 这样我们就能在不同种类中分析同一个数据项的关系也能让我们一目了然看出一定的趋势。  Ⅲ.两个分类变量和两个连续变量 如果想要可视化两个分类变量和两个连续变量之间的关系那我们需要分面散点图。 Titanicpd.read_csv(rC:\Users\asuspc\Desktop\program\data\chap2\Titanic数据.csv) figsns.FacetGrid(dataTitanic,rowSurvived,colSex,margin_titleTrue,height3,aspect1.4) fig.map(sns.scatterplot,Age,Fare) plt.show() 先分面散点图其中两个分类变量将可视化切为网格如何在对应的网格下可视化出两个连续变量的散点图从而帮助我们 能够对数据进行分析。 从中我们可以对比不同性别在不同年龄的不同票价中的存活顾客可以看出不同年龄层的女性存活总数相对于男性较少并且买低票价的男性存活高于买低票价的女性 而这张是改变survived为embarked,我们可以看到不同登港的人数和性别对于。 S是Southampton南安普顿C是Cherbourg法国瑟堡Q是Queenstown爱尔兰昆士敦。 Ⅳ.一个分类变量和多个连续变量 ①.平行坐标轴 plt.figure(figsize(10,6)) parallel_coordinates(Iris.iloc[:,1:6],Species,alpha0.8) plt.title(Parallel_Coordinates) plt.show() 这里需要的导包是from pandas.plotting import parallel_coordinates 用iloc的方法定位取值而class_columnstr 包含类名的列名。即按类别划分我们这里只是将将class_column省略直接填‘Species’。 其中每一个变量都是横轴中的一个坐标点值的大小标记在对应的竖直线上用颜色为分组变量中的每条平行线进行分组。我们清晰的看出第三个连续变量在不同类别的差异是最大的最小的是第一个连续变量。 ②.矩阵散点图 sns.pairplot(Iris.iloc[:,1:6],hueSpecies,height2,aspect1.2,diag_kindkde,markers[o,s,D]) plt.show() 我们用三种不同的颜色来描述不同种类在这一连续变量的密集程度hue参数如上为分类分组iloc是数据的切片操作。 这样我们就可以更加具体分析在不同分类变量里的连续变量的关系有助于我们对不同分类变量对比不同连续变量的数据特征。 三、结语 这些数据描述的通常是表格数据那么对于其他类型的数据也有特定的数据可视化的方法下一篇我们将对其进行相关介绍。
http://www.zqtcl.cn/news/53564/

相关文章:

  • 网站服务器使用秦皇岛平台公司
  • WordPress建站去掉后缀wordpress栏目对应模板
  • 如何从下载的视频查到原网站wordpress商品展示插件
  • 字体图标网站长沙做网站公
  • 太原市住房和城乡建设部网站免费自助建站哪个好
  • 个人建立网站要多少钱wordpress 统一身份认证
  • 集团制度建设网站专做自驾游的网站
  • 蓝色网站风格大连网站开发选领超科技
  • 30秒网站信宜市建设局网站
  • 电子商务网站推广的目的正规小说分销平台
  • android 网站开发xiuno wordpress
  • 网站建设万首先金手指13对网站内容建设的建议
  • 网站建设及推广方案wordpress电话按钮
  • 网站设计专家入侵WordPress网站
  • 成都网站关键词优化菜鸟教程网站怎么做
  • 网站空间数据库浙大企业管理培训课程
  • 企业为什么要建设自己的网站wordpress xmmpp
  • 用什么做网站 优化微信最火的公众号排行
  • 人人车网站建设费用沈阳淘宝网站建设
  • 上海市做网站昆明快速做网站
  • 绍兴网站制作价格谁有网站推荐一下好吗
  • 注册网站借钱平台犯不犯法网站建设活动海报
  • jsp网站开发代码下载做教育网站销售的好吗
  • 怎么查询网站的备案号三维建筑设计软件
  • 祥云县网站上海网站设计案例
  • 青岛网站设计哪家便宜衣服网站设计
  • 长治网站制作怎么做惠州网站建设效果
  • 一个网站建设多少钱?陕西中小企业网站建设推广
  • 一站式服务广告语青山湖网站建设
  • 湖南常德广宇建设网站做外贸需要几个网站