仙游住房与城乡建设局网站,三门峡住房城乡建设局网站,楚雄网站开发rewlkj,吉林天宇建设集团网站#x1f4cb; 博主简介 #x1f496; 作者简介#xff1a;大家好#xff0c;我是wux_labs。#x1f61c; 热衷于各种主流技术#xff0c;热爱数据科学、机器学习、云计算、人工智能。 通过了TiDB数据库专员#xff08;PCTA#xff09;、TiDB数据库专家#xff08;PCTP… 博主简介 作者简介大家好我是wux_labs。 热衷于各种主流技术热爱数据科学、机器学习、云计算、人工智能。 通过了TiDB数据库专员PCTA、TiDB数据库专家PCTP、TiDB数据库认证SQL开发专家PCSD认证。 通过了微软Azure开发人员、Azure数据工程师、Azure解决方案架构师专家认证。 对大数据技术栈Hadoop、Hive、Spark、Kafka等有深入研究对Databricks的使用有丰富的经验。 个人主页wux_labs如果您对我还算满意请关注一下吧~ 个人社区数据科学社区如果您是数据科学爱好者一起来交流吧~ 请支持我欢迎大家 点赞收藏⭐️吐槽您的支持是我持续创作的动力~ 《PySpark大数据分析实战》-25.数据可视化图表Matplotlib介绍 《PySpark大数据分析实战》-25.数据可视化图表Matplotlib介绍前言Python数据可视化工具介绍Matplotlib介绍绘制折线图绘制柱状图绘制饼图 结束语 《PySpark大数据分析实战》-25.数据可视化图表Matplotlib介绍
前言
大家好今天为大家分享的是《PySpark大数据分析实战》第3章第4节的内容数据可视化图表Matplotlib介绍。 图书在当当、京东、机械工业出版社以及各大书店有售 Python数据可视化工具介绍
数据可视化是一种提取有价值数据的有效方法是数据分析和机器学习中非常重要的一环。它有助于提高分析效率为机器学习模型提供可靠的数据基础。它可以帮助人们更直观地理解数据更好地理解数据的趋势和变化发现潜在的联系从而帮助人们更好地构建机器学习模型提高模型的准确性。此外数据可视化可以帮助人们更好地发现数据中的噪声和异常。通过可视化可以更容易地发现噪声数据和异常情况从而减少机器学习模型的误差。常用的Python数据可视化工具包括Matplotlib、Seaborn、Pyecharts等。
Matplotlib介绍
Matplotlib是一个Python 2D绘图库用于绘制各种类型的图形包括折线图、柱状图、饼图、散点图等。可以自定义图形的样式和属性可以添加标签、标题、网格等元素可以设置图形的大小、分辨率、颜色等属性。Matplotlib采用三层结构来组织图形
1容器层。容器层是指在Matplotlib图形中用于组织和管理图形元素的结构通常包括画板Canvas、画布Figure、坐标系Axes等几个部分。画板是Matplotlib的图形容器用于显示和交互Matplotlib图形例如缩放、平移、选择、保存等。画布是Matplotlib中最顶层容器用于组织所有的坐标系、图例Legend、标题Title等元素是整个图形的最外层容器。坐标系是位于画布内部的容器可以理解为一个具体的子图用于组织所有的图形元素例如线条、标记、图例等。
2辅助显示层。辅助显示层是坐标系内除了根据数据绘制的图像以外的内容用于在Matplotlib图形中添加额外的信息和标注以提高图形的可读性和表现力。主要包括外观Facecolor、边框线Spines、坐标轴Axis、坐标轴名称Axis Label、坐标轴刻度Tick、坐标轴刻度标签Tick Label、网格线Grid、图例、标题等内容。
3图像层。图像层指坐标系内通过plot()、scatter()、bar()、histogram()、pie()等函数根据数据绘制出的图像。 要在项目中使用Matplotlib需要在Python环境中安装Matplotlib命令如下
$ pip install matplotlib在使用时需要在Python脚本中导入matplotlib代码如下
import matplotlib.pyplot as plt绘制折线图
折线图是Matplotlib中最基本的图形之一Matplotlib提供了plot()方法用来绘制折线图plot()方法的主要参数有
x, yx轴和y轴的值可以是列表、数组、Series等类型的数据如果只提供一个参数则默认为y轴的值x轴的值为数据索引或序列号。inestyle指定线条的样式例如solid实线、dashed虚线、dashdot点线等。linewidth指定线条的宽度数值类型单位是像素。color指定线条的颜色。
在下面的案例中定义了x轴和y轴的数据并绘制了折线图代码如下
# 构造数据
x [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
y [2, 3, 6, 4, 5, 8, 5, 9, 7, 10]
plt.plot(x, y) # 绘制折线图
plt.show() # 显示图形执行代码绘制的图形如图所示。 绘制柱状图
柱状图也是Matplotlib中最基本的图形之一Matplotlib提供了bar()方法用来绘制柱状图bar()方法的主要参数有
x柱状图的x坐标可以是一个序列或数组表示每个类别。height柱状图的高度可以是一个序列或数组表示每个柱子的高度。width柱状图的宽度默认值为0.8。bottom柱状图底部的y坐标可以是一个序列或数组表示每个柱子底部的位置用于绘制堆叠柱状图。align柱状图对齐方式默认值为center表示柱状图对齐于x坐标轴上的中心。color柱状图的颜色。
在下面的案例中定义了5种类别及对应的值并绘制柱状图代码如下
# 构造数据
categories [A, B, C, D, E]
values [23, 45, 12, 34, 32]
plt.bar(xcategories, heightvalues) # 绘制柱状图
plt.show() # 显示图形执行代码绘制的图形如图所示。 绘制饼图
Matplotlib提供了pie()方法用来绘制饼图pie()方法的主要参数有
x用于绘制饼图的数据可以是一个列表、数组或者Series。explode指定各个部分的偏移量用于突出某个部分值为一个列表或数组。labels指定每个部分的标签值为一个列表或数组。colors指定每个部分的颜色值为一个列表或数组。autopct指定每个部分所占比例的显示方式值为一个格式化字符串。pctdistance指定比例值和圆心的距离。labeldistance指定标签和圆心的距离。
在下面的案例中定义了饼图的数据、颜色、显示方式等并绘制出饼图代码如下
data [20, 30, 40, 25, 15] # 构造数据
labels [A, B, C, D, E] # 定义标签
explode [0, 0.2, 0, 0, 0] # 定义突出显示的切片
colors [#ff9999, #66bbff, #99ff99, #ffcc99, #ffccff] # 定义颜色
plt.pie(xdata, explodeexplode, labelslabels, colorscolors, autopct%1.1f%%) # 绘制饼图
plt.show() # 显示图形执行代码绘制的图形如图所示。 结束语
好了感谢大家的关注今天就分享到这里了更多详细内容请阅读原书或持续关注专栏。