个人网站注销原因,企业做网站属于广告宣传费吗,天津做网架公司,网站公告设计#x1f935;♂️ 个人主页#xff1a;艾派森的个人主页 ✍#x1f3fb;作者简介#xff1a;Python学习者 #x1f40b; 希望大家多多支持#xff0c;我们一起进步#xff01;#x1f604; 如果文章对你有帮助的话#xff0c; 欢迎评论 #x1f4ac;点赞#x1f4… ♂️ 个人主页艾派森的个人主页 ✍作者简介Python学习者 希望大家多多支持我们一起进步 如果文章对你有帮助的话 欢迎评论 点赞 收藏 加关注 目录
1.项目背景
2.数据集介绍
3.技术工具
4.导入数据
5.数据可视化
文末推荐与福利 1.项目背景 随着信息技术的迅猛发展和数字化时代的来临图书出版、销售与阅读方式均发生了翻天覆地的变化。传统的纸质书籍面临着电子书、在线阅读等新型阅读方式的挑战。在这一大背景下对于图书市场、读者阅读习惯以及书籍流通情况的数据分析变得尤为重要。 图书书籍数据可视化分析实验旨在通过收集、整理和分析大量的图书相关数据利用数据可视化技术将复杂的数据转化为直观、易理解的图形和图像。这样可以帮助出版社更好地了解市场趋势优化图书出版策略帮助书店和网上书城精确掌握库存和销售情况调整进货和销售策略同时也可以帮助读者更清晰地了解自己的阅读习惯和偏好以便做出更合适的阅读选择。 此外对于图书馆和学术研究机构而言图书书籍数据可视化分析还有助于提高图书管理和利用的效率促进学术研究和知识传播。例如通过分析图书馆的借阅数据可以了解读者的借阅习惯和需求进而优化图书采购和馆藏结构通过分析学术著作的引用数据可以评估研究成果的影响力和学术价值。 综上所述图书书籍数据可视化分析实验不仅具有重要的商业价值还有助于推动图书行业的创新发展和学术研究的进步。在这一背景下开展此类实验显得尤为必要和迫切。
2.数据集介绍 数据集来源于Kaggle这个数据集包含了从wonderbk.com(一个受欢迎的在线书店)抓取的信息。该数据集包含103,063本书的详细信息其中包含标题、作者、描述、类别、出版商、起始价格和出版日期等关键属性。
Title书的标题。
Authors本书的作者。
Description 对本书的简要描述。
Category书籍所属的类别或流派。
Publisher负责本书的出版社。
Price书籍的初始价格。
Publish Date出版年份。
3.技术工具
Python版本:3.9
代码编辑器jupyter notebook
4.导入数据
import warnings
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import seaborn as sns
sns.set(fontSimHei)
warnings.filterwarnings(ignore)df pd.read_csv(BooksDataset.csv)
df.head() 查看数据大小 查看数据基本信息 查看描述性统计 查看缺失值情况 删除缺失值 检测是否存在重复值 删除重复值 处理变量
# 处理作者这一列数据提取出作者名
df[Authors] df[Authors].str.replace(r^By\s, , regexTrue)
# 处理价格
df[Price] df[Price].apply(lambda x:float(x.split($)[1].replace(,,)))
# 发布年份
df[Publish Date] df[Publish Date].apply(lambda x:int(x.split(, )[-1].split( )[-1]))
5.数据可视化
df[Authors] df[Authors].str.split(,).apply(lambda x: .join(reversed(x)) if len(x) 1 else x[0])
# 显示清洗后的前10位作者
top_10_authors df[Authors].value_counts().head(10)
# 十大高产作家(条形图)
plt.figure(figsize(10, 6))
top_10_authors.plot(kindbar, colororange)
plt.title(Top 10 Prolific Authors)
plt.xlabel(Authors)
plt.ylabel(Number of Books)
plt.xticks(rotation45, haright)
plt.tight_layout()
plt.show() # 不同作者的平均价格(条形图)
average_prices_by_author df.groupby(Authors)[Price].mean().sort_values(ascendingFalse).head(10)plt.figure(figsize(10, 6))
average_prices_by_author.plot(kindbar, colorgreen)
plt.title(Average Prices by Top 10 Authors)
plt.xlabel(Authors)
plt.ylabel(Average Price ($))
plt.xticks(rotation45, haright)
plt.tight_layout()
plt.show() top_prolific_authors df[Authors].value_counts().head(10)plt.figure(figsize(10, 6))
sns.barplot(xtop_prolific_authors.values, ytop_prolific_authors.index, palettecoolwarm)
plt.title(Top 10 Prolific Authors)
plt.xlabel(Number of Books)
plt.ylabel(Authors)
plt.tight_layout()
plt.show() average_prices_by_category df.groupby(Category)[Price].mean().sort_values(ascendingFalse)
top_10_categories_by_price average_prices_by_category.head(10)# 按平均价格可视化前10个类别(条形图)
plt.figure(figsize(10, 6))
sns.barplot(xtop_10_categories_by_price.values, ytop_10_categories_by_price.index, paletteviridis)
plt.title(Top 10 Categories by Average Price)
plt.xlabel(Average Price ($))
plt.ylabel(Category)
plt.tight_layout()
plt.show() top_publishers df[Publisher].value_counts().head(10)plt.figure(figsize(8, 8))
plt.pie(top_publishers, labelstop_publishers.index, autopct%1.1f%%, startangle140)
plt.title(Top 5 Publishers Distribution)
plt.tight_layout()
plt.show() from wordcloud import WordCloudcleaned_descriptions df[Description].dropna().tolist()
text .join(cleaned_descriptions)
wordcloud WordCloud(width800, height400, background_colorwhite).generate(text)plt.figure(figsize(12, 8))
plt.imshow(wordcloud, interpolationbilinear)
plt.axis(off)
plt.title(Word Cloud of Book Descriptions)
plt.tight_layout()
plt.show() filtered_years df[(df[Publish Date] 1950)(df[Publish Date] 2024)]
yearly_counts_after_1950 filtered_years[Publish Date].dropna().value_counts().sort_index()# 由于没有足够的1950年以前的数据所以绘制1950年以后的趋势图
plt.figure(figsize(10, 6))
yearly_counts_after_1950.plot(kindline, markero, colorblue)
plt.title(Book Releases Over the Years (After 1950))
plt.xlabel(Year)
plt.ylabel(Number of Books Released)
plt.grid(True)
plt.tight_layout()
plt.show() 文末推荐与福利 《Excel高效办公文秘与行政办公AI版》免费包邮送出3本 内容简介 随着信息技术的快速发展Excel作为一款功能强大的电子表格软件已经被广泛应用于文秘与行政办公领域。Excel不仅可以帮助文秘人员和行政助理高效地处理数据、制作报表和统计图表而且还可以自动化处理各种日常工作从而节省时间和精力提高工作效率。 本书还创新地将ChatGPT引入到学习Excel行政与文秘技能教学中其提问与使用方式同样适用于国内常用AI语言大模型如百度的“文心一言”、科大讯飞的“星火”大模型。本书先通过 ChatGPT认识和了解文秘与行政工作中的基础知识再根据实际的工作案例讲述了在文秘与行政工作中使用Excel制作各种办公表格文档的方法与工作技能。 本书既适合在公司中从事文秘与行政工作的人员学习也适合作为广大职业院校文秘与行政相关专业的学习用书同时还可以作为文秘与行政技能培训教材。 编辑推荐 ★超实用通过30多个实战案例和操作技巧使读者能够快速上手并灵活运用AI工具提高办公效率。 ★巨全面内容设计从文秘与行政管理工作实际出发涵盖工作中各项事务的数据统计、分析与处理等要求的全方面内容。 ★真好懂一步一图的操作讲解一看就懂思路清晰老板要的数据统计、分析、结论全都有。 ★高回报看完本书菜鸟变高手成为制作各种文档的多面手零门槛提高文秘与行政办公硬核能力。 抽奖方式评论区随机抽取3位小伙伴免费送出参与方式关注博主、点赞、收藏、评论区评论“人生苦短拒绝内卷”切记要点赞收藏否则抽奖无效每个人最多评论三次活动截止时间2024-1-22 20:00:00 当当购买链接http://product.dangdang.com/29658186.html 京东购买链接https://item.jd.com/13953793.html 名单公布时间2024-1-22 21:00:00 资料获取更多粉丝福利关注下方公众号获取