当前位置: 首页 > news >正文

个人博客网站怎么赚钱公司招聘一个网站建设来做推广

个人博客网站怎么赚钱,公司招聘一个网站建设来做推广,泰安网站建设dxkjw,网站建设入账使用 Yelp 数据集进行用户画像#xff08;User Profiling#xff09;是一项有趣的任务#xff0c;可以理解用户的偏好、行为和特征。以下是总结的一个基本的步骤#xff0c;帮助构建用户画像 pandas 加载数据#xff1a; import pandas as pd# 加载数据 users pd.read_…使用 Yelp 数据集进行用户画像User Profiling是一项有趣的任务可以理解用户的偏好、行为和特征。以下是总结的一个基本的步骤帮助构建用户画像 pandas 加载数据 import pandas as pd# 加载数据 users pd.read_json(yelp_academic_dataset_user.json, linesTrue) reviews pd.read_json(yelp_academic_dataset_review.json, linesTrue) business pd.read_json(yelp_academic_dataset_business.json, linesTrue) yelp_academic_dataset_user.json: 包含了Yelp平台上用户的基本信息 yelp_academic_dataset_review.json包含了Yelp用户对商家的评论数据 yelp_academic_dataset_business.json包含了Yelp商家信息的数据 特征工程 用户特征 可以从用户数据和评论数据中提取以下特征 基本信息: 用户 ID、姓名、注册时间、城市等。行为特征: 评论数量平均评分最高评分和最低评分喜欢的商家类型通过评论的商家类别 # 示例计算用户特征 user_profile reviews.groupby(user_id).agg({stars: [count, mean, max, min],business_id: nunique }).reset_index()user_profile.columns [user_id, review_count, average_stars, max_stars, min_stars, unique_business_count] 商家偏好 用户喜欢的商家类型: 通过评论的商家类别统计用户的偏好。 # 示例用户偏好商家类型 user_business_types reviews.merge(business[[business_id, categories]], onbusiness_id) user_business_types[categories] user_business_types[categories].str.split(, ) user_business_types user_business_types.explode(categories)user_preference user_business_types.groupby(user_id)[categories].agg(lambda x: x.value_counts().index[0]).reset_index() user_preference.columns [user_id, preferred_category] 可视化用户画像 使用 Matplotlib 或 Seaborn 可视化用户特征 import seaborn as sns import matplotlib.pyplot as plt# 示例绘制用户评分分布 sns.histplot(user_profile[average_stars], bins5, kdeTrue) plt.title(Average Stars Distribution) plt.xlabel(Average Stars) plt.ylabel(Frequency) plt.show() 整理功能优化代码并运行 import pandas as pd import seaborn as sns import matplotlib.pyplot as plt# 加载数据 users pd.read_json(yelp_academic_dataset_user.json, linesTrue) reviews pd.read_json(yelp_academic_dataset_review.json, linesTrue) business pd.read_json(yelp_academic_dataset_business.json, linesTrue)# 选择必要的列以减少内存使用 reviews reviews[[user_id, stars, business_id]] business business[[business_id, categories]]# 数据处理与特征工程 # 计算用户特征 user_profile reviews.groupby(user_id).agg({stars: [count, mean, max, min],business_id: nunique }).reset_index()user_profile.columns [user_id, review_count, average_stars, max_stars, min_stars, unique_business_count]# 用户偏好商家类型 user_business_types (reviews.merge(business, onbusiness_id).assign(categorieslambda x: x[categories].str.split(, )).explode(categories) )# 处理可能为空的组 def get_most_common_category(x):if x.empty:return None # 返回 None 或者一个默认值# 计算类别的最常见值counts x.value_counts()if counts.empty:return None # 如果没有值返回 Nonereturn counts.idxmax()user_preference user_business_types.groupby(user_id)[categories].agg(get_most_common_category).reset_index() user_preference.columns [user_id, preferred_category]# 可视化用户评分分布 plt.figure(figsize(10, 6)) sns.histplot(user_profile[average_stars], bins5, kdeTrue) plt.title(Average Stars Distribution) plt.xlabel(Average Stars) plt.ylabel(Frequency)# 保存图像到当前目录 plt.savefig(average_stars_distribution.png)# 显示图像可选 plt.show() 结果 进一步分析 聚类分析: 使用 K-means 或其他聚类算法根据用户特征将用户分为不同群体。根据用户画像建立推荐系统为用户推荐商家。 使用scikit-learn进行训练 import pandas as pd from sklearn.preprocessing import StandardScaler from sklearn.cluster import KMeans import joblib# 加载数据 users pd.read_json(yelp_academic_dataset_user.json, linesTrue) reviews pd.read_json(yelp_academic_dataset_review.json, linesTrue) business pd.read_json(yelp_academic_dataset_business.json, linesTrue)# 选择必要的列以减少内存使用 reviews reviews[[user_id, stars, business_id]] business business[[business_id, categories]]# 数据处理与特征工程 user_profile reviews.groupby(user_id).agg({stars: [count, mean, max, min],business_id: nunique }).reset_index()user_profile.columns [user_id, review_count, average_stars, max_stars, min_stars, unique_business_count]# 进行 K-means 聚类 features user_profile[[review_count, average_stars, max_stars, min_stars, unique_business_count]] scaler StandardScaler() scaled_features scaler.fit_transform(features)# 应用 K-means kmeans KMeans(n_clusters3, random_state42) # 选择3个集群 user_profile[cluster] kmeans.fit_predict(scaled_features)# 保存模型和标准化器 joblib.dump(kmeans, kmeans_model.pkl) joblib.dump(scaler, scaler.pkl)# 保存用户聚类结果 user_profile.to_csv(user_profile_with_clusters.csv, indexFalse) kmeans_model.pkl 作用: 保存训练后的 K-means 聚类模型。内容: 包含了聚类中心、聚类标签和模型的其他参数。通过这个文件你可以在不需要重新训练模型的情况下使用已经训练好的模型进行预测。使用场景: 当你需要对新的用户数据进行聚类或获取已经聚类的用户群体时加载这个文件即可。 scaler.pkl 作用: 保存数据标准化器StandardScaler。内容: 包含了用于标准化特征的数据均值和标准差。在训练模型时特征需要被标准化以确保不同特征的尺度一致。使用场景: 当你需要对新的用户特征进行预处理时可以加载这个文件使用相同的标准化参数以确保新数据的标准化与训练数据一致。 使用模型预测推荐代码 import pandas as pd import joblib# 加载数据 reviews pd.read_json(yelp_academic_dataset_review.json, linesTrue) business pd.read_json(yelp_academic_dataset_business.json, linesTrue)# 加载训练好的模型和标准化器 kmeans joblib.load(kmeans_model.pkl) scaler joblib.load(scaler.pkl) user_profile pd.read_csv(user_profile_with_clusters.csv)# 基于聚类推荐商家 def recommend_business(user_id):# 获取用户的聚类user_cluster user_profile[user_profile[user_id] user_id][cluster].values[0]# 找到同类用户cluster_users user_profile[user_profile[cluster] user_cluster][user_id]# 推荐该集群内其他用户高频评价的商家recommended_businesses reviews[reviews[user_id].isin(cluster_users)][business_id].value_counts().head(5)return recommended_businesses.index.tolist()# 示例为某个用户推荐商家 sample_user_id user_profile[user_id].iloc[0] recommended_businesses recommend_business(sample_user_id)print(fRecommended businesses for user {sample_user_id}: {recommended_businesses}) 返回推荐的business Recommended businesses for user ---1lKK3aKOuomHnwAkAow: [_ab50qdWOk0DdB6XOrBitw, ac1AeYqs8Z4_e2X5M3if2A, GXFMD0Z4jEVZBCsbPf4CTQ, ytynqOUb3hjKeJfRj5Tshw, oBNrLz4EDhiscSlbOl8uAw]
http://www.zqtcl.cn/news/914657/

相关文章:

  • 功能型网站有哪些中国门户网站有哪些
  • 网站制作教程步骤软件公司怎么赚钱
  • 看世界杯网址网站更新seo
  • 深圳网站做的好的公司商洛做网站电话
  • 环保部网站官网建设项目审批做网站推广赚钱吗
  • 北仑建设局网站东莞市seo网络推广价格
  • 大专学历怎么自考优化建站
  • 网站上的图片怎么替换中国电力建设集团网站
  • 开发手机网站步骤手机网站前端开发布局技巧
  • 文山文山市网站建设网站建设管理教程视频
  • 深圳建筑业协会官网seo短视频新地址在哪里
  • 学院宣传网站制作大型网站团队人数
  • 新品发布会ppt参考友山建站优化
  • 做网站云服务器装系统厦门网站建设哪家强
  • 网站建设顶呱呱东莞建设信息网官网
  • 化妆品网站下载企业宣传片报价明细
  • php建设网站怎么用网站建设忽悠
  • 网站软件app免费注册账号qq
  • 清河网站建设公司西安开发网站的公司
  • 怎么用自己的服务器做网站软件接口设计文档
  • 昆明做网站建设找谁郑州网站制作的公司哪家好
  • 天津seo网站推广如何做医美机构网站观察分析
  • 东莞网站到首页排名网站建设与设计主要是干什么的
  • 自己做网站要花钱吗个人网站可以做资讯吗
  • 做vr效果图的网站做小程序的公司有哪些比较好
  • 物流建设网站总结制作壁纸的软件
  • 自己电脑做主机怎么做网站培训公司排名
  • 网站seo优化排名qq空间wordpress搬家
  • 做二手元器件那个网站查价格元气森林网络营销策略分析
  • 优质网站建设是哪家17网站一起做网店不发货