琶洲网站建设,cms系统搭建,绥化市新闻最新消息,国内wordpress自己开发主题以下是基于一小段用户关注产品的行为数据分析过程详细描述#xff0c;各位老师如有不同意见或优化建议#xff0c;还请不吝赐教。一、数据大致是这样的(已经脱敏处理)二、数据预处理从年款提取出年限#xff0c;从价格标识出价格区间#xff0c;随便写一下SQL如下#xff…以下是基于一小段用户关注产品的行为数据分析过程详细描述各位老师如有不同意见或优化建议还请不吝赐教。一、数据大致是这样的(已经脱敏处理)二、数据预处理从年款提取出年限从价格标识出价格区间随便写一下SQL如下Select 城市品牌2016-substr(年款14) as 年限case when报价5 then ‘0~5’when 报价5 and 报价10then ‘5~10’when 报价10 and 报价15then ‘10~15’when 报价15 and 报价20then ‘15~20’when 报价20 and 报价50then ‘20~50’Else ‘50以上’end as报价区间From 分析表三、基础描述统计基础分析一般对数据进行简单的整合操作描述通过数据能够直观看到的结论比如各地区的用户量占比—反映不同地区的需求量级各地区的关注品牌top10%—反映不同地区的品牌需求差异不同品牌的价格区间—反映用户对于价格的关注情况年限与价格的变化趋势—新人会觉得这个可以用一下相关分析之类的其实没有太大必要。因为既定报价是受相对严格的市场规则调控的而本次分析的目的是针对用户对于既定已在线产品的关注度因此价格并不是本次分析的主体。这也响应上一篇文章并不是越专业的分析越实用。四、用户聚类这个分两步第一步是对数据进行再处理第二步是分析(SPSS K-means聚类)。处理结果是将用户日志数据转变为对每个用户的行为统计数据基本包括每个用户的关注次数、关注不同品牌数同一品牌反复关注次数关注不同价格区间的次数等大致如下第二步是利用SPSS进行聚类分析并将分析结果翻译为可读性较强的报告用的是最基本的K-means聚类以下是部分聚类结果结果解读起来并不费劲儿大致用户划分为3类每一类的描述数据如表最终聚类中心所示每一类的用户数量即案例数如表案例数所示。举例如第一类可以解释为关注低价品牌的用户数量相对较少对于品牌的选择也较少(从现实的市场角度讲应是这部分价格区间的品牌类型本身就少的原因)但反复查看次数多一定程度上不太利于成交。以上。