当前位置: 首页 > news >正文

网站没有域名北京市建设工程交易中心网站

网站没有域名,北京市建设工程交易中心网站,网站开发后端工资多少,企业网站建立哪应用场景#xff1a; 假设一批数据#xff0c;每一个样本中#xff0c;有唯一标识#xff08;id#xff09;、品类#xff08;cate_id#xff09;、受众#xff08;users, 小孩、老人、中年等#xff09;等属性#xff0c;希望从其中找出一些样本#xff0c;使得这…应用场景 假设一批数据每一个样本中有唯一标识id、品类cate_id、受众users, 小孩、老人、中年等等属性希望从其中找出一些样本使得这些样本覆盖的品类、受众等最广。 分析 思路是使用聚类的方式每个簇选一个样本。观察数据都为类别特征常用的kmeans聚类方法会使用欧式距离计算两个样本之间的距离来判断该样本是否数据该簇。对于类别特征来说就算表示为0 1 2这些数字没有大小的意义只代表某一个属性。所以我们不可以使用判断距离的方式划分簇。 经过调研认识到了两个新的聚类方法K-modes和K-prototypes。下面分别介绍下两个方法。 K-modes 适用于离散数据采用汉明距离 K-modes算法是按照k-means算法的核心内容进行修改主要有以下两点 1.度量方式。样本之间的距离D属性相同为0不同为1并将所有属性结有相加。因此D越大即他的不相关程度越强与欧式距离代表的意义是一样的 汉明距离Hamming Distance也能用来计算两个向量的相似度通过比较向量每一位是否相同若不同则汉明距离加1这样得到汉明距离。向量相似度越高对应的汉明距离越小。如10001001和10110001有3位不同。 2.更新modes使用一个簇的每个属性出现频率最大的那个属性值作为代表簇的属性值(如[a,b] [a,c] [c,b] [b,c])代表模式为[a,b]或者[a,c]; from kmodes.kmodes import KModesKM KModes(n_clustersi,initHuang).fit_predict(X) K-prototypes 适用于混合数据有离散有连续 K-Prototype算法是结合K-Means与K-modes算法针对混合属性的解决2个核心问题如下 1.度量具有混合属性的方法是数值属性采用K-means方法得到P1分类属性采用K-modes方法P2那么DP1a*P2a是权重如果觉得分类属性重要则增加a否则减少aa0时即只有数值属性 2.更新一个簇的中心的方法方法是结合K-Means与K-modes的更新方法 from kmodes.kprototypes import KPrototypesKP KPrototypes(n_clustersself.k, initCao).fit_predict(X, categoricalself.dis_col)
http://www.zqtcl.cn/news/397990/

相关文章:

  • 聊城做网站的公司咨询学校网站模板 dedecms
  • 网站域名查询赣州网站设计有哪些
  • 网站设计做多宽150m网站空间流量大吗
  • 制作php网站用什么软件东莞东坑网站建设
  • 怎样做网站外部样式wordpress爱找主题
  • 自己搭建服务器做网站要多久问答网站如何优化
  • 网站用的服务器小程序拉新项目
  • 建设银行 访问的网站出错珠宝类网站模板
  • 网站百度关键词排名软件xampp里wordpress安装教程
  • 杭州网站设计建立企业网站专业做电脑系统下载网站好
  • 哈尔滨建设网站成本网站建设无广告
  • 发布网站搭建教程云排名网站
  • 无锡大型网站建设房地产景区网站建设方案
  • 自学网站建设工资公众号怎么开通直播功能
  • 网站建设上市公司wordpress park主题
  • 百度网站建设一年多少钱奇艺广州网站建设 熊掌号
  • 建设网站怎么收费标准网站和自媒体都可以做
  • 网站自己怎么做无锡常规网络营销是什么
  • 活泼风格的网站crm免费客户管理系统
  • 网站系统发生错误百度seo灰色词排名代发
  • 免费做名片儿的网站wordpress grace6
  • 有关网站开发的创意四川工程造价信息网官网
  • 网站目录结构北京注册公司地址可以是住宅吗
  • 龙信建设集团网站傻瓜式建站软件下载
  • 在360做网站和百度做网站的区别什么是网站地址
  • 营销型的物流网站模板下载长江设计公司
  • 网站程序制作购买网站域名
  • 网站建设中html下载如何用社交网站开发客户
  • 开设购物网站的方案政务公开和网站建设情况
  • 一台云服务器做多个网站营销型网站的建设重点是什么