当前位置: 首页 > news >正文

查询建设用地规划许可证在哪个网站易居销售系统

查询建设用地规划许可证在哪个网站,易居销售系统,临沂网站建设培训班,网站经营性质1. kNN 1.1 基本的kNN模型 kNN(k-nearest neighbor)的思想简单来说就是#xff0c;要评价一个未知的东西U#xff0c;只需找k个与U相似的已知的东西#xff0c;并通过k个已知的#xff0c;对U进行评价。假如要预测风炎君对一部电影M的评分#xff0c;根据kNN的思想#… 1. kNN 1.1 基本的kNN模型 kNN(k-nearest neighbor)的思想简单来说就是要评价一个未知的东西U只需找k个与U相似的已知的东西并通过k个已知的对U进行评价。假如要预测风炎君对一部电影M的评分根据kNN的思想我们可以先找出k个与风炎君相似的并且对M进行过评分的用户然后再用这k个用户的评分预测风炎君对M的评分。又或者先找出k个与M相似的并且风炎君评价过的电影然后再用这k部电影的评分预测风炎君对M的评分。在这个例子中找相似用户的方法叫做user-based kNN找相似物品的方法叫做item-based kNN。这两种方法的思想和实现都大同小异因此下文只讨论item-based kNN并且将其简称为kNN。     根据kNN的思想我们可以将kNN分为以下三个步骤假设预测用户u对物品i的评分 (1)计算相似度 推荐系统中常用的相似度有Pearson correlationCosineSquared Distance其中Pearson correlation的运用最为普遍因此本文只介绍Pearson correlation。 Pearson correlation的取值范围为[-1,1]当值为-1时表示两组变量负相关为0时则表示两组变量不相关为1时表示两组变量正相关其计算公式如下 (2)选择邻居 在用户u评过分的所有电影中找出k个与电影m相似度最高的电影并用N(u, m)表示这k个电影的集合。 (3)计算预测值 有了k个相似的电影后就可以用以下公式预测评分 1.2 数据稀疏性与kNN的改进 现在待处理的推荐系统规模越来越大用户和商品数目动辄百千万计两个用户之间选择的重叠非常少。如果用用户和商品之间已有的选择关系占所有可能存在的选择关系的比例来衡量系统的稀疏性那么平时研究最多的MovieLens数据集的稀疏度是4.5%Netflix是1.2%Bibsonomy是0.35%Delicious是0.046%。 从Pearson correlation的计算公式上看如果某两个电影的交集大小比其它电影的交集要小得多那么这两个电影的相似度的可靠性就比较低。由上面描述的数据稀疏性可知在推荐系统中出现某些交集的较小的情况将会十分平常。而这会大大加强相似度的不可靠性。为了预测结果的可靠性有必要减轻这种不可靠性因此我们要根据交集的大小对相似度进行一次压缩(shrinkage) 1.3 全局作用与kNN的改进 用户对电影评分有各种趋势例如有的用户是严格的评分者因而倾向于给较低的分数有的用户是宽松的评分者因而倾向于给较高的分数有的电影的表现即使一般也倾向于获得较高的分数。在推荐系统中将这些趋势称为全局作用(global effect简称GE)。 常用的GE有16种这里只列出本文用到的3种 No. Global Effect Meaning 0 Overall mean 全部评分的平均值 1 Movie × 1 电影的被评分倾向 2 User × 1 用户的评分倾向 3 User × Time(user)1/2 用户第一次评分后到现在相距了多少时间 表格的第一列表示各个 GE 被考虑的顺序第二列表示 GE 的名称第三列表示GE的意义。其中第二列命名的意义为在“×”之前的部分代表该 GE 是基于用户或基于电影的在“×”之后的部分代表 xu,m下文会提到的取值形式。 GE的目标是为该GE估计一个特定的参数第0号GE除外因为全部评分的平均值能直接计算得到。在估计参数时一次只考虑一个GE并且使用前面已得到的所有GE的预测残差residual作为本次估计的真实评分。估计第t1个GE时的真实评分由以下公式得到 在估计GE的特定参数时也一样要考虑到前面提到的数据稀疏性问题即该参数也要进行压缩进行压缩后的参数估计公式如下 其中表示这是第t个参数并且是基于用户的表示用户u评过分的所有电影的集合表示第u个用户和第m部电影相关的解释变量(explanatory variable)且在计算第12号GE时为1在计算第3号GE时为 kNN基本模型并没有将GE考虑在内为了使预测结果更加精确有必要将GE加到kNN的预测公式中改进后的预测公式如下 2. 实验 实验数据使用MovieLens 100k的数据。这份数据由1000个用户对1700部电影的100000个评分组成其稀疏性为5.88%。评价指标使用RMSE(root mean squared error) 各算法在该数据集的表现如下所示其中表中的数值指RMSE。 k10 k15 k20 基本kNN模型 1.076 1.071 1.068 压缩相似度的kNN 1.011 1.016 1.020 带GE的kNN 0.987 0.988 0.989 压缩相似度并且带GE的kNN 0.946 0.951 0.955 从上表可知当k10时压缩相似度的改进效果为6%GE的改进效果为8.2%两者叠加的改进效果为12.1%。这说明1数据的稀疏性对越粗糙的模型影响越大。2GE的影响较大原因是kNN的预测结果是相似度与用户评分的加权平均值。当用户评分包含与相似度无关的因素即GE越多时最终结果越不可靠。 代码由于较多就不直接贴上想要的可以在从以下地址下载(Python实现) http://ishare.iask.sina.com.cn/f/34170290.html
http://www.zqtcl.cn/news/185044/

相关文章:

  • 推荐几个好的网站wordpress 加载数据库表格也卖弄
  • 承德网站开发找人做网站安全吗
  • 百度网站推广电话眼镜网站怎么做竞价
  • 邢台建设银行官方网站为什么建设网站很多公司没有
  • 闵行做网站费用湖南正规网络营销哪家便宜
  • 找个公司做网站需要注意什么wordpress用户名长度
  • 推荐几个没封的正能量网站营销技巧和营销方法视频
  • html mip 网站桂林市临桂区
  • 做网站如何月入10万建行app怎么注册登录
  • 建设一个旅游网站毕业设计建设网站的功能定位是什么原因
  • wordpress网站导航模板杭州建设网站的公司
  • 如何做视频解析网站wordpress 关闭评论
  • 安福网站建设微信开发者工具怎么下载
  • 网罗设计网站威海网页设计制作公司
  • 网站用cmswordpress插件怎么做
  • 如何办好公司网站元器件网站搭建
  • 建设领域行政处罚查询网站wordpress数据库发文章
  • 怎么做网页的多开器宿迁seo优化
  • 别人帮做的网站怎么修改病句店铺引流的30种方法
  • 网站备案幕布怎么申请绍兴cms建站模板
  • 做网站熊掌号软件设计公司排名
  • 深圳 做网站学做西点的网站
  • 静态网站安全性百度服务平台
  • 网站vi设计公司网站建设app
  • 书店网站建设策划书总结每天看七个广告赚40元的app
  • 做网站的属于什么专业成都广告制作安装公司
  • 天津市网站建设公司网站制作费用
  • 网站制作公司 郑州wordpress图片中文不显示解决
  • 网站建设模式有哪些方面jquery做的装修网站
  • 佛山手机建网站企业网站公司单位有哪些