当前位置: 首页 > news >正文

重点项目建设网站八点品牌设计公司招聘

重点项目建设网站,八点品牌设计公司招聘,怎么自己建一个网站吗,怎么把一个网站的信息都抓取下来不确定性才是客观世界的本质属性。不确定性的世界只能使用概率模型来描述#xff0c;正是对概率模型的刻画促成了信息论的的诞生 香农——通信的数学理论#xff0c;给定了对信息这一定性概念的定量分析方法 信息论在世界的不确定性和消息的可测量性之间搭建桥梁 条件熵和…不确定性才是客观世界的本质属性。不确定性的世界只能使用概率模型来描述正是对概率模型的刻画促成了信息论的的诞生 香农——通信的数学理论给定了对信息这一定性概念的定量分析方法 信息论在世界的不确定性和消息的可测量性之间搭建桥梁 条件熵和信息增益是分类问题中的重要参数KL散度用于描述两个不同概率分布之间的差异最大熵原理是分类问题中的常用准则 5.1 概念 5.1.1 基本问题 在一点精确或近似地复现在另一点选取的消息 消息通常有意义即根据某种体系消息本身指向或关联着物理上或概念上的特定实体但消息的语义与(产生/接收消息的)工程问题无关——将信息的传播与处理完全剥离 一条消息来自于一个所有可能的消息的集合——所有与类型的消息都被抽象为逻辑符号拓展了通信任务的范畴与信息论的适用性 5.1.2 信息熵 信息论用 信息熵 的概念对单个信源的信息量和通信中传递信息的数量与效率等问题做出了解释 在生活中信息的载体是消息不同的消息带来的信息量也是不同的 消息1中国男足夺世界杯冠军赔率 1 : 1000 1:1000 1:1000消息2中国男乒夺世界杯冠军赔率 1 : 2 1:2 1:2 不确定性越大(小概率事件发生的概率)的消息可能性越小提供的信息量就越大 一个消息的不确定性(信息量)的表征——熵一个系统内在的混乱程度 若事件 A A A 发生的概率为 P ( A ) P(A) P(A) 则这个事件的信息量为 h ( A ) − l o g 2 P ( A ) h(A)-log_2P(A) h(A)−log2​P(A) 消息1信息量 h ( A ) 10 h(A)10 h(A)10消息2信息量 h ( A ) 1 h(A)1 h(A)1 5.1.3 信源的信息熵 信源的信息熵 是信源可能发出的各个符号的自信息量在信源构成的概率空间上的统计平均值 一个离散的信源 X X X 包含 m m m 个符号每个符号 a i a_i ai​ 的取值概率为 P ( a i ) P(a_i) P(ai​) 则 X X X 的信息熵为 H ( X ) − ∑ i 1 m P ( a i ) l o g 2 P ( a i ) H(X)-\sum\limits_{i1}^mP(a_i)log_2P(a_i) H(X)−i1∑m​P(ai​)log2​P(ai​) 信源的信息熵描述了每发送一个符号所提供的平均信息量是信源总体信息测度的均值 当信源中的每个符号的取值概率相等时信息熵取到最大值 − l o g 2 m -log_2m −log2​m 意味着信源的随机程度最高 5.1.4 条件熵 如果两个信源之间有相关性在已知其中一个信源 X X X 的条件下另一个信源 Y Y Y 的信息熵就会减小 用 条件熵 H ( Y ∣ X ) H(Y\vert X) H(Y∣X) 表示在已知随机变量 X X X 的条件下另一个随机变量 Y Y Y 的不确定性 H ( Y ∣ X ) ∑ i 1 m P ( x i ) H ( Y ∣ X x i ) − ∑ i 1 m [ P ( x i ) ∑ j 1 p P ( y j ∣ x i ) l o g 2 P ( y j ∣ x i ) ] − ∑ i 1 m ∑ j 1 p P ( x i , y j ) l o g 2 P ( y i ∣ x i ) H(Y\vert X)\sum\limits_{i1}^mP(x_i)H(Y\vert Xx_i)-\sum\limits_{i1}^m\left[P(x_i)\sum\limits_{j1}^pP(y_j\vert x_i)log_2P(y_j\vert x_i)\right]\\-\sum\limits_{i1}^m\sum\limits_{j1}^pP(x_i,y_j)log_2P(y_i\vert x_i) H(Y∣X)i1∑m​P(xi​)H(Y∣Xxi​)−i1∑m​[P(xi​)j1∑p​P(yj​∣xi​)log2​P(yj​∣xi​)]−i1∑m​j1∑p​P(xi​,yj​)log2​P(yi​∣xi​) 条件熵的意义在于先按照变量 X X X 的取值对变量 Y Y Y 进行了一次分类对每个分出来的类别计算其单独的信息熵再将每个类的信息熵按照 X X X 的分布计算数学期望——分类会带来不确定性的下降 教室中可能出现的座位分布在不加约束时信息熵会很大对座位的选择添加限制条件如男左女右相对于未加限制时的情形会简单很多 互信息 I ( X ; Y ) H ( Y ) − H ( Y ∣ X ) I(X;Y)H(Y)-H(Y\vert X) I(X;Y)H(Y)−H(Y∣X) 可以看做 X X X 给 Y Y Y 带来的信息增益——机器学习领域 信息增益常被用于分类特征的选择。 对于给定的训练数据集 Y Y Y H ( Y ) H(Y) H(Y) 表示在未给定任何特征时对训练集进行分类的不确定性 H ( Y ∣ X ) H(Y\vert X) H(Y∣X) 表示了使用特征 X X X 对训练集 Y Y Y 进行分类的不确定性信息增益表示特征 X X X 带来的对训练集 Y Y Y 分类不确定性的减少程度即特征 X X X 对训练集 Y Y Y 的区分度 信息增益更大的特征具有更强的分类能力。 由于其值很大程度上依赖于数据集的信息熵 H ( Y ) H(Y) H(Y)不具有绝对意义故有 信息增益比 的概念 g ( X , Y ) I ( X ; Y ) H ( Y ) g(X,Y)\frac{I(X;Y)}{H(Y)} g(X,Y)H(Y)I(X;Y)​ 5.1.5 KL散度 描述两个概率分布 P P P 和 Q Q Q 之间的差异的一种方法定义为 D K L ( P ∥ Q ) ∑ i 1 n p ( x i ) l o g 2 p ( x i ) q ( x i ) D_{KL}(P\Vert Q)\sum\limits_{i1}^np(x_i)log_2\frac{p(x_i)}{q(x_i)} DKL​(P∥Q)i1∑n​p(xi​)log2​q(xi​)p(xi​)​ KL散度是对额外信息量的衡量 给定一个信源其符号的概率分布为 P ( X ) P(X) P(X) 设计一种针对 P ( X ) P(X) P(X) 的最优编码方式M使得该信源所需的平均比特数最少等于信息熵 当信源的符号集合不变但其概率分布变为 Q ( X ) Q(X) Q(X) 再用同样的编码方式M对编其编码此时会比最优值多一些比特信息熵会增加 KL散度用于衡量这种情况下平均每个字符多用的比特数也可以表示两个分布之间的距离 非负性KL散度 ≥ 0 \ge 0 ≥0 只有在两个分布完全相同时取等 非对称性 D K L ( P ∥ Q ) ≠ D K L ( Q ∥ P ) D_{KL}(P\Vert Q)\neq D_{KL}(Q\Vert P) DKL​(P∥Q)DKL​(Q∥P) 要让 D K L ( P ∥ Q ) D_{KL}(P\Vert Q) DKL​(P∥Q) 最小需要让 Q ( X ) Q(X) Q(X) 在 P ( X ) P(X) P(X) 不等于0的位置不等于0 要让 D K L ( Q ∥ P ) D_{KL}(Q\Vert P) DKL​(Q∥P) 最小需要让 Q ( X ) Q(X) Q(X) 在 P ( X ) P(X) P(X) 等于0的位置等于0 5.2 最大熵原理 确定随机变量统计特性时试图最符合客观情况的一种准则 对于一个未知的概率分布最坏情况就是他等可能的取到每个取值此时随机变量的随机程度最高对其进行预测也最困难 得到最不确定的结果 预测的风险越小 5.2.1 最大熵模型 首先确定若干特征函数作为分类依据 为保证特征函数的有效性其在模型真实分布 P ( X ) P(X) P(X) 上的数学期望和在由训练数据集上推导出的经验分布 P ~ ( X ) \widetilde{P}(X) P (X) 上的数学期望应该相等——对特征函数数学期望的估计应该是个无偏估计量 此时每个特征函数就对应了一个约束条件。 分类的任务就是在约束条件下确定一个最好的模型。 由于除这些约束条件外没有任何关于分类的先验知识因而需要利用最大熵原理求解出不确定性最大的条件分布即让以下函数取最大值 H ( P ) − ∑ x , y P ~ ( x ) P ( y ∣ x ) l o g 2 P ( y ∣ x ) H(P)-\sum\limits_{x,y}\widetilde{P}(x)P(y\vert x)log_2P(y\vert x) H(P)−x,y∑​P (x)P(y∣x)log2​P(y∣x) P ( y ∣ x ) P(y\vert x) P(y∣x) 为分类问题要确定的目标条件分布 上述计算过程实质上就是一个约束优化问题。从数学上可以证明这个模型的解是存在且唯一的
http://www.zqtcl.cn/news/985769/

相关文章:

  • 成都做网站设企业建一个网站需要多少钱
  • 淮南建设网站菏泽兼职网站建设
  • 品牌做网站公司做网站需要一些什么东西
  • 网页制作软件三剑客网站优化排名的方法
  • 购物网站开发背景及目的做百度推广网站咱们做
  • 漳州最专业的网站建设公司网站建设工作方案
  • 江西省建设厅网站官网网站备案期间可以用二级域名访问网站吗
  • 三丰云做网站步骤php网站建设视频教程
  • 赤峰网站开发公司wordpress电子商务主题 中文
  • 网站建设运营工作业绩怎样查看网站备案号
  • 江苏常州网站建设公司外贸网站建设盲区
  • 响应式网站设计教程wordpress 医院主题
  • 手机上怎么上传网站吗舟山做网站
  • 程序员做个网站要多少钱呢网站开发设计技术路线
  • 企业网站优化与推广哪个网站seo做的最好
  • 学做网站 软件合肥市建设投资有限公司
  • 网站开发优势用php制作一个个人信息网站
  • wordpress百度推送代码兰州网站关键字优化
  • 有了域名怎么建设网站在线crm免费将夜2
  • 网站建设 技术方案模板长沙手机网站公司
  • 游戏网站建设免费版百度只更新快照不收录网站
  • html小清新类型网站网站建设中应注意哪些问题
  • 网站开发技术和seo的联系精品课程网站建设 公司
  • 大型网站建设一般多少钱wordpress 调用百度前端公众库
  • 个人电脑做网站服务器网站地方网站域名用全拼
  • 我们网站在那里登陆后台系统管理成都app制作开发
  • 可以做问卷调查的网站仙居网站建设
  • 知名网站建设公司电话做一个小程序需要多少钱
  • 外贸找客户有什么网站个人如何做网站
  • 旅游项目网站开发ui界面设计分析