当前位置: 首页 > news >正文

成都网站建设网站制作公司展馆设计方案

成都网站建设网站制作公司,展馆设计方案,网络科技官网网站建设,企业培训机构概率论是统计分析和机器学习的核心。掌握概率论对于理解和开发稳健的模型至关重要#xff0c;因为数据科学家需要掌握概率论。本博客将带您了解概率论中的关键概念#xff0c;从集合论的基础知识到高级贝叶斯推理#xff0c;并提供详细的解释和实际示例。 目录 简介 基本集合… 概率论是统计分析和机器学习的核心。掌握概率论对于理解和开发稳健的模型至关重要因为数据科学家需要掌握概率论。本博客将带您了解概率论中的关键概念从集合论的基础知识到高级贝叶斯推理并提供详细的解释和实际示例。 目录 ·简介 ·基本集合论 ·基本概率概念 ·随机变量和期望 ·边际、联合和条件概率 ·概率规则边际化和乘积 ·贝叶斯定理 ·概率分布 ·使用概率进行学习 ​​ ·贝叶斯推理 ·在 Python 中实现概率概念 ·玩具示例抛硬币的贝叶斯推理 ·结论 ·行动呼吁 介绍 概率论是量化不确定性的数学框架。它使我们能够对随机现象进行建模和分析在统计学、机器学习和数据科学中不可或缺。概率论帮助我们做出明智的决策、评估风险并建立预测模型。 基本集合论 首先让我们定义几个关键术语。 集合(Set)是对象的集合。这些对象称为集合的元素。 集合a的子集b是其元素均为a的元素的集合即 ⊂ 。 空间 S 是最大的集合因此所有其他集合都在考虑之中ᵢ ⊂ 。 空集 O 是空集或零集。O不 包含任何元素。 让我们将集合论的组成部分形象化。 维恩图描绘了集合逻辑和运算。最上面的图显示样本空间S其中集合A、B和C作为子集即B是A的子集而C是B的子集因此 C 是A的子集。其余行描绘了两个集合A和B。文本包含每个集合的描述和数学。作者创建了视觉效果。 上图描绘了我们在使用集合时遇到的各种场景。让我们来描述集合论的不同方面。鼓励读者在阅读定义和回顾数学表达式时参考每个小节后面的视觉图以加深他们的直觉。 子集 子集 ⊂ 或者集合a 包含b如果b的所有元素也是a的元素则 ⊃ 。也就是说 英文语句“如果b ⊆ a且c ⊆ b则c ⊆ a ”表达了集合包含的传递性。如果集合b是集合a的子集集合c是集合b的子集则c也一定是a的子集。第二项“以下关系成立a ⊆ a0 ⊆ aa ⊆ S ”强调了集合包含的基本性质。因此 a ⊆ a表示每个集合都是其自身的子集。0⊆a表示空集是任意集合a的子集。a⊆S表示任意集合a都是全集S的子集。 集合运算 相等两个集合相等则a 的每个元素都必须在b中而b的每个元素都必须在a中。从数学上来说 并集和两个集合a 和b的并集是由a或b 或两者的所有元素组成的集合。并集运算满足以下性质 集合a 和b的交集积由集合a和b共有的所有元素组成。交集运算满足以下属性 互斥集 如果两个集合a和b没有共同元素我们称它们互斥或不相交即 补充 集合 a 的补集 a 定义为由 S 中所有不属于 a 的元素组成的集合。补集满足以下性质 两集合之差 a − b的差集是a中不属于b的元素的集合。差集满足以下性质 基本概率概念 样本空间S随机实验的所有可能结果的集合。 事件E样本空间的子集包含特定结果或一组结果。 随机变量 (RV)可能值为随机现象的数值结果的变量。例如人的身高、抛硬币或掷骰子的结果。 事件的概率 事件E的概率即P(E)是衡量该事件发生可能性的指标。它满足以下性质 例子 考虑一个公平的六面骰子。样本空间为S {1, 2, 3, 4, 5, 6}。掷出 3 的概率为 P({3}) 1/6。掷出 1 或 3 呢P({1, 3}) 2/6 1/3。最后掷出偶数呢P({2, 4, 6}) 3/6 1/2。 随机变量和期望 请注意我们在本部分中使用了求和与积分。请参阅本系列的上一部分其中涵盖了微积分和线性代数。 机器学习的基础数学 深入探究向量范数、线性代数、微积分 pub.towardsai.net 随机变量RV RV 是一种变量其值由随机实验的结果决定。有两种类型离散随机变量取可数个值和连续随机变量取不可数个值。 例如离散随机变量的分布 它可以取每个值的概率。符号P(Xxi)。这些数字满足以下条件 期望和方差 期望值平均值随机变量的平均值。 对于离散随机变量 这个期望值即平均值是一个离散随机变量X 。因此我们将其计算为所有可能值x乘以其各自概率P(X x)的加权总和。 对于连续随机变量 这个期望值即平均值是连续随机变量X的。我们将其计算为x乘以其概率密度函数f(x)在整个可能值范围内的积分。 总之 方差我们可以计算一个二阶统计测量表示随机变量与预期值的偏离。 上述方程表示随机变量X的方差测量X值围绕其均值E[X]的扩展或分散。 例子 对于一个公平的六面骰子预期值是 边际概率、联合概率和条件概率 在本小节中我们将使用一张图来解释边际概率、联合概率和条件概率。因此表格是两个 RV 的联合概率分布正如作者在此处所描绘的那样。 检查上面的图片。我们将使用这个视觉效果来学习概率论的基本概念边际概率、联合概率和条件概率。这些概念对于理解随机变量之间的关系至关重要尤其是在处理分类或计数数据时。 边际概率 边际概率是指在不考虑任何其他事件的情况下单个事件发生的概率。在图中p(X xᵢ)表示它。然后我们计算如下 这表示随机变量X取特定值xᵢ的概率该概率被边缘化为其他变量的所有可能值。因此它有助于通过将该事件的联合概率与另一个变量的所有可能结果相加来找到单个事件的概率。 联合概率 联合概率是两个事件同时发生的概率。参考上图它是概率p(X xᵢ, Y yⱼ)计算如下 这个联合概率衡量两个事件X xᵢ和Y yⱼ同时发生的可能性。 条件概率 条件概率衡量在另一个事件已经发生的情况下发生另一事件的概率。图像将其定义为p(Y yⱼ | X xᵢ)计算方法如下 该公式显示在X xᵢ已经发生的情况下Y yⱼ的可能性有多大。 概率规则边缘化和产品 边缘化是概率论中用到的一个过程用于从所有变量的联合概率分布中推导出与变量子集相关的事件的概率。 在这个等式中我们通过对另一个变量Y的所有可能值求和来计算边际概率p(X xᵢ) 乘积规则是概率中的一个基本概念它使我们能够根据边际概率和条件概率来表示两个事件的联合概率。 该等式显示了联合概率p(X xᵢ, Y yⱼ)如何分解 具体来说用数学的方式表达乘积法则允许使用一个事件的边际概率和在第一个事件的条件下另一个事件的条件概率来计算两个事件的联合概率。 概括 这些概念是概率论的基础对于理解数据科学中更复杂的概率模型和推理技术至关重要。总结如下。 最后如果P(Y | X) P(Y) 则和是独立的这意味着P(Y | X) P(Y)。这意味着P(, ) P(X)P(Y)。 贝叶斯定理 贝叶斯定理是贝叶斯推理的基石是一个强大的概率结构它使我们能够将先验知识融入到我们的计算中。 回到条件概率并在此基础上构建回想一下我们之前定义的p(Y yⱼ | X xᵢ)。我们可以使用事件A和B来概括这一点并将其进一步扩展到贝叶斯。 因此条件概率量化了在另一事件发生的情况下发生某事件的概率。因此在事件B发生的情况下事件 A的概率是A和B的联合概率与B的概率之比。我们将其表示为P(A | B)并定义为 管道字符“|”在概率论中翻译为“给定”。 因此贝叶斯定理将两个事件的条件概率关联如下 该术语根据似然P (B | A)、先验P(A)和边际概率P(B)来表达条件概率P(A | B) 。同样这个构造是贝叶斯推理的基础它使我们能够根据新证据更新我们的信念。 例子 假设我们对某种疾病进行测试其概率如下 利用贝叶斯定理我们可以找到P(疾病|阳性) 我们可以这样计算P(Positive)  该方程表示考虑两种情况即患有和不患有疾病的检测呈阳性的总概率直接应用总概率定律。 概率分布 典型趋势遵循已知分布。因此一个常见的问题是假设一个特定的分布来拟合我们的数据。以下是离散和连续随机变量的几个分布。 离散分布 二项分布描述固定次数的独立伯努利试验中的成功次数。泊松分布对固定时间间隔或空间内发生的事件数量进行建模。 连续分布 正态分布以钟形曲线为特征用平均值 μ 和标准差 σ 描述。指数分布描述泊松过程中事件之间的时间。 我们可以通过了解期望值、方差或其他统计指标来近似数据分布。以下备忘单总结了一些连续和离散 RV 的备忘单。 这是显示连续和离散概率分布的图表。每个分布都有其平均值、标准差和概率的公式——图片来源。 例子 让我们仔细看看正态分布的概率密度函数。从数学上讲它表示如下 使用正态分布的概率概念可视化显示概率密度函数 (PDF)、累积分布函数 (CDF)、平均值 (µ) 和标准差 (σ)。 该图以正态分布为基础直观地展现了关键的概率概念。图中蓝色部分为概率密度函数 (PDF)表示分布中不同结果出现的可能性。PDF 曲线下方的面积表示随机变量落在特定范围内的概率。 累积分布函数 (CDF) 以红色显示。它从左到右累积概率从 0 开始渐近于 1。CDF 帮助我们确定随机变量小于或等于某个值的概率。 垂直虚线标记平均值 (μ) 和与平均值的标准差 (σ)。平均值在 x0 处用红色虚线表示而绿色、橙色和紫色虚线分别表示第一、第二和第三个标准差 (±1σ、±2σ、±3σ)。这些标准差说明了数据如何分布在平均值周围其中约 68%、95% 和 99.7% 分别在平均值的 1σ、2σ 和 3σ 范围内。 图中的箭头有助于识别这些关键点使视觉效果更易于理解。对于任何想要掌握概率基本概念的人来说该图都是一个有用的工具尤其是正态分布它是统计分析和许多机器学习算法的基石。 使用概率进行学习 例如在对垃圾邮件进行分类时我们可以估计( | , )。 — 如果( | ) 0.5 我们会将示例归类为垃圾邮件。 — 但是对( | ) 进行建模通常更容易。 这就给我们带来了最大似然法。 最大似然法 例如抛硬币 根据n 次抛硬币的结果其中h次都是正面估计硬币掷出“正面”的概率p 。 数据的可能性 对数似然 取导数并将其设置为 0 贝叶斯推理 贝叶斯推理是一种统计推断方法其中贝叶斯定理用于随着更多证据的出现而更新假设的概率。 先验、似然和后验 先验PH对假设的初始信念。可能性PE | H根据假设观察到证据的概率。后验PH | E观察证据后对假设的更新信念。 贝叶斯推理中的贝叶斯定理 我们是如何得到这个结果的让我们回到使用X和Y进行泛化。 根据乘积法则 和 所以 这被称为贝叶斯规则。 总之 () 可以计算为 然而推断标签并不重要。 例子 让我们回到我们的案例我们正在接受罕见疾病的检测。这一次我们的检测结果已经呈阳性。让我们使用贝叶斯来确定它是真阳性的概率即使用贝叶斯检查测试是否为假阳性即测试结果被错误地归类为真。 在假阳性率为 5% 的测试中检测结果为阳性。出现这种疾病的可能性有多大假设每 100 人中就有 1 人患有此病。这会有什么不同吗该测试的假阴性率为 10%实际上十分之一的错误预测是正确的。这可以用来改善我们的预测吗 我们首先从视觉上看一下。 该图片显示每 100 人中就有 5 人被错误地标记为患有该疾病即假阳性而 1 人确实患有该疾病。 让我们使用贝叶斯定理。 请查看《我们拥有什么和想要什么》。 让我们进一步研究一下。 因此先验即分母中的P(B)由两个子集组成我们可以将其表示为并集或和。 现在插上电源并喝水 因此我们患病的概率为 15.4%这比仅考虑假阳性率而不使用检测阳性和假阴性的百分比时原来的 95% 要好得多。 如果我们接受两次检测每次都得到阳性结果那会怎样这种疾病存在的可能性有多大 其中A患有该疾病而B两次检测结果呈阳性。 请注意即使经过两次测试我们的机会仍然低于原来的 95%。 这就是贝叶斯的美妙之处随着我们获得更多知识我们可以将其融入到我们的数字理解中从而提高概率的精确度 在 Python 中实现概率概念 我们将使用该numpy库进行数值计算和scipy.stats概率分布。 示例抛硬币模拟 span stylecolor:rgba(0, 0, 0, 0.8)span stylebackground-color:#ffffffspan stylebackground-color:#f9f9f9span stylecolor:#242424span stylecolor:#007400# 导入必要的库/span span stylecolor:#aa0d91import/span numpy span stylecolor:#aa0d91as/span np span stylecolor:#aa0d91import/span scipy.stats span stylecolor:#aa0d91as/span stats span stylecolor:#aa0d91import/span matplotlib.pyplot span stylecolor:#aa0d91as/span plt span stylecolor:#007400# 抛硬币次数/span n_flips span stylecolor:#1c00cf100 /span span stylecolor:#007400# 模拟抛硬币1 表示正面0 表示反面/spancoin_flips np.random.binomial( span stylecolor:#1c00cf1/span , span stylecolor:#1c00cf0.5/span , n_flips) span stylecolor:#007400# 计算正面的次数/span n_heads np.sum (coin_flips) span stylecolor:#5c2699print /span span stylecolor:#5c2699(/span f span stylecolor:#c41a16正面数量span stylecolor:#000000{n_heads}/span /span ) span stylecolor:#007400# 计算正面的概率/span p_heads n_heads / n_flips span stylecolor:#5c2699print/span ( span stylecolor:#c41a16f估计正面的概率span stylecolor:#000000{p_heads: span stylecolor:#1c00cf.2/span f}/span /span )/span/span/span/span 输出 正面次数51 预计正面概率0.51 概率分布可视化 span stylecolor:rgba(0, 0, 0, 0.8)span stylebackground-color:#ffffffspan stylebackground-color:#f9f9f9span stylecolor:#242424span stylecolor:#007400# 绘制二项分布/span n_trials span stylecolor:#1c00cf10/spanp_success span stylecolor:#1c00cf0.5/spanx np.arange( span stylecolor:#1c00cf0/span , n_trials span stylecolor:#1c00cf1/span ) binomial_pmf stats.binom.pmf(x, n_trials, p_success) plt.figure(figsize( span stylecolor:#1c00cf10/span , span stylecolor:#1c00cf5/span )) plt.stem(x, binomial_pmf) plt.title( span stylecolor:#c41a16二项分布 PMF/span ) plt.xlabel( span stylecolor:#c41a16成功次数/span ) plt.ylabel( span stylecolor:#c41a16概率/span ) plt.show()/span/span/span/span 生成 示例硬币翻转的贝叶斯推理 我们将使用贝叶斯推理来估计有偏差的硬币出现正面的概率。 先前的信念 假设 Beta 先验分布的参数为 α 2 和 β 2表示统一的先验信念。 span stylecolor:rgba(0, 0, 0, 0.8)span stylebackground-color:#ffffffspan stylebackground-color:#f9f9f9span stylecolor:#242424span stylecolor:#007400# 定义先验分布/span alpha_prior span stylecolor:#1c00cf2/spanbeta_prior span stylecolor:#1c00cf2/spanPrior stats.beta(alpha_prior, beta_prior) span stylecolor:#007400# 绘制先验分布/span x np.linspace( span stylecolor:#1c00cf0/span , span stylecolor:#1c00cf1/span , span stylecolor:#1c00cf100/span ) plt.figure(figsize( span stylecolor:#1c00cf10/span , span stylecolor:#1c00cf5/span )) plt.plot(x, Prior.pdf(x), label span stylecolor:#c41a16Prior/span ) plt.title( span stylecolor:#c41a16Prior Distribution/span ) plt.xlabel( span stylecolor:#c41a16Probability of Heads/span ) plt.ylabel( span stylecolor:#c41a16Density/span ) plt.legend() plt.show()/span/span/span/span 生成 似然和后验 使用观察到的数据证据更新先验以获得后验分布。 span stylecolor:rgba(0, 0, 0, 0.8)span stylebackground-color:#ffffffspan stylebackground-color:#f9f9f9span stylecolor:#242424span stylecolor:#007400# 观察到的正面和反面的数量/span n_heads span stylecolor:#1c00cf7/spann_tails span stylecolor:#1c00cf3 /spanspan stylecolor:#007400# 更新后验分布/span alpha_posterior alpha_prior n_heads beta_posterior beta_prior n_tails posterior stats.beta(alpha_posterior, beta_posterior) span stylecolor:#007400# 绘制后验分布/span plt.figure(figsize( span stylecolor:#1c00cf10/span , span stylecolor:#1c00cf5/span )) plt.plot(x, Prior.pdf(x), label span stylecolor:#c41a16Prior/span ) plt.plot(x, posterior.pdf(x), label span stylecolor:#c41a16Posterior/span , linestyle span stylecolor:#c41a16--/span ) plt.title( span stylecolor:#c41a16先验和后验分布/span ) plt.xlabel( span stylecolor:#c41a16正面的概率/span ) plt.ylabel( span stylecolor:#c41a16密度/span ) plt.legend() plt.show()/span/span/span/span 生成 结论 概率论是支撑许多统计和机器学习技术的基本数据科学组成部分。本教程涵盖了概率的基本概念从基本定义到高级贝叶斯推理并提供了实际示例和 Python 实现。通过掌握这些概念您可以构建更强大的模型做出更好的决策并从数据中获得更深入的见解。 尝试使用不同的概率分布、假设和数据集来探索概率论在数据科学项目中的广泛应用。
http://www.zqtcl.cn/news/110325/

相关文章:

  • 电子商务网站建设基本流程公司网站建设平台
  • 域名没过期 网站打不开怎么办素马设计顾问讲解价格
  • 怎么做非法彩票网站贵州网站开发哪家便宜
  • 青岛市医疗保险网站wordpress七牛云
  • 哪个浏览器可以做网站查询网站的外链
  • 浅析社区网站的建设有了网站源码 怎么建设网站
  • 苏州网站排名优化系统网页设计师
  • 网站开发定制推广杭州河南省的网页制作
  • 北京随喜设计网站国内好的seo网站
  • 网站中宣传彩页怎么做的网站建设评估及分析
  • 东莞php网站建设素材网站php程序源码
  • 怎么做免费视频网站模版网站可以做seo吗
  • 备案期间怎么做网站微动漫怎么制作
  • 精美的php个人网站源码公司网站建设方案书
  • 站长如何做视频类网站如何诊断网站
  • 个人怎么做网站优化在线做印章的网站
  • 自己做的小网站市场营销互联网营销
  • 程序员会搭建非法网站吗永久免费生成app网页
  • 重庆渝北做网站哪里便宜浙江建设职业学校网站
  • 移动端网站开发介绍品牌宣传网站
  • 做文案图片上什么网站seo具体优化流程
  • 摄影做网站中国电商公司排名
  • 比较好的平面设计网站国际进出口贸易网站
  • 网站集约化建设困难seo技术网网
  • 咸宁网站建设报价成都网站设计 冠辰
  • 织梦网站首页目录在哪里自己编写的网站如何放到wordpress
  • 检测网站为什么打不开了推广网站有哪些方式
  • 建设银行官方网站下载安装python可以做网站吗
  • 邢台好蜘蛛网站建设郑州市网络设计公司
  • 忻府网站建设手机上做网站