广州一起做网店网站,qq官网在线登录网页版,wordpress主题 工作室,网站维护与建设合同传统的关系数据库一般采用二维数表的形式来表示数据#xff0c;一个维是行#xff0c;另一个维是列#xff0c;行和列的交叉处就是数据元素。关系数据的基础是关系数据库模型#xff0c;通过标准的SQL语言来加以实现。 数据仓库是多维数据库#xff0c;它扩展了关系数据库… 传统的关系数据库一般采用二维数表的形式来表示数据一个维是行另一个维是列行和列的交叉处就是数据元素。关系数据的基础是关系数据库模型通过标准的SQL语言来加以实现。 数据仓库是多维数据库它扩展了关系数据库模型以星形架构为主要结构方式的并在它的基础上扩展出理论雪花形架构和数据星座等方式但不管是哪一种架构维度表、事实表和事实表中的量度都是必不可少的组成要素。 维度是多维数据集的结构性特性。它们是事实数据表中用来描述数据的分类的有组织层次结构级别。这些分类和级别分别描述了一些相似的成员集合用户将基于这些成员集合进行分析。 度量值在多维数据集中度量值是一组值这些值基于多维数据集的事实数据表中的一列而且通常为数字。此外度量值是所分析的多维数据集的中心值。即度量值是最终用户浏览多维数据集时重点查看的数字数据如销售、毛利、成本。所选择的度量值取决于最终用户所请求的信息类型。一些常见的度量值有sales、cost、expenditures和production count等 事实表是数据聚合后依据某个维度生成的结果表。1 星型模型 星形模型是最常用的数据仓库设计结构的实现模式它使数据仓库形成了一个集成系统为最终用户提供报表服务为用户提供分析服务对象。星形模式通过使用一个包含主题的事实表和多个包含事实的非正规化描述的维度表来支持各种决策查询。星形模型可以采用关系型数据库结构模型的核心是事实表围绕事实表的是维度表。通过事实表将各种不同的维度表连接起来各个维度表都连接到中央事实表。维度表中的对象通过事实表与另一维度表中的对象相关联这样就能建立各个维度表对象之间的联系。每一个维度表通过一个主键与事实表进行连接。 事实表主要包含了描述特定商业事件的数据即某些特定商业事件的度量值。一般情况下事实表中的数据不允许修改新的数据只是简单地添加进事实表中维度表主要包含了存储在事实表中数据的特征数据。每一个维度表利用维度关键字通过事实表中的外键约束于事实表中的某一行实现与事实表的关联这就要求事实表中的外键不能为空这与一般数据库中外键允许为空是不同的。这种结构使用户能够很容易地从维度表中的数据分析开始获得维度关键字以便连接到中心的事实表进行查询这样就可以减少在事实表中扫描的数据量以提高查询性能。 使用星形模式主要有两方面的原因提高查询的效率。采用星形模式设计的数据仓库的优点是由于数据的组织已经过预处理主要数据都在庞大的事实表中所以只要扫描事实表就可以进行查询而不必把多个庞大的表联接起来查询访问效率较高同时由于维表一般都很小甚至可以放在高速缓存中与事实表进行连接时其速度较快便于用户理解对于非计算机专业的用户而言星形模式比较直观通过分析星形模式很容易组合出各种查询。2 雪花模型 雪花模型是对星形模型的扩展每一个维度都可以向外连接多个详细类别表。在这种模式中维度表除了具有星形模型中维度表的功能外还连接对事实表进行详细描述的详细类别表详细类别表通过对事实表在有关维上的详细描述达到了缩小事实表和提高查询效率的目的。 雪花模型对星形模型的维度表进一步标准化对星形模型中的维度表进行了规范化处理。雪花模型的维度表中存储了正规化的数据这种结构通过把多个较小的标准化表而不是星形模型中的大的非标准化表联合在一起来改善查询性能。由于采取了标准化及维的低粒度雪花模型提高了数据仓库应用的灵活性。 这些连接需要花费相当多的时间。一般来说一个雪花形图表要比一个星形图表效率低。3 星座模式 一个复杂的商业智能应用往往会在数据仓库中存放多个事实表这时就会出现多个事实表共享某一个或多个维表的情况这就是事实星座也称为星系模式galaxy schema。4 数据集市 数据集市是在构建数据仓库的时候经常用到的一个词汇。如果说数据仓库是企业范围的收集的是关于整个组织的主题如顾客、商品、销售、资产和人员等方面的信息那么数据集市则是包含企业范围数据的一个子集例如只包含销售主题的信息这样数据集市只对特定的用户是有用的其范围限于选定的主题。 数据集市面向企业中的某个部门或某个主题是从数据仓库中划分出来的这种划分可以是逻辑上的也可以是物理上的。 数据仓库中存放了企业的整体信息而数据集市只存放了某个主题需要的信息其目的是减少数据处理量使信息的利用更加快捷和灵活。 数据仓库由于是企业范围的能对多个相关的主题建模所以在设计其数据构成时一般采用星系模式。转载于:https://www.cnblogs.com/kaituorensheng/p/4149804.html