MyException - 我的反常网
当时方位:我的反常网» 数据库房 » 构建企业级数据库房的5步法

构建企业级数据库房的5步法

www.bsjylc692.com  网友共享于:2018-06-06  阅读:0次
构建企业级数据库房的五步法

一. 承认主题

       即承认数据剖析或前端展示的主题(例如:某年某月某区域的啤酒出售状况). 主题要体现出某一方面的各剖析视点(维度)和核算数值型数据(测量)之间的联系, 承认主题时要归纳考虑.

 

二. 承认测量

        承认主题后, 需求考虑剖析的技能目标(例如: 年出售额等). 它们一般为数值型数据, 其间有些衡量值不可以汇总; 有些可以汇总起来, 以便为剖析者供给有用的信息. 测量是要核算的目标, 有必要事前挑选恰当, 依据不同的测量可以进行杂乱关键性目标(KPI)的规划和核算.

 

三. 承认现实数据粒度

        承认测量之后, 需求考虑该测量的汇总状况和不同维度下测量的聚合状况; 例如在事务体系中数据最小记载到秒, 而在将来剖析需求中, 时刻只需准确到天就可以了. 在ETL处理过程中, 按天来汇总数据, 这时数据库房中测量的粒度便是”天”. 假如不能承认将来的剖析需求中是否要准确到秒, 那么, 咱们要遵从”最小粒度准则”, 在数据库房中的现实表中保存每一秒的数据, 然后在后续树立多维剖析模型(Cube)的时分, 会对数据提早进行汇总, 保证发作剖析成果的功率.

 

四. 承认维度

        维度是剖析的各个视点, 例如:咱们期望依照时刻, 或许区域, 或许依照产品进行剖析. 那么这儿的时刻, 区域, 产品便是相应的维度. 依据不同的维度, 可以看到各个测量汇总的状况, 也可以依据一切的维度进行穿插剖析.

        维度的层次(Hierarchy)和等级(Level). 例如: 在时刻维度上, 依照”年-季度-月”构成一个层次, 其间的”年”, “季度”, “月”成为了这个层次的3个等级. 咱们可以将”产品大类-产品子类-产品” 换分为一个层次, 其间包括”产品大类”, “产品子类”,”产品”三个等级.

        咱们可以将3个等级设置成一张数据表中的3个字段, 比方时刻维度; 咱们也可以运用三张表, 别离保存产品大类, 产品子类, 产品三部分数据, 比方产品维度.

        树立维度表时要充沛运用署理键, 署理键是数值型的IP号码(每张表的榜首个字段), 它仅有标识了榜首维成员. 在聚合时, 数值型字段的匹配和比较, join功率高. 一起署理键在缓慢改变维中, 起到了对新数据与历史数据的表明效果.

 

五. 创立现实表

        在承认好现实数据和维度后, 将考虑加载现实表. 事务体系的一笔笔出产, 买卖记载便是要树立的现实表的原始数据.

        咱们的做法是将原始表与维度表进行相关, 生成现实表. 相关时有为空的数据时,需求运用外衔接, 衔接后将各维度的署理键取出放于现实表中, 现实表除了各维度署理键外, 还有各衡量数据, 不应该存在描绘性信息.

        现实表中的记载条数据都比较多, 要为其设置复合主键和索引, 以完成数据的完整性和依据数据库房的查询功用优化.

 

六. 元数据

        描绘数据及其环境的数据. 两方面用处:

        首要, 元数据可以供给依据用户的信息, 如记载数据项的事务描绘信息的元数据能协助用户运用数据.

        其次, 元数据能支撑体系对数据的办理和保护, 如关于数据项存储办法的元数据能支撑体系以最有用的方法拜访数据.

        

        元数据机制首要支撑一下五类体系办理功用:

              1.   描绘哪些数据在数据库房中;

              2.   界说要进入数据库房中的数据和从数据库房中发作的数据;

              3.   记载依据事务时刻发作而随之进行的数据抽取工作时刻组织;

              4.   记载并检测体系数据一致性的要求和执行状况;

              5.   衡量数据质量.

m88 188bet uedbet 威廉希尔 明升 bwin 明升88 bodog bwin 明升m88.com 18luck 188bet unibet unibet Ladbrokes Ladbrokes casino m88明升 明升 明升 m88.com 188bet m88 明陞 uedbet赫塔菲官网 365bet官网 m88 help

文章谈论

软件开发程序过错反常ExceptionCopyright © 2009-2015 MyException 版权一切