当前位置: 代码迷 >> 数据仓库 >> 数据仓库缓慢变更维度应对策略
  详细解决方案

数据仓库缓慢变更维度应对策略

热度:80   发布时间:2016-05-05 15:42:07.0
数据仓库缓慢变化维度应对策略
此处只针对有分析价值字段的变化,采用策略记录其变化,无任何分析价值的,直接进行UPDATE。拉链表添加增加有效开始时间,有效结束时间,最新版本标示字段。比如客户表的婚姻状况发生变化,会新增一条记录,两条记录如下:客户   婚姻状况  有效开始日期,有效结束日期,最新版本客户A,未婚,    1988-01-01,  2014-09-24,    N客户A,已婚,    2014-09-24,  9999-12-31,    Y缺点:当事实表与其关联时,需要根据交易日期判断所在范围进行关联,SQL效率比较差。解决办法,1.使用代理键,并在事实表中添加此字段,但此点会使ETL的处理逻辑变的复杂些。2.添加版本号字段,并将此字段冗余到事实表中,这样也可以提高表的关联性能。若维度表特别庞大,且字段变化特别频繁如何处理?两种处理策略1.将变化特别频繁的字段拆分出来形成一个单独的表,它包含自己关键字。2.将变化特别频繁的字段冗余到事实表中。

?