数仓构建事例:从需求剖析到数仓构建全流程
日期:2023-09-16 21:15:51   来源:常见问题

  在数据仓库领域中,事务总线矩阵是一种用于规划和安排数据仓库的事务模型的东西。它是依据事务需求和事务进程的剖析,清晰事务进程与维度的联系。它协助将事务需求转化为数据模型,并辅导数据仓库的建模和规划进程。

  从该事务矩阵中,咱们咱们能够得知需求建造哪些 DIM 层维度表,DWD 层的现实表。

  方针的拆分是运算进程的拆分,维度模型里的方针拆分是一种思路,是模型规划很重要的一环。想了解更多可看《原子方针、派生方针、复合方针》。

  派生方针:派生方针是由原子方针、时刻周期、修饰词构成,用于反映企业某一事务活动在指定时刻周期及方针规模中的事务状况。

  复合方针:由派生方针直接运算而来,通常是比率型方针。比方最近七天广告点击率,他的特点是产生了新的原子方针。

  事务进程界说:事务进程是从企业的运营收益、本钱动身,价值链条上有必定的影响力的客户的实在需求工作或许事情。并且,这样的进程十分多,咱们要剖析傍边的中心要害进程,不断细分。

  2)声明粒度:界说现实表的每一行所表明的事务意义,尽可能地挑选最细等级的原子粒度,以保证现实表的运用具有最大的灵活性。

  4)确认现实:现实有可加性、半可加性、非可加性三种类型 需求将不可加性现实分解为可加的组件。

  5)冗余维度:考虑更多的是进步下流用户的运用功率,下降数据获取的复杂性,削减相关的表数量。

  依据需求,汇总表还需求计算每月、每年、近 7 天、近 30 天等数据汇总状况,此处不做过多表格展现。必需要分外留意命名标准以及现实是否可加。