【发布时间】:2016-02-12 00:06:05
【问题描述】:
我目前正在尝试理解星型模式,并且在粒度方面遇到了很多困难。
假设我有一个包含 session_id、user_id、order_id、product_id 的事实表,我想按用户每周汇总会话(请记住,并非每个会话都会导致订单或产品和 DW需要跟踪非购买用户和购买用户的会话)。
我认为没有理由在事实表中跟踪 order_ids 或 session_ids,所以它会变成这样:
week_date、user_id、total_orders、total_sessions ...
但是,如果用户在一周内进行了多次购买,我将如何跟踪 product_ids?我假设我不能在一个数组中保留多个产品 ID(例如:“20/02/2012”、“5”、“3”、“PR01、PR32、PR22”)?
我认为它可能必须保持在“每个会话”级别,但这可能会导致大量数据。对于上述示例,您将如何实现粒度?
【问题讨论】:
标签: data-warehouse datamodel star-schema