从多个外部系统构建DataMart的最佳方法?

时间:2010-10-12 14:12:42

标签: sql-server database-design datamart

我正处于为邮件/电子邮件/短信联系信息和历史记录构建SQL Server DataMart的计划阶段。每条数据都位于不同的外部系统中。因此,电子邮件地址没有帐号,SMS电话号码没有电子邮件地址等。换句话说,没有共享主键。有些数据重叠,但除了在重复出现时保留最完整的版本,我无能为力。

使用此数据构建DataMart是否有最佳做法?为每个外部密钥创建一个包含列的密钥表是否可以接受?然后,可以分配唯一的主ID以将其与其他DataMart表绑定。

寻找我可能尚未想到的方法的想法/建议。

感谢。

3 个答案:

答案 0 :(得分:2)

电子邮件地址或电话号码本身听起来像是一个合适的商业密钥。通常,“临时”数据库用于从多个源加载数据,然后分配代理键并执行其他转换。

您熟悉数据仓库方法和设计模式吗?如果您没有以前的知识或经验,那么考虑聘请一些帮助。 BI /数据仓库项目的故障率非常高,错误可能很昂贵。

答案 1 :(得分:1)

答案 2 :(得分:0)

嗯,由于没有其他信息可以将不同的部分捆绑在一起,因此您的数据集市将非常简陋。您将能够获得各种类型的数据(短信,电子邮件,邮件),每种类型的指标(“本周/月/季度/年我们平均每天42.5短信,每月8000封电子邮件!w00t !“)。只需电话号码和电子邮件地址,您的“其他数据集”可能必须是电话公司名称或互联网域名。我想你可以从那里链接到某种地理信息(互联网提供商位置?),或者可能是公司的财务信息。如果您还不知道要去哪个方向,那就太模糊了。

说实话,这听起来像是高层人士对“数据智能”流行语做出了下意识的反应,并且听到了关于通信指标有多重要的信息,因此他们向链接发送命令“让我们一些数据集在我们所有的电子邮件上运行统计数据!“

您需要弄清楚您或您的雇主希望退出此项目的内容,然后确定您当前收集的数据是否会让您跟踪那个信息。现在听起来你正在倒退(“我有这些数据,有什么好处?”)。您完全有可能目前没有所需的数据,这意味着您需要购买它(谁知道你是否可以)或者开始收集它,在这种情况下你将看不到漂亮的图形和趋势 - 上层管理人员看了一段时间......符合警告dportas在第二段中给出的内容;)