数据库策略提供数据分析

时间:2013-11-14 09:36:20

标签: mysql database analytics

我提供了一个处理实体店运营的解决方案。我的下一步是为我的客户提供分析。

当我处于起步阶段时,我希望找到一种自由的方式,而不是使用第三方解决方案。我不希望在这一点上有大规模的扩展,但我想把它完成,而不是从生产数据库中运行查询。

我正在考虑性能问题我应该从同一数据库中的不同表运行分析查询。每天晚上都会运行一个cron作业,将数据从生产表复制到分析表。

这是正确的方法吗?

我想到的另一个选择是从不同的数据库(而不仅仅是表)运行分析。我正在使用Amazon RDS和MySQL,如果它更方便吗?

2 个答案:

答案 0 :(得分:2)

这取决于您想要提供的分析数量。

我是DWH经理,将从一个小型(免费)BI(商业智能)解决方案开始。 您的生产数据库和分析数据库应始终是分开的。

  1. 查看Pentaho数据集成(社区版)这是一个免费的ETL工具,可以帮助您将数据从生产中提取到分析数据库,也可以进行转换。
  2. 查看一些像Jaspersoft这样的免费报告软件,以帮助您为客户提供报告平台(如果这是您想要的,否则只需使用Excel)。
  3. BI从不想丢弃数据。如果您认为分析数据库中的数据会变大(2TB +),请不要使用MySQL,而应使用PostgreSQL。 MySQL无法很好地处理大数据。
  4. 如果您对此非常认真,请阅读Ralph Kimball撰写的“The Datawarehouse Toolkit”。这将为您提供一些基本的数据仓库知识。

答案 1 :(得分:0)

亚马逊RDS提供的内容为Read-Replica。它自动执行复制并针对阅读进行了优化。

我喜欢这种解决方案,因为它的便利性很高。下行:它的价格标签。

相关问题