二次分析与数据挖掘的区别

时间:2015-12-30 10:03:12

标签: methods statistics data-mining spss

我正在尝试从为其他目的而构建的大型多维数据集中提取某些人口统计群体的某些消费模式。我正在使用聚类和回归分析与手动方法(SPSS)。这被认为是二次分析还是数据挖掘?我理解统计分析和数据挖掘之间的区别,但在这种情况下似乎介于两者之间...谢谢

1 个答案:

答案 0 :(得分:0)

"二级分析"意味着收集了数据" primary"研究项目A,然后再次分析 为" secondary"项目B的目标非常不同,最初没有计划。也许很久以后可能是由不同的人。如果您想避免自己进行实验的成本,并且其他人已经发布了合适的数据,那么在医学上相当普遍。

一个理论上的例子:

  1. 研究组A对药物B进行临床试验,测量体重和胰岛素水平。
  2. 研究组(含药物B)和对照组(无药物B)均公布数据。
  3. ......十年后......
  4. 研究组C想知道体重与胰岛素水平之间是否存在相关性。他们不关心药物B,所以他们只关注对照组。他们将数据与许多其他组的数据相结合,而不是进行自己的实验。
  5. 这不是一个" meta"研究,因为他们忽略了关于药物B的任何结果。他们不使用A组的结果,只使用他们的数据,用于不同的目的。由于这是数据的二次使用,因此称为"二次分析"。

    分析可以像计算相关性一样简单 - 通常不被认为是数据挖掘" (您不是搜索,也不是使用高级统计数据),而是进行传统统计假设检验。

相关问题