TPCH生成大型数据集

时间:2017-08-28 04:58:50

标签: dataset

我正在使用TPCH生成大型数据集。我有dbgen,我知道我们需要设置比例因子(决定大小)。我不确定我们需要如何或在哪里设置比例因子?

如果我们需要在运行期间设置它,有人可以告诉我确切的程序。

我正在使用Microsoft Visual Studio 2017,当我运行dbgen

enter image description here

它会自动弹出一个cmd窗口(Windows操作系统),几分钟后问你要替换表sayser.lbl,但是没有我能找到设置大小的选项。

P.S。在dbgen运行并完成后,它会生成所有表,例如supplier.tbl,lineitem.tbl等,但我需要500 GB的数据并且无法获取它。

1 个答案:

答案 0 :(得分:0)

运行它的实际过程是: 一个。打开cmd(在Windows中)并使用cd folderPath转到Debug文件夹 湾现在输入debug.exe -vf -s 500(500是我的数据集的大小,以GB为单位)

有关确切详细信息,请参阅以下链接 http://www.sqlpanda.com/2014/10/tpc-h-217.html