Azure数据工厂复制数据很慢

时间:2018-10-26 01:51:04

标签: azure azure-data-factory azure-data-factory-2

源数据库:Azure VM D16s_v3上托管的PostgreSQL 目标数据库:Azure VM D4s_v3上托管的SQL Server开发人员版本 源数据库的大小约为1TB 目标数据库为空,现有架构与源数据库相同

吞吐量仅为1mb / s。没有任何帮助。 (我选择了最大DIU)SQL Server目前没有任何键或索引。

批量为10000

查看屏幕截图: enter image description here

3 个答案:

答案 0 :(得分:2)

使用ADF将数据从本地Oracle源复制到Azure SQL数据库接收器时,我遇到了类似的问题。通过SSIS执行的相同的确切工作大约要快5倍。我们开始怀疑数据类型有问题,因为如果将所有高精度的Oracle NUMBER列都转换为精度较低或整数之类的问题,问题就会消失。

情况非常糟糕,我们与微软就此展开了诉讼,我们最担心的情况得到了证实。

Azure数据工厂运行时十进制类型的最大精度为28。如果源中的十进制/数字值具有较高的精度,则ADF首先将其转换为字符串。字符串转换代码的性能非常糟糕。

检查您的源是否包含任何高精度数字数据,或者是否没有显式定义架构,请查看您是否意外使用了字符串。

答案 1 :(得分:-1)

将批次大小增加到1000000。

答案 2 :(得分:-1)

如果您使用的是TableName选项,则应在“数据集”下拉框中包含该表。如果要使用SQL查询进行提取,请检查“数据集”内部连接,单击“编辑”并删除表名。

我遇到了同样的问题。如果选择查询选项并在数据集中提供表名,那么您将使Azure Datafactory感到困惑,并使其难以决定哪个选项。

相关问题