Polybase的下推

时间:2017-08-10 14:05:49

标签: polybase

我有以下情况。维度表,例如PRODUCT加载到SQL Server 2016中。事实表,例如ORDER_ITEM加载到Hadoop中。我想在PRODUCT和ORDER_ITEM之间运行汇总查询,例如

SELECT
 PRODUCT.PRODUCT_CATEGORY,
 SUM(ORDER_ITEM.AMOUNT)
FROM
 HADOOP.ORDER_ITEM OI
 JOIN RDBMS.PRODUCT P ON (OI.PRODUCT_ID = P.PRODUCT_ID)
GROUP BY
  PRODUCT.PRODUCT_CATEGORY

行为是什么。 (1)Polybase是否将PRODUCT维度广播到Hadoop中,在那里执行连接和聚合并返回结果 (2)Polybase是否将ORDER_ITEM表广播到SQL Server并在那里进行连接和聚合?

可能是(2),但如果有人尝试过,请告诉我

1 个答案:

答案 0 :(得分:1)

无论数据量如何,PolyBase都不会从SQL Server移动数据。根据统计数据,PolyBase可以:

A)将order_item表流回SQL Server并计算连接并聚合数据。

B)按OI.ProductiD下推部分聚合Sum(Order_Item.Amount)组,将结果集流式传输到SQL Server,然后在SQL Server中进行连接和最终聚合。

相关问题