Apache Zeppelin:非常慢的html输出

时间:2017-02-06 22:21:01

标签: apache-zeppelin

我的目标是从Zeppelin中的python和/或scala解释器中获取一些数据,并最终通过一些JavaScript库(如Plotly,D3,Vis等)内联显示数据。

完美的无缝集成将简单地输出JavaScript包含。通过print("%html <script>" + content + "</script>")进行的字符串化数据。

事实上,只要内容不是太大,这种方法适用于所有类型的库,例如print("%html <script>alert(JSON.stringify({name: 'Peter', age: 24}))</script>")

但是,如果内容大小增加,则html输出需要非常长的时间,例如:

%python
print("%html start")
s = "X" * 100000 # data of length 100k
print("<script>js='" + s + "'; alert(js.length)</script>") # takes > 1 minute!

请注意,如果我将相同的输出写入文件并加载它,则没有这样的延迟。因此,它不是由缓慢的浏览器渲染引起的,而是由Zeppelin的方式处理%html输出的处理方式?

有人知道如何解决或解决这个问题吗?

1 个答案:

答案 0 :(得分:0)

好的,我终于找到了答案:这是一个已知的错误。

https://issues.apache.org/jira/browse/ZEPPELIN-1360

解决方法是使用%pyspark解释器进行python开发,而不是使用纯%python解释器。