在Jupyter

时间:2018-02-01 22:42:09

标签: python pyspark jupyter-notebook

我有一个PySpark数据帧(df),我想在我的Jupyter笔记本中打印出格式精美的表格。

根据post,我认为以下代码可行:

import pandas as pd
from IPython.display import display, HTML

pandas_df = df.toPandas()

display(HTML(pandas_df.to_html()))

不幸的是,这不起作用。我收到以下错误:

ERROR - failed to write data to stream: <__main__.UnicodeDecodingStringIO object at 0x7f75c7a8e750>

有谁知道如何解决这个问题?

谢谢!

1 个答案:

答案 0 :(得分:0)

尝试以下操作:

def printDF(inputDF):
    newDF = inputDF.toPandas()
    from IPython.display import display, HTML
    return HTML(newDF.to_html())

您还可以移动import语句,以便将其全局导入,而不是每次调用该函数时都将其导入。希望这会有所帮助。

相关问题