可视化数据以进行数据清理

时间:2018-11-05 12:04:18

标签: python pandas matplotlib plot data-cleaning

我有一列数据框架,其中包含数百万行(将近800万行)。我想研究此专栏以便进行一些数据清理。包含的数据是纽约市黄色出租车的出行距离。 我用sns.distplot()尝试了一个简单的绘图,但是它没有给我清晰的绘图。

enter image description here

我也确实尝试过使用范围:sns.distplot(df['trip_distance']<200, kde=False, bins=10, norm_hist=False),但是我得到的这个再次看起来没有帮助:

enter image description here

有没有办法通过可视化的方式来理解本专栏?

1 个答案:

答案 0 :(得分:0)

您可以尝试以下操作:->

import pandas as pd
import matplotlib.pyplot as plt
s=pd.read_csv("name.csv",usecols=['col_name'],squeeze=True)
s.plot.bar() #for bar graph
s.plot.hist() #for histogram