当使用pandas(v.13.1)date_range函数时,我会得到关于' end'的不一致行为。在返回范围内:
In [1]: pd.date_range(start='2014-06-09 15:36:55',
end='2014-06-09 15:37:46',
freq='20s')
Out[1]: [2014-06-09 15:36:55, ..., 2014-06-09 15:37:55]
和
In [2]: pd.date_range(start='2014-06-09 15:36:55',
end='2014-06-09 15:37:46',
freq='10s')
Out[2]: [2014-06-09 15:36:55, ..., 2014-06-09 15:37:45]
请注意,在第一种情况下,最后一次是指定的'结束',而在第二种情况下,最后一次是较小的。谁能解释一下呢?
答案 0 :(得分:1)
我相信这个问题已在某些版本中得到解决。现在,date_range
行为始终如一,始终包括start
和 DatetimeIndex
的结尾始终< = end
。输出格式也变得相当。
以下代码使用pandas 0.17.0:
In [1]: import pandas as pd
In [2]: pd.date_range(start='2014-06-09 15:36:55',
...: end='2014-06-09 15:37:46',
...: freq='20s')
Out[2]:
DatetimeIndex(['2014-06-09 15:36:55', '2014-06-09 15:37:15',
'2014-06-09 15:37:35'],
dtype='datetime64[ns]', freq='20S')
In [3]: pd.date_range(start='2014-06-09 15:36:55',
end='2014-06-09 15:37:46',
freq='10s')
Out[3]:
DatetimeIndex(['2014-06-09 15:36:55', '2014-06-09 15:37:05',
'2014-06-09 15:37:15', '2014-06-09 15:37:25',
'2014-06-09 15:37:35', '2014-06-09 15:37:45'],
dtype='datetime64[ns]', freq='10S')
In [4]: pd.date_range(start='2014-06-09 15:36:55',
end='2014-06-09 15:37:46',
freq='15s')
Out[4]:
DatetimeIndex(['2014-06-09 15:36:55', '2014-06-09 15:37:10',
'2014-06-09 15:37:25', '2014-06-09 15:37:40'],
dtype='datetime64[ns]', freq='15S')
In [5]: pd.date_range(start='2014-06-09 15:36:55',
end='2014-06-09 15:37:46',
freq='1s')
Out[5]:
DatetimeIndex(['2014-06-09 15:36:55', '2014-06-09 15:36:56',
...... ......
'2014-06-09 15:37:45', '2014-06-09 15:37:46'],
dtype='datetime64[ns]', freq='S')
请注意,DatetimeIndex
的结尾永远不会超过end
的{{1}}日期。