python:比较不同日期类型的数据

时间:2017-06-05 12:39:16

标签: python pandas datetime dataframe compare

我有一个比较datetime64 [ns]的数据和'2017-01-01'之类的日期的问题。

这是代码: df.loc[(df['Date'] >= datetime.date(2017.1.1), 'TimeRange'] = '2017.1'

但是,已显示错误并说descriptor 'date' requires a 'datetime.datetime' object but received a 'int'.

如何比较datetime64与数据(2017-01-01或2-17-6-1等)

由于

2 个答案:

答案 0 :(得分:3)

演示:

来源DF:

In [83]: df = pd.DataFrame({'tm':pd.date_range('2000-01-01', freq='9999T', periods=20)})

In [84]: df
Out[84]:
                    tm
0  2000-01-01 00:00:00
1  2000-01-07 22:39:00
2  2000-01-14 21:18:00
3  2000-01-21 19:57:00
4  2000-01-28 18:36:00
5  2000-02-04 17:15:00
6  2000-02-11 15:54:00
7  2000-02-18 14:33:00
8  2000-02-25 13:12:00
9  2000-03-03 11:51:00
10 2000-03-10 10:30:00
11 2000-03-17 09:09:00
12 2000-03-24 07:48:00
13 2000-03-31 06:27:00
14 2000-04-07 05:06:00
15 2000-04-14 03:45:00
16 2000-04-21 02:24:00
17 2000-04-28 01:03:00
18 2000-05-04 23:42:00
19 2000-05-11 22:21:00

过滤

In [85]: df.loc[df.tm > '2000-03-01']
Out[85]:
                    tm
9  2000-03-03 11:51:00
10 2000-03-10 10:30:00
11 2000-03-17 09:09:00
12 2000-03-24 07:48:00
13 2000-03-31 06:27:00
14 2000-04-07 05:06:00
15 2000-04-14 03:45:00
16 2000-04-21 02:24:00
17 2000-04-28 01:03:00
18 2000-05-04 23:42:00
19 2000-05-11 22:21:00

In [86]: df.loc[df.tm > '2000-3-1']
Out[86]:
                    tm
9  2000-03-03 11:51:00
10 2000-03-10 10:30:00
11 2000-03-17 09:09:00
12 2000-03-24 07:48:00
13 2000-03-31 06:27:00
14 2000-04-07 05:06:00
15 2000-04-14 03:45:00
16 2000-04-21 02:24:00
17 2000-04-28 01:03:00
18 2000-05-04 23:42:00
19 2000-05-11 22:21:00

不是标准日期格式:

In [87]: df.loc[df.tm > pd.to_datetime('03/01/2000')]
Out[87]:
                    tm
9  2000-03-03 11:51:00
10 2000-03-10 10:30:00
11 2000-03-17 09:09:00
12 2000-03-24 07:48:00
13 2000-03-31 06:27:00
14 2000-04-07 05:06:00
15 2000-04-14 03:45:00
16 2000-04-21 02:24:00
17 2000-04-28 01:03:00
18 2000-05-04 23:42:00
19 2000-05-11 22:21:00

答案 1 :(得分:2)

您需要确保与其进行比较的数据也采用相同的格式。假设你有两个datetime个对象,你可以这样做:

import datetime
print(df.loc[(df['Date'] >= datetime.date(2017, 1, 1), 'TimeRange'])

这将创建一个datetime对象并列出过滤后的结果。您也可以如上所述为结果分配更新的值。