获取用户的平均在线时间

时间:2018-09-24 09:49:05

标签: python

我受命处理看起来像这样的日志文件:

bob logged-in 11:21:01 pm
bob logged-out 11:23:22 pm 
alice logged-in 11:24:12 pm
jane logged-in 11:31:00 pm
alice logged-out 11:34:20 pm
jane logged-out 11:55:00 pm
bob logged-n 11:56:01 pm

等等等

我需要创建一个脚本来显示它们平均登录了多少时间。输出应如下所示:

jane: 12.5 mins
alice: 2.3 mins
bob: 2.2 mins 

一个用户可以多次登录。 该文件按时间排序,并且登录/注销条目不是顺序的。

即使没有解决困难的时间戳问题,我也在寻找一种bash或python解决方案(假设我已经找到了一种将类似的部分时间戳转换为时代格式的方法)。

任何帮助将不胜感激。

1 个答案:

答案 0 :(得分:0)

假设每次用户登录后,他应该先注销,然后再重新登录,您可以执行此操作。

使2循环,第一个循环捕获所有登录,第二个循环捕获所有注销

您的设置应如下所示:

from datetime import datetime
from functools import  reduce
lines = []
with open('logs.txt', 'r') as f:
    lines = f.readlines()

times = {}

您的第一个循环应如下所示:

for i in range(len(lines)):
    split_login = lines[i].split(' ')
    if split_login[1] != 'logged-in':
        continue
    name = split_login[0]
    # take the login time from the splitted line
    login_time = split_login[2] + split_login[3].replace('\n', '')
    # converted to datetime object
    login_time = datetime.strptime(login_time, '%I:%M:%S%p')
    # create dictionary in times dictionary where you store time per user
    if name not in times:
        times[name] = {'times': [], 'avg': 0}

现在,第二个循环应该是一个内部循环,该循环将从索引所在的位置开始 第一个循环是。

    for ii in range(len(lines)):
        if i+ii+1 < len(lines):
            split_logout = lines[ii+i+1].split(' ')
            if split_logout[0] == name:
                # take the logout time from the splitted line
                logout_time = split_logout[2] + split_login[3].replace('\n', '')
                # convert to datetime object
                logout_time = datetime.strptime(logout_time, '%I:%M:%S%p')
                # calc how long the login was
                time_logged = logout_time - login_time
                # append to the times of the user
                times[name]['times'].append(time_logged.total_seconds())
                # get the average
                times[name]['avg'] = reduce(lambda x, y: x + y, times[name]['times']) / len(times[name]['times'])
                break
#print the avg times per user
for k, v in times.items():
    print('%s: %d' % (k, v['avg']/60))

这只是一个简单而又肮脏的示例,我敢肯定有更好的方法,当然,由于存在一些重复项,因此可以清除代码。