排序(和排序)不排序

时间:2014-09-13 15:40:09

标签: python list sorting

我有一个以下列方式构建的数据文件:

source_id,target_id,展示次数,点击次数

我在其上添加以下列:

  • pair - 源和目标的元组
  • 点击率 - 基本上是点击次数/展示次数
  • 下界
  • 上限

下限/上限是计算值(它与我的问题无关,但对于好奇的these are the bounds for the Wilson confidence interval

问题是,我正在尝试按下限(位置= 6)对列表进行排序,降序。尝试了几件事(排序/排序,使用lambda与使用itemgetter,创建一个没有标题的新列表并尝试对其进行排序)仍然没有任何变化。我有以下代码。

import csv
from math import sqrt
from operator import itemgetter

#----- Read CSV ----------------------------------------------------------------
raw_data_csv  = open('rawdile', "rb")
raw_reader = csv.reader(raw_data_csv)

#  transform the values to ints.
raw_data = []
for rownum,row in enumerate(list(raw_reader)):
    if rownum == 0:                                                             # Header
        raw_data.append(row)
    else:
        r = []                                                            # Col header
        r.extend([int(x) for x in row])                                     # Transforming the values to ints
        raw_data.append(r)



# Add cols for pairs (as tuple) and CTR
raw_data[0].append("pair")


for row in raw_data[1:]:
    row.append((row[0],row[1]))         # tuple
#    row.append(float(row[3])/row[2])    # CTR



# ------------------------------------------------------------------------------


z = 1.95996398454005


def confidence(n, clicks):

    if n == 0:
        return 0
    phat = float(clicks) / n
    l_bound = ((phat + z*z/(2*n) - z * sqrt((phat*(1-phat)+z*z/(4*n))/n))/(1+z*z/n))        # lower bound
    u_bound = ((phat + z*z/(2*n) + z * sqrt((phat*(1-phat)+z*z/(4*n))/n))/(1+z*z/n))        # upper bound
    return phat, l_bound, u_bound


raw_data[0].extend(["CTR","Lower Bound","Upper Bound"])


for row in raw_data[1:]:
    phat, l_bound, u_bound  = confidence(row[2],row[3])
    row.extend([phat, l_bound, u_bound])



# raw_data[1:].sort(key=lambda x: x[6], reverse=True) 

sorted(raw_data[1:], key=itemgetter(6), reverse=True)



outputfile= open('outputfile.csv', 'wb')
wr = csv.writer(outputfile,quoting = csv.QUOTE_ALL)

wr.writerows(raw_data)


raw_data_csv.close()
outputfile.close()

有人可以说明原因吗? 谢谢!

1 个答案:

答案 0 :(得分:2)

您正在一次性排序切片(创建一个新的列表对象),而在另一次尝试中,您忽略了sorted()的返回值。

你无法对列表中的部分内容进行排序;通过连接来创建一个新列表:

rows = rows[:1] + sorted(raw_data[1:], key=itemgetter(6), reverse=True)