熊猫数据框净现值向量化(函数向量化)

时间:2018-10-20 15:20:57

标签: python pandas numpy vectorization

我有以下数据框:

import numpy as np
import pandas as pd
dates = pd.date_range(start='2014-01-01',end='2018-01-01',  freq='Y')
df = pd.DataFrame(5*np.eye(4,), index=dates, columns=['Var1', 'Var2', 'Var3', 'Var4'])
print(df)

            Var1  Var2  Var3  Var4
2014-12-31   5.0   0.0   0.0   0.0
2015-12-31   0.0   5.0   0.0   0.0
2016-12-31   0.0   0.0   5.0   0.0
2017-12-31   0.0   0.0   0.0   5.0

我想计算3年中2014年和2015年每个变量的NPV值。

现在我知道如何同时获取一个变量和一行的当前值:

Var1_2014     = df.loc['2014':'2016','Var1'].tolist()
NPV_Var1_2014 = np.npv(0.7,[0]+Var1_2014) 

但是,我不知道如何对函数进行向量化以直接计算整个列。我想获得类似的东西:

             Var1  Var2  Var3  Var4  Var1_NPV
2014-12-31   5.0   0.0   0.0   0.0      a
2015-12-31   0.0   5.0   0.0   0.0      b
2016-12-31   0.0   0.0   5.0   0.0     Nan
2017-12-31   0.0   0.0   0.0   5.0     Nan

在这里我可以说类似df['Var1_NPV']= npv('Var1',duration=3years,discount_rate=0.7)

关于如何有效地矢量化该功能的任何想法吗?

非常感谢,

1 个答案:

答案 0 :(得分:0)

我找到了一个带有apply和offset的解决方案:

def give_npv(date,df,var,wacc):   
    date2 = date + pd.DateOffset(years=2)  
    data    = df.loc[date:date2,var].tolist()
    NPV_var = np.npv(wacc,[0]+data) 
    return NPV_var


df['index2'] = df.index
df['test'] = df.apply(lambda x: give_npv(x['index2'],df,'Var2',0.07) ,axis=1 ) 
print(df)

            Var1  Var2  Var3  Var4     index2      test
2014-12-31   5.0   0.0   0.0   0.0 2014-12-31  4.367194
2015-12-31   0.0   5.0   0.0   0.0 2015-12-31  4.672897
2016-12-31   0.0   0.0   5.0   0.0 2016-12-31  0.000000
2017-12-31   0.0   0.0   0.0   5.0 2017-12-31  0.000000