多列值查找

时间:2016-04-07 14:53:36

标签: r

我需要有关字符串处理的帮助。我正在从经纪人声明中获取合同,并且我希望能够根据字符串中包含的特定值为每个合同分配高级别类别。例如,如果我有合约 5月16日大豆油,我希望能够将其归类为 grain ,然后再归类为大豆油。本质上,我想创建一种字典,我可以在一列合约中提供,然后我可以再吐出两列,一列定义一个扇区,然后下一列定义期货合约类型。到目前为止,我已经尝试matrix$breakdown <- strsplit(matrix$contract, " ")创建c("MAY", "16", "SOYBEAN", "OIL"),它为我提供了单独的字符串来检查值。我的想法是创建一种字典,因为除了日期之外,合同字符通常不会改变。例如,某种类型的函数会检查 SOYBEAN OIL 是否包含在字符串中,如果是,那么就给我 grain 作为行业,豆油作为期货合约类型。并且可能有一种更容易的方法来做到这一点。我不关心这个方法,我只需要一个健壮的系统。我这样做的原因是我希望能够自动化依赖于类别的计算。因此,在我建立上述(行业和期货合约)之后,我将在新栏目中确定合约规模乘数等,这取决于合约类型,例如豆油。我知道啰嗦......

任何帮助将不胜感激,谢谢!

0 个答案:

没有答案