计算十六进制数的存在性 - R.

时间:2015-02-14 03:48:41

标签: r

所以我有一个文件,其中包含大量成对的十六进制数字,以及' NA' /缺少数据符号" ??"。

 A4 BB 08 6F E7 88 D9 10 11 12 AC CB C8 CC  #Row of data in the file.
 ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ??  #Row of missing data in the file.

我试图将所有这些内容输入管道,并深入了解每个十六进制数字的频率,从0到256.到目前为止,我使用'读取表格将其读入一个结构中。命令(称之为测试),我真的不确定从那里做什么。我已经做了很多不同的事情试图压制线条" ??"在任何列中,然后将其余的值转换为十六进制值,并从中获得有用的东西。如果有人能指出我完成这项任务所需的工具,我会非常感激。

编辑: 根据请求输出dput。

structure(list(V2 = structure(c(88L, 209L, 124L, 91L, 132L, 235L
), .Label = c("??", "00", "01", "02", "03", "04", "05", "06", 
"07", "08", "09", "0A", "0B", "0C", "0D", "0E", "0F", "10", "11", 
"12", "13", "14", "15", "16", "17", "18", "19", "1A", "1B", "1C", 
"1D", "1E", "1F", "20", "21", "22", "23", "24", "25", "26", "27", 
"28", "29", "2A", "2B", "2C", "2D", "2E", "2F", "30", "31", "32", 
"33", "34", "35", "36", "37", "38", "39", "3A", "3B", "3C", "3D", 
"3E", "3F", "40", "41", "42", "43", "44", "45", "46", "47", "48", 
"49", "4A", "4B", "4C", "4D", "4E", "4F", "50", "51", "52", "53", 
"54", "55", "56", "57", "58", "59", "5A", "5B", "5C", "5D", "5E", 
"5F", "60", "61", "62", "63", "64", "65", "66", "67", "68", "69", 
"6A", "6B", "6C", "6D", "6E", "6F", "70", "71", "72", "73", "74", 
"75", "76", "77", "78", "79", "7A", "7B", "7C", "7D", "7E", "7F", 
"80", "81", "82", "83", "84", "85", "86", "87", "88", "89", "8A", 
"8B", "8C", "8D", "8E", "8F", "90", "91", "92", "93", "94", "95", 
"96", "97", "98", "99", "9A", "9B", "9C", "9D", "9E", "9F", "A0", 
"A1", "A2", "A3", "A4", "A5", "A6", "A7", "A8", "A9", "AA", "AB", 
"AC", "AD", "AE", "AF", "B0", "B1", "B2", "B3", "B4", "B5", "B6", 
"B7", "B8", "B9", "BA", "BB", "BC", "BD", "BE", "BF", "C0", "C1", 
"C2", "C3", "C4", "C5", "C6", "C7", "C8", "C9", "CA", "CB", "CC", 
"CD", "CE", "CF", "D0", "D1", "D2", "D3", "D4", "D5", "D6", "D7", 
"D8", "D9", "DA", "DB", "DC", "DD", "DE", "DF", "E0", "E1", "E2", 
"E3", "E4", "E5", "E6", "E7", "E8", "E9", "EA", "EB", "EC", "ED", 
"EE", "EF", "F0", "F1", "F2", "F3", "F4", "F5", "F6", "F7", "F8", 
"F9", "FA", "FB", "FC", "FD", "FE", "FF"), class = "factor"), 

还有许多其他专栏。我把它们关掉了,因为它们具有相同的~257个标签值,或者在这里或那里取一个十六进制值。

as.hexmode(名称(测试))导致了同样的问题,无法强迫x' x'到hexmode。

编辑:好的,我取得了一些成功,并且我做了我想做的事情或多或少。

首先我想合并列,因为我只想要对事件进行总体计数(这甚至可能是不必要的)

test2 <- 
c(as.character(test[,1]),as.character(test[,2]),as.character(test[,3]),as.character(test[,4]), 
as.character(test[,5]), as.character(test[,6]), as.character(test[,7]), 
as.character(test[,8]), as.character(test[,9]), as.character(test[,10]), 
as.character(test[,11]), as.character(test[,12]), as.character(test[,13]), 
as.character(test[,14]), as.character(test[,15]), as.character(test[,16]))

然后我只想要每个值的计数:

table(test2)

不转换为整数或任何必要的恶作剧。我感觉不止一点点愚蠢,但是哦。我仍然很好奇,如果有更好的方法来获得每个值的所有行和列的整体计数,就像我做的那样看起来很笨拙。

编辑: 最终答案是(按照我原来的命名惯例):

table(unlist(lapply(test, as.character)))

谢谢BondedDust。

1 个答案:

答案 0 :(得分:2)

看看你是否取得了一些成功:

as.hexmode ( names(test) )

您提供的输出表明已创建表对象,并且第一行将是在这些十六进制字符下方看到的条目的names(在字符模式下)。目前尚不清楚您是否在控制台上显示外部文本文件或输出的内容,因此这可能是一个WAG。

> res <- scan(what="")
1:  A4 BB 08 6F E7 88 D9 10 11 12 AC CB C8 CC
15: 
Read 14 items
> as.hexmode(res)
 [1] "a4" "bb" "08" "6f" "e7" "88" "d9" "10" "11" "12" "ac" "cb" "c8" "cc"
> dput( as.hexmode(res) )
structure(c(164L, 187L, 8L, 111L, 231L, 136L, 217L, 16L, 17L, 
18L, 172L, 203L, 200L, 204L), class = "hexmode")