从分隔文件中解析变量

时间:2015-10-23 04:32:35

标签: rust

我有一些文件内容由管道|符号分隔。命名为important.txt

1|130|80|120|110|E
2|290|420|90|70|B
3|100|220|30|80|C

然后,我使用Rust BufReader::split来阅读其内容。

use std::error::Error;
use std::fs::File;
use std::io::BufReader;
use std::io::Prelude::*;
use std::path::Path;

fn main() {
    let path = Path::new("important.txt");
    let display = path.display();

    //Open read-only
    let file = match File::open(&path) {
        Err(why) => panic!("can't open {}: {}", display,
                           Error::description(why)),
        Ok(file) => file,
    }

    //Read each line
    let reader = BufReader::new(&file);
    for vars in reader.split(b'|') {
        println!("{:?}\n", vars.unwrap());
    }
}

问题是,vars.unwrap()将返回字节而不是字符串。

[49]
[49, 51, 48]
[56, 48]
[49, 50, 48]
[49, 49, 48]
[69, 10, 50]
[50, 57, 48]
[52, 50, 48]
[57, 48]
[55, 48]
[66, 10, 51]
[49, 48, 48]
[50, 50, 48]
[51, 48]
[56, 48]
[67, 10]

您是否有任何想法如何将此分隔文件解析为Rust中的变量?

1 个答案:

答案 0 :(得分:4)

由于您的数据是基于行的,因此您可以使用BufRead::lines

use std::io::{BufReader, BufRead};

fn main() {
    let input = r#"1|130|80|120|110|E
2|290|420|90|70|B
3|100|220|30|80|C
"#;

    let reader = BufReader::new(input.as_bytes());

    for line in reader.lines() {
        for value in line.unwrap().split('|') {
            println!("{}", value);
        }
    }
}

这为输入中的每一行提供了超过Strings的迭代器。然后使用str::split来获取碎片。

或者,您可以使用已有的&[u8]并使用str::from_utf8从中创建一个字符串:

use std::io::{BufReader, BufRead};
use std::str;

fn main() {
    let input = r#"1|130|80|120|110|E
2|290|420|90|70|B
3|100|220|30|80|C
"#;

    let reader = BufReader::new(input.as_bytes());

    for vars in reader.split(b'|') {
        let bytes = vars.unwrap();
        let s = str::from_utf8(&bytes).unwrap();
        println!("{}", s);
    }
}

如果您正在阅读恰好是以管道分隔的CSV等结构化数据,您可能还需要查看csv包。