有没有办法让线程不那么激烈地争夺 I/O 资源?

时间:2021-05-11 10:21:19

标签: rust concurrency parallel-processing

我编写了以下并行测试用例,它的运行速度至少比 md5sum 二进制文件慢 2 倍:

// dependencies are md-5 = "0.9.1", rayon = "1.5.0", hex-slice = "0.1.4"

use std::{
    convert::TryInto,
    env::args_os,
    fs::File,
    io::{Error, Read},
    path::PathBuf,
};

use hex_slice::AsHex;
use md5::{self, digest::Digest};
use rayon::prelude::*;

fn main() {
    args_os()
        .skip(1)
        .collect::<Vec<_>>()
        .par_iter()
        .for_each(|path| {
            println!(
                "{:02x}  {}",
                md5sum(PathBuf::from(&path)).unwrap().plain_hex(false),
                path.to_string_lossy()
            );
        });
}

fn md5sum(path: PathBuf) -> Result<[u8; 16], Error> {
    let mut file = File::open(path)?;
    let mut ctx = md5::Md5::default();
    let mut buf = vec![0u8; 2_097_152];
    loop {
        let bytes_read = file.read(&mut buf)?;
        if bytes_read == 0 {
            break;
        }
        ctx.update(&buf[0..bytes_read]);
    }
    Ok(ctx.finalize().try_into().unwrap())
}

如果我删除并行性(将 par_iter() 更改为 iter()),它会变得比 md5sum 二进制文件快一点,因此编译器和 md-5 crate 肯定不是问题。该算法并不完全受 I/O 限制,因为两个 md5sum 进程比一个处理两个文件的进程要快一些。

测试背景:我正在通过使用 SysInternals RamMap 清空工作集和备用列表来在测试之间刷新磁盘缓存。其他背景:我在 WSL2 中运行代码,但在 Windows 文件夹中对文件进行校验和。数据位于传统硬盘上。

我尝试了 ThreadPool、tokio 异步读取(与信号量并行+并发以确保不会打开太多文件)和 Rayon(如上所述)。我尝试了从 512 KB 到 10 MB 的缓冲区大小。操作系统或驱动器控制器应该足够智能以尽可能快地读取数据,但它不起作用,也许是因为系统想要对延迟设置一个下限。有没有办法通过并发读取获得不错的性能?

1 个答案:

答案 0 :(得分:0)

不是一个完整的解决方案:我通过使用 Semaphore(不是互斥锁,因为在 SSD 上我希望允许多次读取)限制 I/O 获得了一些加速。我重新安排了代码以将读取与计算分开进行,但这不适用于非常大的文件。

读取将是顺序的,但计算可以并行发生:

fn md5sum(io_lock: Arc<Semaphore>, path: PathBuf) -> Result<[u8; 16], Error> {
    let buf = {
        let _lock = io_lock.access();
        let mut file = File::open(path)?;
        let mut buf = Vec::new();
        file.read_to_end(&mut buf)?;
        buf
    };
    Ok(md5::Md5::digest(&buf).try_into().unwrap())
}

很高兴知道是否有办法让操作系统优化读取。

相关问题