我编写了以下并行测试用例,它的运行速度至少比 md5sum
二进制文件慢 2 倍:
// dependencies are md-5 = "0.9.1", rayon = "1.5.0", hex-slice = "0.1.4"
use std::{
convert::TryInto,
env::args_os,
fs::File,
io::{Error, Read},
path::PathBuf,
};
use hex_slice::AsHex;
use md5::{self, digest::Digest};
use rayon::prelude::*;
fn main() {
args_os()
.skip(1)
.collect::<Vec<_>>()
.par_iter()
.for_each(|path| {
println!(
"{:02x} {}",
md5sum(PathBuf::from(&path)).unwrap().plain_hex(false),
path.to_string_lossy()
);
});
}
fn md5sum(path: PathBuf) -> Result<[u8; 16], Error> {
let mut file = File::open(path)?;
let mut ctx = md5::Md5::default();
let mut buf = vec![0u8; 2_097_152];
loop {
let bytes_read = file.read(&mut buf)?;
if bytes_read == 0 {
break;
}
ctx.update(&buf[0..bytes_read]);
}
Ok(ctx.finalize().try_into().unwrap())
}
如果我删除并行性(将 par_iter()
更改为 iter()
),它会变得比 md5sum
二进制文件快一点,因此编译器和 md-5 crate 肯定不是问题。该算法并不完全受 I/O 限制,因为两个 md5sum
进程比一个处理两个文件的进程要快一些。
测试背景:我正在通过使用 SysInternals RamMap 清空工作集和备用列表来在测试之间刷新磁盘缓存。其他背景:我在 WSL2 中运行代码,但在 Windows 文件夹中对文件进行校验和。数据位于传统硬盘上。
我尝试了 ThreadPool、tokio 异步读取(与信号量并行+并发以确保不会打开太多文件)和 Rayon(如上所述)。我尝试了从 512 KB 到 10 MB 的缓冲区大小。操作系统或驱动器控制器应该足够智能以尽可能快地读取数据,但它不起作用,也许是因为系统想要对延迟设置一个下限。有没有办法通过并发读取获得不错的性能?
答案 0 :(得分:0)
不是一个完整的解决方案:我通过使用 Semaphore(不是互斥锁,因为在 SSD 上我希望允许多次读取)限制 I/O 获得了一些加速。我重新安排了代码以将读取与计算分开进行,但这不适用于非常大的文件。
读取将是顺序的,但计算可以并行发生:
fn md5sum(io_lock: Arc<Semaphore>, path: PathBuf) -> Result<[u8; 16], Error> {
let buf = {
let _lock = io_lock.access();
let mut file = File::open(path)?;
let mut buf = Vec::new();
file.read_to_end(&mut buf)?;
buf
};
Ok(md5::Md5::digest(&buf).try_into().unwrap())
}
很高兴知道是否有办法让操作系统优化读取。