为什么MD5 Hash For FileStream和String不同C#

时间:2012-11-06 06:50:03

标签: c# md5 md5sum md5-file

我使用System.Security.Cryptography.MD5从String和包含相同字符串的文件生成MD5哈希。但是哈希值不同。

以下是从字符串

生成的代码
byte[] data = Encoding.ASCII.GetBytes("The quick brown fox jumps over the lazy dog");
byte[] hash = MD5.Create().ComputeHash(data);
return BitConverter.ToString(hash).Replace("-", "").ToLower();

以下是我从文件

生成哈希时的代码
internal static string CalculateFileHashTotal(string fileLocation) 
    {
        using(var md5 = MD5.Create())
        {
            using (var stream = File.OpenRead(fileLocation))
            {
                byte[] b = md5.ComputeHash(stream);
                stream.Close();
                return BitConverter.ToString(b).Replace("-", "").ToLower();
            }
        }
    }

字符串中的哈希是正确的,所以我假设文件中的哈希读取了一些额外的东西或者没有读取整个文件。我无法在Google上找到答案。

任何想法?

2 个答案:

答案 0 :(得分:6)

散列不同,因为数据不同。

该文件是UTF-8,而不是ASCII,因此您应该使用UTF-8编码将字符串转换为字节以获得相同的结果:

byte[] data = Encoding.UTF8.GetBytes("The quick brown fox jumps over the lazy dog");

此外,该文件的开头可能包含BOM (byte order mark)。它包含在数据中,因为文件不是作为文本读取的。

在数据开头添加UTF-8 BOM会产生相同的散列:

byte[] bom = { 239, 187, 191 };
byte[] data = Encoding.UTF8.GetBytes("The quick brown fox jumps over the lazy dog");

byte[] bomdata = new byte[bom.Length + data.Length];
bom.CopyTo(bomdata, 0);
data.CopyTo(bomdata, bom.Length);
byte[] hash = MD5.Create().ComputeHash(bomdata);

答案 1 :(得分:-1)

你是否修剪了文件中的空格和新行?