标签: data-structures
我有很多文件并逐行计算md5,并将所有md5保存在数据库中,现在我得到一个新文件并逐行计算md5,我怎么能找到任何文件是否与定义的相似百分比的新文件匹配,ex 90%,并获得匹配的文件。我应该使用什么数据结构来提高空间和时间效率?