12
返回列表 发新帖
楼主: mifanu
收起左侧

[讨论] 请问哈希值碰撞率会发生在大体相同的两个文件,还是完全不同的文件身上?

[复制链接]
nmyh
发表于 2023-4-13 14:12:01 | 显示全部楼层
mifanu 发表于 2023-4-13 13:40
这么说,哈希用来校验文件下载是否完整,是100%不会出错的?不用担心那种碰撞的情况。
因为我之前考虑 ...

只是校验下载文件是否完整的情况,是不会出错的。
按照5楼附件的例子,碰撞应该是同时对两个文件进行的处理(结果为相同大小且相同的md5),3楼的附件示例应该也属于这个情况。
woshilaji2
发表于 2023-4-16 07:46:13 | 显示全部楼层
哈希碰撞与文件相似性无关 (哈希算法没有设计缺陷时)
MD5算法 有缺陷  可以强制构造同哈希文件
rfc6979
发表于 2023-4-17 08:16:53 | 显示全部楼层
对这个问题感兴趣可以看看这里:
_https://github.com/corkami/collisions
studycpp
发表于 2023-4-17 11:01:37 | 显示全部楼层
不是很难理解.  hash值本身就是数值,范围就是能表示的文件数目.  好的算法是尽可能给不同的文件(内容和大小分配不同的数值代号,而且间隔要均匀点,,, 我不知道专业说法是不是 稀疏度?均匀度.  所以 相同大小  或者不同大小的文件 都有可能是同一个序列号,.即为hash值
mifanu
 楼主| 发表于 2023-4-17 11:38:58 来自手机 | 显示全部楼层
本帖最后由 mifanu 于 2023-4-17 11:44 编辑
studycpp 发表于 2023-4-17 11:01
不是很难理解.  hash值本身就是数值,范围就是能表示的文件数目.  好的算法是尽可能给不同的文件(内容和大小 ...


hash算法好像首先会计算大小,所以大小差一个byte都不可能发生碰撞。所以hash不会简陋到连大小都不一样还计算出一样的值,不会有这样的低级错误,这是我的初步结论。或者说hash值里本身就有精确到b的大小信息。
您的举例我能理解,您的意思说一杯果汁和一杯均匀稀释的果汁有可能hash一样,到我想hash不至于这样,
安全强迫症
发表于 2023-4-17 13:01:49 来自手机 | 显示全部楼层
mifanu 发表于 2023-4-17 11:38
hash算法好像首先会计算大小,所以大小差一个byte都不可能发生碰撞。所以hash不会简陋到连大小都不一样 ...

基本上不会计算大小的。
您需要登录后才可以回帖 登录 | 快速注册

本版积分规则

手机版|杀毒软件|软件论坛| 卡饭论坛

Copyright © KaFan  KaFan.cn All Rights Reserved.

Powered by Discuz! X3.4( 沪ICP备2020031077号-2 ) GMT+8, 2024-12-4 16:09 , Processed in 0.102946 second(s), 14 queries .

卡饭网所发布的一切软件、样本、工具、文章等仅限用于学习和研究,不得将上述内容用于商业或者其他非法用途,否则产生的一切后果自负,本站信息来自网络,版权争议问题与本站无关,您必须在下载后的24小时之内从您的电脑中彻底删除上述信息,如有问题请通过邮件与我们联系。

快速回复 客服 返回顶部 返回列表