查看: 4249|回复: 15
收起左侧

[讨论] 请问哈希值碰撞率会发生在大体相同的两个文件,还是完全不同的文件身上?

[复制链接]
mifanu
发表于 2023-4-12 03:21:06 | 显示全部楼层 |阅读模式
本帖最后由 mifanu 于 2023-4-12 03:27 编辑

据说某些算法的哈希值有一定几率发生碰撞,即文件不同,哈希值相同。

那么,我想请问,这种概率,会发生在大体相同的两文件身上,还是发生在完全不同的文件身上?

之所以这样问
1、因为我们通常校验哈希值,主要是用来辨别肉眼无法区分的两个雷同文件,所以他们大体上相同。
如果碰撞根本不会发生在两个大体相同的文件身上,那正好。也就是说,这种碰撞几率不会出现在我这个应用场景下。也就是说,如果他们肉眼明显不同,那还劳什子算什么哈希。

2、因为我曾经用二进制修改工具,对大文件改动一个字节。但是基本上没有发现哈希值相同的情况。
所以我开始怀疑,是怎样才会出现所谓的“碰撞”,并不是因为区别极小。而是两个完全不同的文件,阴差阳错的刚巧算出来的相同?

rfc6979
发表于 2023-4-12 18:46:26 | 显示全部楼层
与hash算法有关
比如,md5/sha1已经是不安全的算法了
而sha256还有其他sha3目前以及未来一定时间内还是安全的
产生的碰撞与文件大小无关,与文件有多少相似性也无关
nmyh
发表于 2023-4-12 19:01:18 | 显示全部楼层
暂时没找到碰撞工具,但是以前保存得有两个md5一样而图片画面完全不一样的图片。

md5相同的两张不同图片.zip (655.71 KB, 下载次数: 1369)
mifanu
 楼主| 发表于 2023-4-12 19:08:00 | 显示全部楼层
nmyh 发表于 2023-4-12 19:01
暂时没找到碰撞工具,但是以前保存得有两个md5一样而图片画面完全不一样的图片。

多谢。我正在找这样的下载实例。您提供的太恰如其分了。感谢。我研究研究。昨天搜到2个,还要会员才能下载。
nmyh
发表于 2023-4-12 19:16:39 | 显示全部楼层
mifanu 发表于 2023-4-12 19:08
多谢。我正在找这样的下载实例。您提供的太恰如其分了。感谢。我研究研究。昨天搜到2个,还要会员才能下 ...

还有个例子,两张原始图片的大小不一致,但是经过md5碰撞后就变成同样大小同样md5的两张图片了。

Create your own MD5 collisions.zip (587.34 KB, 下载次数: 1403)
zhang_0519
发表于 2023-4-12 23:42:18 来自手机 | 显示全部楼层
这碰上的概率应该比中500w低吧!
mifanu
 楼主| 发表于 2023-4-13 00:06:00 | 显示全部楼层
本帖最后由 mifanu 于 2023-4-13 00:10 编辑
rfc6979 发表于 2023-4-12 18:46
产生的碰撞与文件大小无关,与文件有多少相似性也无关

那与什么有关呢?我看了楼上两组例子,
1、大小一样,必须一个字节都不差。
2、内容相似,整体上有不少地方是相同的。
mifanu
 楼主| 发表于 2023-4-13 00:11:27 | 显示全部楼层
本帖最后由 mifanu 于 2023-4-13 00:14 编辑
nmyh 发表于 2023-4-12 19:16
还有个例子,两张原始图片的大小不一致,但是经过md5碰撞后就变成同样大小同样md5的两张图片了。

请问,是必须大小一样么?有没有大小不一样的例子?
照这两组例子来看,大小是完全相同,一个字节都不差才行?
意义:比如,我下载一个文件,如果下载过程中丢损了文件尾部若干部分。这样的话,哈西值有可能与原文件雷同吗?
nmyh
发表于 2023-4-13 12:44:26 | 显示全部楼层
mifanu 发表于 2023-4-13 00:11
请问,是必须大小一样么?有没有大小不一样的例子?
照这两组例子来看,大小是完全相同,一个字节都不差 ...

只能说应该是一样大小的,因为我没见过md5、sha1一致的而文件大小却不同的情况。
你下文件,没下载完是肯定与原文件的哈希值不同的。

评分

参与人数 1人气 +3 收起 理由
mifanu + 3

查看全部评分

mifanu
 楼主| 发表于 2023-4-13 13:40:51 来自手机 | 显示全部楼层
本帖最后由 mifanu 于 2023-4-13 13:43 编辑
nmyh 发表于 2023-4-13 12:44
只能说应该是一样大小的,因为我没见过md5、sha1一致的而文件大小却不同的情况。
你下文件,没下载完是 ...


这么说,哈希用来校验文件下载是否完整,是100%不会出错的?不用担心那种碰撞的情况。
因为我之前考虑因为区别小会导致哈西采样相同。但如果完全不用担心,那确实是个好事。
您需要登录后才可以回帖 登录 | 快速注册

本版积分规则

手机版|杀毒软件|软件论坛| 卡饭论坛

Copyright © KaFan  KaFan.cn All Rights Reserved.

Powered by Discuz! X3.4( 沪ICP备2020031077号-2 ) GMT+8, 2024-12-4 15:46 , Processed in 0.133718 second(s), 20 queries .

卡饭网所发布的一切软件、样本、工具、文章等仅限用于学习和研究,不得将上述内容用于商业或者其他非法用途,否则产生的一切后果自负,本站信息来自网络,版权争议问题与本站无关,您必须在下载后的24小时之内从您的电脑中彻底删除上述信息,如有问题请通过邮件与我们联系。

快速回复 客服 返回顶部 返回列表