只是找了通篇测试报告也没有看到关于这图的进一步相关说明,于是又一次连线AVC官方询问了一下。得到的回复如下:
Hi,
it does simply create groups of the items which are similar to each other. So, the products within one cluster are more similar to each other (similar results) than compared to another cluster. E.g. 1,2,4 – 16,19,23,25 – 145,151,159: here you can easily see that the clusters are grouping numbers which are near to each other (in this case 3 clusters). This was just a simple example and not statistical theory ;)
大体意思就是说通过聚类分析把成绩相仿的杀软聚为一类,从图中我们也可以比较清晰的可以看到同为99+的GD和TP被首先化为了一类,同样ESET、Avira、escan也被分为了一类。说到这里我想估计有一些眼力比较好的饭友估计会笑了——这个我早就发现了:(
嗯,的确,看到这样的回复我也多少懊悔了一下自己的眼力不过,也让我注意到了这个聚类图的一些小问题: 细心的话可以看到聚类的结果绝大多数都是正确的,只有Kaspersky的聚类结果有点牵强,或者可以说是错的(应该与咖啡的成绩相近)但是我这里要说明的是这就是系统聚类本身的特点,不能说是AVC报告的错漏,因为不管是什么分类方法都不能保证对于所有样本(在这里即是杀软)的分类是正确的。
看到这样的分类其实多少有点小失望,不是因为错误的分类,而是因为本想着这是针对每款杀软查杀样本性质(类型)进行的聚类,这样的话可以对杀软本身的特性有更深入的了解(当然实际上杀软针对各类病毒的反应也不是那么简单就能反应出来的)结果只是成绩的聚类……
有兴趣了解的TX可以查询一下系统聚类的相关内容,对于大多数非专业人士而言百度百科、知道里的内容就足够了,结果可以通过SPSS或者其他相关软件模拟获得。