查看: 2677|回复: 17
收起左侧

[分享] 毒霸质量监控平台—错误报告90秒的快速响应[form duba blog]

[复制链接]
hzqedison
发表于 2010-4-14 12:18:41 | 显示全部楼层 |阅读模式
原文地址:http://blog.duba.net/post/kingsoft_quality_monitoring_90sec.html
作者:张康宗

随着毒霸专业版2010年3月5日开始公测,毒霸的质量监控平台也同步正式上线了。

在2009年的毒霸年终总结的时候,我们发现毒霸过去的质量监控体系是存在缺陷的,从用户碰到问题到研发得到反馈,这中间会经过较长的步骤,使得时效性很难保障。为了完善毒霸的质量监控,第一时间获知毒霸产品在用户使用的时候是否发生了一些异常情况,我们在毒霸专业版产品里面花了大力气打造了一套质量监控平台。随着毒霸专业版2010年3月5日开始公测,毒霸的质量监控平台也同步正式上线了。

在毒霸软件质量监控平台设计里面,分为2个部分:客户端部分和服务端部分。如果您的毒霸产品在使用的时候,由于软件冲突、特殊环境等原因导致的软件发生错误需要关闭的时候,位于客户端的毒霸的软件错误信息收集程序就会出现,如下图:

在点击了“发送错误信息”按钮之后,错误收集程序就会将当前发生错误的进程的内存转储文件(DUMP文件)发送到毒霸的质量监控平台。毒霸的质量监控平台会在90秒内完成这个错误报告的分析并给出相关的结果递送研发经理。

【名词解释】内存转储文件:这个内存转储文件里面只包括发生错误的进程,在发生错误的那一刻相关的CPU指令信息,不会包含任何的用户隐私信息。

下图是毒霸的质量监控平台的一个架构设计图

当您点击“发送错误报告”按钮以后,您的内存转储文件(DUMP文件)会经过下面一些关键步骤:


  • 实时:位于前端的内存转储文件(DUMP文件)收集服务器实时响应你的发送请求。
  • 60秒:您发送的文件会在60秒内被同步到金山内网里面,并保存到毒霸的崩溃转储文件存储集群里面。与此同时,这个新增的文件会立即被毒霸的崩溃转储分析服务器所捕获,然后会通过一个负载调度组件通知毒霸崩溃转储分析引擎进行错误原因的分析。
  • 30秒:一个新增的未被分析过的内存转储文件(DUMP文件)分析大概需要30秒时间,30秒以后毒霸 崩溃转储分析引擎就可以准确的得出导致软件错误的原因,并结合代码库服务器,直接定位到具体是哪一行代码发生了错误。
  • 实时:完成一个分析过程以后,相关的数据会被记录到毒霸的数据库服务器里面并通知相关的研发经理。

整个过程只需要90秒。90秒,一个错误报告被分析并会直接将相关结果呈送研发经理。

这个系统上线以后,得到了不少用户的积极支持。毒霸产品发生问题以后,大量的用户都点击了发送错误信息的按钮,在这些用户的积极支持下,毒霸的产品质量得到了很好的控制。

下图是在过去的15天内,毒霸专业版由于各种原因发生异常情况的次数。在毒霸研发部门不断的完善之下,毒霸专业版由于各种原因而导致异常的数量已经持续降低,毒霸专业版质量得到了很大的改善。毒霸越来越稳定了。


如果您的毒霸产品出现问题,请点击“发送错误信息”按钮,只需90秒,完成和研发经理的直接互动!您的一次点击,将使得上千上万的用户因为您的一次点击而受益。
insight
发表于 2010-4-14 12:21:59 | 显示全部楼层
本帖最后由 insight 于 2010-4-15 16:20 编辑

支持~~~
wd19880427
头像被屏蔽
发表于 2010-4-14 12:24:02 | 显示全部楼层
本帖最后由 wd19880427 于 2010-4-14 15:01 编辑

顶!支持正奇发布这个消息,是金山前进的证明~
iippuiui
发表于 2010-4-14 12:25:21 | 显示全部楼层
越快越好! 当然,快整合还更好了!
kaibuliaokou
头像被屏蔽
发表于 2010-4-14 12:25:36 | 显示全部楼层
这个还是要支持一下的··
白羊座
发表于 2010-4-14 12:25:45 | 显示全部楼层
不发布新版的时候,这曲线还从没见过能往上走的
hzqedison
 楼主| 发表于 2010-4-14 12:27:20 | 显示全部楼层
回复 6# 白羊座


    持续改进,抓大放小。

毒霸一直在进步
嘁。不稀罕~
发表于 2010-4-14 12:30:53 | 显示全部楼层
回复 6# 白羊座


    这曲线确实与新版本发布有关,不过未必是金山新版本发布,或者装机量很大的第三方软件新版本与金山冲突也会影响。。。
白羊座
发表于 2010-4-14 12:36:02 | 显示全部楼层
本帖最后由 白羊座 于 2010-4-14 12:37 编辑

回复 8# 嘁。不稀罕~


    冲突的话,两种结果,要么金山崩,要么那个软件崩,当然蓝屏也是可能的,不过蓝屏就记录不了了
如果自我保护够强的化,任何软件都是插不进模块来的,就不会轻易崩溃了

再说,使用多款安全软件本来就不提倡吧
bbcallen
发表于 2010-4-14 13:37:00 | 显示全部楼层
本帖最后由 bbcallen 于 2010-4-14 13:38 编辑

青蛙的文章,要顶

蓝屏也是可以有记录的,不过分析起来就比进程dump麻烦多了。
您需要登录后才可以回帖 登录 | 快速注册

本版积分规则

手机版|杀毒软件|软件论坛| 卡饭论坛

Copyright © KaFan  KaFan.cn All Rights Reserved.

Powered by Discuz! X3.4( 沪ICP备2020031077号-2 ) GMT+8, 2025-5-21 23:47 , Processed in 0.160667 second(s), 17 queries .

卡饭网所发布的一切软件、样本、工具、文章等仅限用于学习和研究,不得将上述内容用于商业或者其他非法用途,否则产生的一切后果自负,本站信息来自网络,版权争议问题与本站无关,您必须在下载后的24小时之内从您的电脑中彻底删除上述信息,如有问题请通过邮件与我们联系。

快速回复 客服 返回顶部 返回列表