查看: 2034|回复: 9
收起左侧

[讨论] 【实现类似“自学习、自进化”的简单办法或程序】欢迎拍砖

[复制链接]
悟心之道
发表于 2011-1-20 21:41:44 | 显示全部楼层 |阅读模式
本帖最后由 悟心之道 于 2011-1-20 21:43 编辑

实际实现“自学习、自进化”是较困难的,但取巧类得一些效果就简单得多。

在服务器可通过不同途径
①获得到疑似病毒样本
②过不同杀软(均采用隔离模式)取得病毒样本
③提取病毒样本特征值(简单文件特征或者传统意上的病毒特征)【高级点可进行分类规则统计分析】
④汇总特征值
⑤更新客户端病毒特征库

只要以一定的硬件配合协调处理软件,就能实现病毒特征层次的类似“自学习、自进化” 了。
所以云端要达到“世界先进水平”应该不算太难!

欢迎拍砖!
maoke2005191
发表于 2011-1-20 22:16:47 | 显示全部楼层
实现楼主这样的理解的东西当然不难。另外创造是难的仿造是简单的,不是看你能造得出来你就是好的。
悟心之道
 楼主| 发表于 2011-1-20 22:21:08 | 显示全部楼层
maoke2005191 发表于 2011-1-20 22:16
实现楼主这样的理解的东西当然不难。另外创造是难的仿造是简单的,不是看你能造得出来你就是好的。

我还造不出来

只是逻辑上成立
波纹寂寞
发表于 2011-1-20 23:28:22 | 显示全部楼层
话说,各杀毒厂商更新病毒库的意义和目的不就是和LZ所说的“自学习,自进化”么?
猪头无双
头像被屏蔽
发表于 2011-1-20 23:38:12 | 显示全部楼层
如果LZ这么理解自学习,自进化的话,早几年杀软厂商就已经这么在做了
李白vs苏轼
发表于 2011-1-20 23:45:53 | 显示全部楼层
本帖最后由 李白vs苏轼 于 2011-1-20 23:48 编辑

我觉得最关键是一套优秀的算法

你说的这些只是一小部分而已

还有行为的统计,总结
病毒族类的归类,以及变种的变化情况

当然还有更为核心的 智慧 逻辑
yeweiyutu
发表于 2011-1-21 01:05:00 | 显示全部楼层
这种算不得“自学习自进化”,只是特征码的简单堆积。
Lgwu
头像被屏蔽
发表于 2011-1-21 01:30:00 | 显示全部楼层
本帖最后由 Lgwu 于 2011-1-21 02:20 编辑

人工智能--不懂,但我懂的学习,补充自己。YY的结果只能让人笑话,让自己丢脸!
    遗传算法在故障诊断专家系统中的应用 (1998年7月)
    李 旭  (北京邮电大学应用科学系,100088)   
    徐心和  (东北大学控制仿真中心)

     
摘 要
 介绍了遗传算法在故障诊断专家系统的推理和在自学习中的应用,克服了专家系统存在的推理
速度慢和先验知识很少情况下知识获取困难的障碍;并将该方法应用于运输链直流调速系统,取得
了良好的效果。
  关键词: 遗传算法,推理,自学习
  分类号: TP301


1 引  言

    目前,专家系统已广泛应用于工业生产的各个方面,尤其在故障诊断方面尤为突出。但是故障诊
断专家系统存在着实时性差,知识获取困难等障碍。为此本文引入遗传算法(GA),较好地解决了在推
理速度慢和先验知识很少的情况下知识获取困难的问题。实践表明,该方法对提高专家系统的实用性
起到了积极作用,具有广阔的应用前景。


2 遗传算法的基本原理

    遗传算法是建立在自然选择和群体遗传学机理基础上的随机、迭代和进化,具有广泛适用性的
搜索方法。它模拟了自然选择和自然遗传过程中发生的繁殖、交配和变异现象,根据适者生存、优
胜劣汰的自然法则,利用遗传算子(选择、交叉和变异)逐代产生,优选个体(即候选解),最终搜索到
较优的个体。具体求解步骤如下:

    1) 编码:将待优化的参数集进行编码,一般总是用二进制将参数集编码成由0或1组成的有限长
度的字符串。

    2) 产生群体:随机地产生n个个体组成一个群体,该群体代表一些可能解的集合。GA的任务是从
这些群体出发,模拟进化过程进行择优汰劣,最后得出优秀的群体和个体,满足优化的要求。

    3) 评价:对群体中的每个个体计算其适应度,为群体进化的选择提供依据。
    4) 选择(复制):按一定概率从群体中选择M对个体,作为双亲用于繁殖后代,产生新的个体加入
下一代群体。即适应于生存环境的优良个体将有更多繁殖后代的机会,从而使优良特性得以遗传。
选择是遗传算法的关键,它体现了自然界中适者生存的思想。

    5) 交叉:对于选中的用于繁殖的每一对个体,随机地选择同一整数n,将双亲的基因码链在此位置
相互交换。交叉体现了自然界中信息交换的思想。

    6) 变异:按一定的概率从群体中选择若干个个体。对于选中的个体,随机选择某一位进行取反操作。
变异模拟了生物进化过程中的偶然基因突变现象。

    对产生的新一代群体进行重新评价、选择、交叉和变异,如此循环往复,使群体中最优个体的适应
度和平均适应度不断提高,直至最优个体的适应度达到某一界限或最优个体的适应度和平均适应度值
不再提高,则迭代过程收敛,算法结束。GA的搜索能力主要是由选择和交叉赋予的,变异算子则保证了
算法能搜索到问题解空间的每一点,从而使算法达到全局最优。


3 知识表示方法

    故障诊断专家系统采用产生式规则来表达知识,用它可以方便地表示专家的知识和经验,是目前专家
系统中最常用的一种知识表示方法。具体表示如下:

    rule(RNO,Goal, Conclusion, RCF,[COND],Logic)
    COND(BNO, TEXT, CCF)
其中
    RNO——规则号;
    Goal——目标;
    Conclusion——结论;
    RCF——规则本身可信度,由([lr,ur],[lrf,urf])表示,[lr,ur]分别表示条件出现时该规则可信度
的最低限度估计和最高限度估计,[lrf,urf] 分别表示条件不出现时该规则可信度的最低限度估计和最
高限度估计;

    [COND]——规则条件表;
    Logic——规则条件的逻辑组合;
    BNO——条件标号;
    TEXT——条件;
    CCF——条件可信度,CCF= [lc,uc],分别表示条件可信度的悲观估计和乐观估计。
    规则条件的逻辑组合分为三种:逻辑与、逻辑或和单一条件。上述区间值要么被[0,0.5)所包含,要
么被(0.5,1]所包含,即要么趋于怀疑,要么趋于信任。不表示出这样的趋势的不确定估计是没有意义的。


4 基于遗传算法的推理方法

    故障诊断专家系统采用的是类似于MYCIN的基于模糊区间的推理方法,具体推理方法见文献[1]。在
该推理过程中,先给出几个假设。导致同一个假设的路径有很多,若对每一假设的每一条路径进行运算,
就会导致推理效率低下,满足不了专家系统的实时性要求。为解决这一矛盾,采用遗传算法来加快推理
速度。具体方法如下:

    1)  对每一个假设的每一条路径进行编码,在每一假设中随机地选择一条路径作为个体,它们的集合
作为初始的群体。

    2) 计算每个个体(即该路径) 结论的可信度模糊区间值,并计算其差值(前者减去后者)作为每个个体
的适应度,它们的和作为该基因串的适应度。

    3) 利用遗传算子,对当前一代的个体进行繁衍,产生出其后代;淘汰掉父代中适应度低的个体,同时
计算后代的适应度,并将适应度值高的个体与父代中保留的个体合并成新的一代。如果达到设定的繁衍
代数或算法已收敛,则返回最好的基因串,并将该基因串适应度值最高的个体进行解码,输出的即为结论;
否则继续进行繁衍。

    遗传算子主要有复制、交叉和变异,具体算法如前所述。

5 基于遗传算法的学习方法

    机器学习历来是专家系统学习的重点和难点。目前研究的学习方法很多,如归纳学习,类比学习等,
但它们都需要大量的专家知识和样本实例,在缺乏先验知识和样本数据很少的情况下则无从下手。本文
采用基于遗传算法的学习方法,消除了以往专家系统难以克服的难点,对于提高专家系统的实用性是很
有意义的。

    遗传算法用于知识学习的思想,是根据给定的少量样本,将与结论有关的一个、两个或m个条件集合
作为编码单元进行编码,计算该编码所对应的m个ITV值(适应度) 和总的ITV值; 利用遗传算子,对当前一
代的个体进行繁衍,产生出其后代;淘汰掉父代中ITV值高的个体,同时计算后代的ITV值,并将ITV值低的
个体与父代中保留的个体合并成新的一代;如果达到设定的繁衍代数或算法已收敛,则返回最好的基因串,
并将该基因串ITV最大的几个个体去掉;对剩下的个体进行解码,输出对应的规则到预备库中,满足要求的
存入知识库,否则继续进行繁衍。编码对应的ITV值计算如下:



其中,[uh,lh] 为结论可信度,其它符号的意义同前。这种方法是通过改变条件的范围,使ITV值达到最小,
即使学习后的规则不确定性达到最小。

    利用遗传算法可对规则集进行修正,即在运行时对规则应用的情况进行评价,并将评价结果作为适应
度,重复遗传算法的过程,得到满意的修正的规则集。


6 仿真结果

    我们在Super486微机上实现了上述方法,并以该方法为基础进行了运输链多参数直流双闭环调速系统
的故障诊断.在此只给诊断正确率出该算法与原算法的仿真结果对比,如表1:




    仿真结果证明了本文方法在专家系统推理和自学习的有效性。但运行速度还比较慢。如果能用并行
结构的处理器来实现,那么推理速度就能得到很大的提高。


7 结  语

    本文利用基于遗传算法的推理和自学习,提高了专家系统的适应性和运行速度。将该方法成功地应
用于运输链直流调速系统,实践表明它能极大地提高专家系统的实用性,具有广阔的应用前景。



人工智能与专家系统(第2版21世纪高等院校计算机系列教材)

章节目录:
第二版前言
第一版前言
第1章  绪论
  1.1  人工智能及其发展
  1.2  人工智能的研究与应用领域
  习题一
第2章  知识表示方法
  2.1  一阶谓词逻辑表示方法
    2.1.1  一阶谓词逻辑
    2.1.2  一阶谓词逻辑表示方法
  2.2  产生式表示方法
    2.2.1  产生式与产生式系统
    2.2.2  产生式系统的分类及其特点
  习题二
第3章  搜索方法
  3.1  问题求解过程的形式表示
    3.1.1  状态空间表示法
    3.1.2  与/或图表示法
  3.2  状态空间的搜索算法
    3.2.1  盲目搜索算法
    3.2.2  启发式搜索算法
    3.2.3  状态空间搜索算法的应用
    3.2.4  A*算法及其特性
  3.3  与/或图的搜索方法
    3.3.1  与/或图的盲目搜索算法
    3.3.2  与/或图的启发式搜索算法
    3.3.3  博弈算法及应用
  习题三
第4章  逻辑推理
  4.1  推理的基本概念
    4.1.1  推理方式及其分类
    4.1.2  推理的控制策略
    4.1.3  模式匹配及其变量代换
  4.2  归结演绎推理
    4.2.1  谓词公式化为子句集的方法
    4.2.2  归结原理
    4.2.3  归结反演
  4.3  基于归结反演的问题求解
  4.4  归结反演的改进策略
    4.4.1  删除策略
    4.4.2  限制策略
  习题四
第5章  专家系统
  5.1  专家系统概述
    5.1.1  专家系统研究的意义
    5.1.2  专家系统的结构与开发方法
  5.2  LISP语言
    5.2.1  LISP语言的特点与表达式
    5.2.2  LISP语言的基本函数
  5.3  知识库与推理机
    5.3.1  产生式规则与规则库的存储结构
    5.3.2  正向推理机
    5.3.3  反向推理机
  5.4  解释方法与解释器
  5.5  知识获取与检测
    5.5.1  知识获取的任务与方式
    5.5.2  知识的检测与求精
    5.5.3  知识检测的方法
  5.6  专家系统工具
    5.6.1  专家系统工具概述
    5.6.2  CLIPS及其应用
    5.6.3  基于Java的规则引擎Jess
  习题五
第6章  模糊推理
  6.1  知识的不确定性
  6.2  模糊集合的定义与运算
    6.2.1  模糊集合的定义与表示
    6.2.2  模糊集合的运算
  6.3  模糊知识表示与模糊匹配
     6.3.1  模糊知识表示
     6.3.2  模糊匹配
  6.4  简单模糊推理
    6.4.1  模糊推理的基本模式
    6.4.2  简单模糊推理方法
    6.4.3  模糊三段论推理方法
  6.5  一般模式的模糊推理
    6.5.1  多维模糊推理方法
    6.5.2  带有可信度的模糊推理方法
  习题六
第7章  机器学习
  7.1  机器学习的特征与方法
  7.2  归纳学习方法
    7.2.1  CLS算法
    7.2.2  ID3算法
    7.2.3  归纳学习生成产生式规则集的应用
  7.3  遗传算法
    7.3.1  遗传算法的概念与计算方法
    7.3.2  遗传算法在预测预报中的应用
  7.4  人工神经网络方法
    7.4.1  人工神经元与感知器
    7.4.2  人工神经网络模型
    7.4.3  BP神经网络的学习算法
    7.4.4  BP学习算法的改进
    7.4.5  基于神经网络的专家系统
    7.4.6  基于神经网络的模糊分类器
    7.4.7  神经网络在预测中的应用
  习题七
悟心之道
 楼主| 发表于 2011-1-21 07:23:59 | 显示全部楼层
本帖最后由 悟心之道 于 2011-1-21 07:26 编辑
Lgwu 发表于 2011-1-21 01:30
人工智能--不懂,但我懂的学习,补充自己。YY的结果只能让人笑话,让自己丢脸!


自已看清
【实现类似“自学习、自进化”的简单办法或程序】

没说是
只是类似
你觉得不可能?

不知道谁说“死读书、不如无书”
要是随便看几本书就能解决问题
这些问题早不是问题了!
天下读书人何其多啊

不过看你回这多份上还是谢谢乃
悟心之道
 楼主| 发表于 2011-1-21 07:34:13 | 显示全部楼层
本帖最后由 悟心之道 于 2011-1-21 07:34 编辑
李白vs苏轼 发表于 2011-1-20 23:45
我觉得最关键是一套优秀的算法

你说的这些只是一小部分而已


有理

不过
我说的
【实现类似“自学习、自进化”的简单办法或程序】

你认为不可行?
您需要登录后才可以回帖 登录 | 快速注册

本版积分规则

手机版|杀毒软件|软件论坛| 卡饭论坛

Copyright © KaFan  KaFan.cn All Rights Reserved.

Powered by Discuz! X3.4( 沪ICP备2020031077号-2 ) GMT+8, 2025-2-8 16:15 , Processed in 0.133915 second(s), 17 queries .

卡饭网所发布的一切软件、样本、工具、文章等仅限用于学习和研究,不得将上述内容用于商业或者其他非法用途,否则产生的一切后果自负,本站信息来自网络,版权争议问题与本站无关,您必须在下载后的24小时之内从您的电脑中彻底删除上述信息,如有问题请通过邮件与我们联系。

快速回复 客服 返回顶部 返回列表