NO.01
认证: 论文检测

掌柜:论文查重第一家

点击这里给我发消息

支付宝个人认证

2011-03-24

消费者保障协议

该店铺已签署消费者保障协议
已缴纳1000元保证金

店铺动态评分

描述相符5.0

服务态度5.0

物流服务5.0

与同行业相比

高于50.23%

持平30.45%

高于49.31%

开店时长10年老店

一种提高检测效率的V

生物免疫系统中,阴性选择机制对淋巴细胞进行筛选,清除攻击自体的淋巴细胞[1】。研究人员以阴性选择机制为基础,提出了各种类型的二进制形式的阴性选择算法[2’3],这些阴性选择算法在入侵检测、病毒防御等网络安全领域得到广泛的应用。G.Fabio[‘3指出以二进制的形式表示自体、非自体空间存在局限。对实值形式的问题,这种表示方法不足以反映问题的空间结构。Fabio[s]采用实值形式表示自体、非自体空间,以欧几里德距离描述检测器对周围数据点的覆盖。Jics3指出对于实值形式的阴性选择算法,限定所有检测器的检测半径相同,不利于它们灵活地覆盖非自体空间,提出了检测半径可变的实值阴性选择算法V—detector,与检测半径固定的实值阴性选择算法相比,其算法能够充分地覆盖非自体空间,为高效地检测异常、避免误报提供了保证。对于实值阴性选择算法,检测器集合中的检测器数量是一个重要指标。一方面,检测器数量的增加使需要的存储空间相应增加。 更为重要的,使用检测器集合进行检测时需要将待判定数据与检测器集合中的检测器进行匹配,时间复杂度为0(IDI),其中,IDl为检测器集合中检测器的数量。lDI值的增长将降低检测效率。为了减少检测器集合中的检测器数量,需要尽可能的使用大检测半径的检测器覆盖连续的、大范围的非自体空间。V—detector算法在检测器生成过程中随机确定检测器中心点的位置,并依据检测器中心点及与其最近的自体样本确定检测半径,这种方法难以产生覆盖范围较大的检测器。论文对V—detector算法进行了优化,通过更为合理的确定检测中心点的位置及检测半径从而提高检测器的质量。此外,假设检验的判定方法被用于确保检测器集合对非自体空间的充分覆盖,在生成检测器的过程中对检测器集合的覆盖范围进行判定,有助于减少检测器集合中的检测器数量。 1优化算法及分析 1.1 V—detector算法V—detector算法中,检测器以二元组表示:(检测中心点,检测半径),其中,检测中心点对应于非自体空间的某一点,检测半径确定了检测器的覆盖范围。所有与检测中心点的欧几里德距离小于检测半径的样本都在检测器的覆盖范围内,被认为属于非自体。V—detector允许检测器以不同的检测半径覆盖非自体空间,这种灵活性使检测器集合能够更全面地覆盖非自体空间。V—detector在生成检测器的过程中,以一个随机样本.27作为候选的检测中心点。在确定z为非自体的情况下,根据z与自体样本的最短距离d幽,生成以.17作为检测中心点、d幽一^为检测半径的检测器。其中,参数^为自体半径,反映了自体样本的覆盖范围,与自体样本的距离小于自体半径的样本点被认为是属于自体。由于检测中心点位置随机确定,并不能保证所生成检测器具有较大的覆盖范围。在检测器集合的生成过程,往往要求检测器集合中的所有检测器对非自体空间的总的覆盖范围超过某一阈值,优先采用大检测半径的检测器覆盖大范围的非自体空间,有利于生成检测器数量较少、同时满足覆盖范围要求的检测器集合。 1.2算法的优化设计 1.2.1扩展检测器的覆盖范围V—detector算法在检测器的产生过程中,随机选择一个非自体样本z作为检测器的检测中心点。在z被选定以后,检测半径也就相应确定,为-2:与自体样本集合中自体样本的最短距离。优化算法旨在以随机选择的非自体样本.27为基础,生成能够覆盖.27且具有较大覆盖范围的检测器。以图1为例来说明优化算法生成检测器的思路。在自体和非自体构成的表示空问中找到没有被检测器集合覆盖的一个非自体样本z,-qnel。,是与.27最近的自体样本,两者的距离为r。。按照V—detector算法,将以.27为检测中心点,生成半径为^~^的检测器。优化算法使用临时变量.27。,将标识z的向量赋予zl。根据zl和s。,1确定.272:zl是z2与s。。l的中点。如果.27:没有超过表示空间的范围并且是非自体,计算z。与其最近自体s一,:间的距离r2。如果,.:大于r,,且z位于以.27:为中心、检测半径为r。一rI的检测器的覆盖范围内,将标识z:的向量赋予z。,标识s—.:的向量赋予s。n,,.:的值赋予r,,递归寻找以生成具有尽可能大的检测半径且能覆盖z的检测器。要求检测器能够覆盖尚不在检测器集合覆盖范围的非自体样本z非常重要。理想的检测器集合应该能够充分地覆盖非自体空间。一个新的检测器如果能够扩充检测器集合的覆盖范围,则它的加入是有价值的。如果一个检测器只是重叠检测器集合已覆盖的部分区域,无论其本身的覆盖范围如何,对于检测器集合而言都没有价值。依照图1的示例,优化算法依据几何中点,以非自体样本z为基础寻找合适的检测中心点产生检测器。在表示空间确定的情况下,要根据给定的自体样本集找到能覆盖一个随机的非自体样本点z、且检测半径最大的检测器,该问题没有多项式时间的算法能解决口]。 出于效率的考虑,优化算法以几何中点为基础进行查找,生成在查找过程中所发现的检测半径最大且能覆盖z的检测器。相应算法的主要步骤如下:x—V—detector算法随机选择的检测中心点;s。n一与x最近的自体样本;r。一原始的检测半径,即x与s。,。之间的欧几里得距离,表示为||s~。一xf|;S一自体样本集合;r.一自体半径;k一特征空间的维数;flag+1;xl—x;r2一无穷大;while(flag==1){x2·一2×Xl—snHrl;if!(x2∈[o,1]。)break;foreverysi in s//找到与X2最近的自体样本,以s。r2表示;{//以r:记录I Is。r2一x2Jl—r-的值;d.-||si—x2||;if(d—r。≤rz){r2·d—r。;snear2+si;)if(r2≤r1)break;//新的检测半径没有超过原半径)if((r2≤r1)II(IIx2一x|I≥r2))flag一0;//x是否被候选的检测器覆盖else{rl十r2;smrl+sⅢf2;xl+x2};//以x,记录候选的检测中心点)这种优化思路一方面可以保证参照同样的非白体样本,优化算法所产生的检测器的覆盖范围超过或等于原算法。另一方面,新生成的检测器将使检测器集合的覆盖范围增加,而不是仅仅重叠检测器集合已覆盖的范围。 1.2.2评估检测器集合覆盖范围V—detector将检测器的生成和检测器集合的评估作为2个完全独立的部分。Ji认为,“在检测器的产生过程中检测器集合的覆盖范围动态变化。因此,只有在停止增加新的检测器时估算检测器集合的覆盖范围才合理。”依照V—detector中的评估方法,由于很难确定检测器集合何时能满足覆盖范围的要求并停止检测器的生成过程,因此,在大多数情况下V—detector产生的检测器集合中的检测器数量往往过多了。检测器集合对非自体空间的覆盖比例,可以采用假设检验的方法嘲评估。以一个待评估的检测器集合为基础,对非自体空间进行挖次取样,每次取样有2种可能结果:(1)事件A。样本点被检测器集合所覆盖,其概率为P;(2)事件B。样本点没有被检测器集合所覆盖,其概率为q=1一户。以X表示在押次取样过程中事件A发生的次数。随机变量X服从参数为咒、P的二项分布。根据中心极限定理,当印≥5且nq≥5,X近似地服从均值∥=np、均方差仃=俪的正态分布。因此,在对检测器集合的覆盖比例进行假设检验时,可以利用服从标准正态分布的’口统计量坠粤来确定拒绝域,其中,叉=x/n为样qnpq本均值,描述了实验中所观察到的检测器集合对非自体空间的覆盖比例。如果要求检测器集合对于非自体空间的覆盖比例不小于p幽,问题的原假设H。是:“已产生的检测器集合对非自体空间的覆盖比例小于P曲”。所对应的备择假设H,为:“产生的检测器集合对非自体空间的覆盖比例大于等于p响”。在显著性水平Ot下,拒y一。‘绝域为:一竺;兰≥z。。如果接受H。,则产生的检测~/npq器集合已经达到了覆盖范围的要求,否则,检测器集合必须进一步扩充。假设检验可以动态评估检测器集合的覆盖范围。首先,由于采样测试时扎需要满足:助≥5,且,z口≥5。 可以由此确定取样的数量咒,即以>max(5/P,5/(1一p))。此后进入采样和评估检测器集合覆盖范围的过程,如图2所示。参数c记录在挖次取样过程中,样本被检测器集合覆盖这一事件发生的次数。随机选取的非自体样本如果被现有的检测器集合覆盖,c的值将加1。反之,如果样本没有被现有的检测器集合覆盖,则以该非自体样本为基础生成新的检测器,扩充检测器集合的覆盖范围。在n、P嘶。和显著性水平口等参数都确定的情况下,如果确定条件—;兰==兰竺兰≥z。满足,则可√矽。i。(1一P。;。)以接受“检测器集合对非自体空间的覆盖比例达到P血。”的假设,停止检测的生成并输出检测器集合。反之,则需要继续产生新的非自体样本进行测试。优化算法将检测器的生成过程和检测器集合覆盖范围的评估过程结合在一起。一方面,充分利用了假设检验评估过程随机产生的非自体样本。另一方面,检测器生成后马上加入检测器集合,可以使检测器集合的覆盖范围渐进增长。通过评估的检测器集合,其实际覆盖范围必然大于或等于限定的覆盖范围,能够满足检测系统的需要。这种评估方法有利于避免检测器生成过程停止的不及时,造成检测器集合中的检测器数量过多。 2算法测试实验为了评价优化算法的各方面性能,采用了Ji在V—detector实验中使用的数据比较V—detector和优化算法。图3中样本空间为[o,1]2,图3(a)中的自体区域为梳子形状,3(b)中的自体区域为五角星形状,图中的点为用于训练的自体样本。检测率DR和误报率FA定义为:DR—TP/(TP+FN);FA=FP/(FP+TN);其中,TP代表事件“非自体样本被检测器集合判定为非自体”发生的次数,FN代表事件“非自体样本被检测器集合判定为自体”发生的次数,FP代表事件“自体样本被检测器集合判定为非自体”发生的次数,TN代表事件“自体样本被检测器集合判定为自体”发生的次数。表1中,v—detector和优化算法使用相同的参数设置产生检测器集合,显著性水平a选择为0.1。DR和FA是算法10次运行,检测器集合检测率的平均值和误报率的平均值,Count是检测器集合中检测器的平均数量。a1和口2是V—detector在P。-。=99%的条件下产生检测器集合,作用于梳子形状的自体空间和五角星形的自体空间得到的结果。b。和6:是优化算法在P。.m=99%的条件下产生检测器集合的测试结果,C。和c:是优化算法在P嘲=99.9%的条件下产生检测器集合的测试结果。通过a,、b。以及az,b。的对比可以看出,在户面。相同的情况下,优化算法产生的检测器集合的检测率与原算法相差不大,但是检测器集合中的检测器数量显著少于原算法。通过b,、c,及b:、f:的实验结果对比可以看出,一方面,提高覆盖范围的要求,优化算法产生的检测器集合具有更高的检测率。 这是由于在更高的覆盖范围的要求下,产生的检测器集合将更全面地覆盖非自体空间,非自体样本难以逃匿检测,检测率提高。另一方面,伴随着检测率的提高,误报率也会有所增加。这是因为作为训练数据的自体样本难以保证充分地覆盖自体空间,P面。的要求提高时,检测器集合可能覆盖部分的自体空间,使一些自体被误判为非自体,导致误报率的增加。通过a。、c。以及a:、c。的对比可以看出,与原算法相比,优化算法能够在检测器集合中检测器数量少的情况下,取得更高的检测率。这是由于优化算法在提高P面。要求的情况下产生检测器集合,检测率提高。同时,因为优化算法能够生成高质量的检测器,其检测器集合中的检测器数量仍可能少于原算法。从以上实验结果可以看出,优化算法在保证高检测率和低误报率的基础上,使检测器集合的检测器数量大幅度减少,有助于提高检测器集合的检测效率。这一优点使得优化算法适用于有实时性要求的各类异常检测。 3 结 语 本文提出的V—detector优化算法。优化算法依据随机产生的非自体样本,生成具有尽可能大覆盖范围且能覆盖指定非自体样本的检测器。同时,优化算法将检测器的生成与检测器集合的评估两个过程相结合,通过假设检验的判定方法对渐进增长的检测器集合进行覆盖范围的评估,避免了原算法无法有效确定何时停止生成检测器,造成检测器集合中的检测器数量偏多的问题。测试实验表明,在对非自体空间的覆盖范围要求相同的情况下,优化算法所生成的检测器集合中的检测器数量远少于原算法,而两者的检测率和误报率基本相同。优化算法生成的检测器集合更为高效,适用于有严格实时性要求的各类检测。

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

论文查重:

论文检测,论文查重第一家,是一家以检测抄袭与剽窃、伪造、篡改、不当署名、一稿多投等学术不端文献的论文检测平台,目前主要推荐的知名、权威检测产品包括中国知网的AMLC系统、VIP、TMLC2系统,万方数据库的万方相似比检测系统,维普文检测系统、gaperpass检测系统,等等常见检测软件

推荐软件知网期刊检测AMLC 知网本科检测 知网硕博检测 万方论文相似比检测 维普论文检测

检测须知:

1.此系统一旦提交,开始检测后,概不退款!2.在淘宝中购买宝贝后,可以在“我已购买宝贝”中看到有“订单编号”,知网系统检测需要输入订单编号才能使用。3.Word文档大小请不要超过15MB ,否则将无法上传;请把不必要的图片删除即可(系统不检测图片);4.上传检测的文档格式为Word的docx,doc格式,请勿上传其他格式的文档。

检测入口返回顶部
知网期刊检测
知网本科检测
知网硕博检测
万方论文检测
维普论文检测
paperpass
返回顶部

分享:

支付宝

微信