bp神经网络为什么要采用非线性函数来进行预测？_数字化

提问：bp神经网络为什么要采用非线性函数来进行预测？

回答：简单的讲，主要是复杂的bp神经网络的行为动态及神经元之间的相互作用是无法用简单的线性函数来描述的！

一般来讲，用数学函数模拟一个系统输入与输出的关系（系统函数）时，设其函数为f(x),则它可以表征为一个输入变量x的多项式，即

f(x)=∑anx^n ∣n=0 ->∞; 当n≥2时，f(x)就成为非线性函数了。

an是每个x高次项的系数。可以用具体的实际实验数据来确定。

newff()

这个函数是建立一个神经网络的函数，其中括号里面的参数含义依次是：输入数据和输出数据的范围，隐含层神经元个数，传递函数设置

像BP网编程这块，需要先给出输入和期望输出的数据矩阵，然后newff函数建立网络，然后train函数训练网络，在这个训练中你需要设置一些训练目标和训练次数等参数，然后还有一个sim仿真函数，就是把新的样本数据做为输入，通过这个我们训练好的网络判断这个样本所属分类。因为我用BP网主要做的是分类的实验，所以就从分类这块给你说明了。

学BP网络，我个人经验是需要把BP的正向输出和反向误差修改权值阈值这个学习过程，自己先手算明白，然后自己编程序实验，最后再用MATLAB的封装函数NEWFF这些，你会发现NEWFF和我们自己理解的训练过程还是有细微的差别的。

一般不需要，基于BP神经网络的变压器故障诊断毕设可以在家里完成。但是要注意，在实现这一毕设时，应当做好大量的调研和准备工作，充分理解变压器及其故障机理，并了解BP神经网络的原理和训练方法。了解基本原理和方法后，可以在家里使用计算机来模拟变压器的各种故障状态，并使用BP神经网络的训练方法对变压器故障进行诊断。

神经网络的是我的毕业论文的一部分

4．人工神经网络

人的思维有逻辑性和直观性两种不同的基本方式。逻辑性的思维是指根据逻辑规则进行推理的过程；它先将信息化成概念，并用符号表示，然后，根据符号运算按串行模式进行逻辑推理。这一过程可以写成串行的指令，让计算机执行。然而，直观性的思维是将分布式存储的信息综合起来，结果是忽然间产生想法或解决问题的办法。这种思维方式的根本之点在于以下两点:1信息是通过神经元上的兴奋模式分布在网络上;2信息处理是通过神经元之间同时相互作用的动态过程来完成的。

人工神经网络就是模拟人思维的第二种方式。这是一个非线性动力学系统，其特色在于信息的分布式存储和并行协同处理。虽然单个神经元的结构极其简单，功能有限，但大量神经元构成的网络系统所能实现的行为却是极其丰富多彩的。

41人工神经网络学习的原理

人工神经网络首先要以一定的学习准则进行学习，然后才能工作。现以人工神经网络对手写“A”、“B”两个字母的识别为例进行说明，规定当“A”输入网络时，应该输出“1”，而当输入为“B”时，输出为“0”。

所以网络学习的准则应该是：如果网络做出错误的判决，则通过网络的学习，应使得网络减少下次犯同样错误的可能性。首先，给网络的各连接权值赋予(0，1)区间内的随机值，将“A”所对应的图像模式输入给网络，网络将输入模式加权求和、与门限比较、再进行非线性运算，得到网络的输出。在此情况下，网络输出为“1”和“0”的概率各为50%，也就是说是完全随机的。这时如果输出为“1”(结果正确)，则使连接权值增大，以便使网络再次遇到“A”模式输入时，仍然能做出正确的判断。

如果输出为“0”(即结果错误)，则把网络连接权值朝着减小综合输入加权值的方向调整，其目的在于使网络下次再遇到“A”模式输入时，减小犯同样错误的可能性。如此 *** 作调整，当给网络轮番输入若干个手写字母“A”、“B”后，经过网络按以上学习方法进行若干次学习后，网络判断的正确率将大大提高。这说明网络对这两个模式的学习已经获得了成功，它已将这两个模式分布地记忆在网络的各个连接权值上。当网络再次遇到其中任何一个模式时，能够做出迅速、准确的判断和识别。一般说来，网络中所含的神经元个数越多，则它能记忆、识别的模式也就越多。

42人工神经网络的优缺点

人工神经网络由于模拟了大脑神经元的组织方式而具有了人脑功能的一些基本特征，为人工智能的研究开辟了新的途径，神经网络具有的优点在于:

（1）并行分布性处理

因为人工神经网络中的神经元排列并不是杂乱无章的，往往是分层或以一种有规律的序列排列，信号可以同时到达一批神经元的输入端，这种结构非常适合并行计算。同时如果将每一个神经元看作是一个小的处理单元，则整个系统可以是一个分布式计算系统，这样就避免了以往的“匹配冲突”，“组合爆炸”和“无穷递归”等题，推理速度快。

（2）可学习性

一个相对很小的人工神经网络可存储大量的专家知识，并且能根据学习算法，或者利用样本指导系统来模拟现实环境(称为有教师学习)，或者对输入进行自适应学习(称为无教师学习)，不断地自动学习，完善知识的存储。

（3）鲁棒性和容错性

由于采用大量的神经元及其相互连接，具有联想记忆与联想映射能力，可以增强专家系统的容错能力，人工神经网络中少量的神经元发生失效或错误，不会对系统整体功能带来严重的影响。而且克服了传统专家系统中存在的“知识窄台阶”问题。

（4）泛化能力

人工神经网络是一类大规模的非线形系统，这就提供了系统自组织和协同的潜力。它能充分逼近复杂的非线形关系。当输入发生较小变化，其输出能够与原输入产生的输出保持相当小的差距。

（5）具有统一的内部知识表示形式，任何知识规则都可以通过对范例的学习存储于同一个神经网络的各连接权值中，便于知识库的组织管理，通用性强。

虽然人工神经网络有很多优点，但基于其固有的内在机理，人工神经网络也不可避免的存在自己的弱点:

（1）最严重的问题是没能力来解释自己的推理过程和推理依据。

（2）神经网络不能向用户提出必要的询问，而且当数据不充分的时候，神经网络就无法进行工作。

（3）神经网络把一切问题的特征都变为数字，把一切推理都变为数值计算，其结果势必是丢失信息。

（4）神经网络的理论和学习算法还有待于进一步完善和提高。

43神经网络的发展趋势及在柴油机故障诊断中的可行性

神经网络为现代复杂大系统的状态监测和故障诊断提供了全新的理论方法和技术实现手段。神经网络专家系统是一类新的知识表达体系，与传统专家系统的高层逻辑模型不同，它是一种低层数值模型，信息处理是通过大量的简单处理元件(结点) 之间的相互作用而进行的。由于它的分布式信息保持方式，为专家系统知识的获取与表达以及推理提供了全新的方式。它将逻辑推理与数值运算相结合，利用神经网络的学习功能、联想记忆功能、分布式并行信息处理功能，解决诊断系统中的不确定性知识表示、获取和并行推理等问题。通过对经验样本的学习，将专家知识以权值和阈值的形式存储在网络中，并且利用网络的信息保持性来完成不精确诊断推理，较好地模拟了专家凭经验、直觉而不是复杂的计算的推理过程。

但是，该技术是一个多学科知识交叉应用的领域，是一个不十分成熟的学科。一方面，装备的故障相当复杂;另一方面，人工神经网络本身尚有诸多不足之处:

（1）受限于脑科学的已有研究成果。由于生理实验的困难性，目前对于人脑思维与记忆机制的认识还很肤浅。

（2）尚未建立起完整成熟的理论体系。目前已提出了众多的人工神经网络模型，归纳起来，这些模型一般都是一个由结点及其互连构成的有向拓扑网，结点间互连强度所构成的矩阵，可通过某种学习策略建立起来。但仅这一共性，不足以构成一个完整的体系。这些学习策略大多是各行其是而无法统一于一个完整的框架之中。

（3）带有浓厚的策略色彩。这是在没有统一的基础理论支持下，为解决某些应用，而诱发出的自然结果。

（4）与传统计算技术的接口不成熟。人工神经网络技术决不能全面替代传统计算技术，而只能在某些方面与之互补，从而需要进一步解决与传统计算技术的接口问题，才能获得自身的发展。

虽然人工神经网络目前存在诸多不足，但是神经网络和传统专家系统相结合的智能故障诊断技术仍将是以后研究与应用的热点。它最大限度地发挥两者的优势。神经网络擅长数值计算，适合进行浅层次的经验推理;专家系统的特点是符号推理，适合进行深层次的逻辑推理。智能系统以并行工作方式运行，既扩大了状态监测和故障诊断的范围，又可满足状态监测和故障诊断的实时性要求。既强调符号推理，又注重数值计算，因此能适应当前故障诊断系统的基本特征和发展趋势。随着人工神经网络的不断发展与完善，它将在智能故障诊断中得到广泛的应用。

根据神经网络上述的各类优缺点，目前有将神经网络与传统的专家系统结合起来的研究倾向，建造所谓的神经网络专家系统。理论分析与使用实践表明，神经网络专家系统较好地结合了两者的优点而得到更广泛的研究和应用。

离心式制冷压缩机的构造和工作原理与离心式鼓风机极为相似。但它的工作原理与活塞式压缩机有根本的区别，它不是利用汽缸容积减小的方式来提高汽体的压力，而是依靠动能的变化来提高汽体压力。离心式压缩机具有带叶片的工作轮，当工作轮转动时，叶片就带动汽体运动或者使汽体得到动能，然后使部分动能转化为压力能从而提高汽体的压力。这种压缩机由于它工作时不断地将制冷剂蒸汽吸入，又不断地沿半径方向被甩出去，所以称这种型式的压缩机为离心式压缩机。其中根据压缩机中安装的工作轮数量的多少，分为单级式和多级式。如果只有一个工作轮，就称为单级离心式压缩机，如果是由几个工作轮串联而组成，就称为多级离心式压缩机。在空调中，由于压力增高较少，所以一般都是采用单级，其它方面所用的离心式制冷压缩机大都是多级的。单级离心式制冷压缩机的构造主要由工作轮、扩压器和蜗壳等所组成。压缩机工作时制冷剂蒸汽由吸汽口轴向进入吸汽室，并在吸汽室的导流作用引导由蒸发器(或中间冷却器)来的制冷剂蒸汽均匀地进入高速旋转的工作轮3(工作轮也称叶轮，它是离心式制冷压缩机的重要部件，因为只有通过工作轮才能将能量传给汽体)。汽体在叶片作用下，一边跟着工作轮作高速旋转，一边由于受离心力的作用，在叶片槽道中作扩压流动，从而使汽体的压力和速度都得到提高。由工作轮出来的汽体再进入截面积逐渐扩大的扩压器4(因为汽体从工作轮流出时具有较高的流速，扩压器便把动能部分地转化为压力能，从而提高汽体的压力)。汽体流过扩压器时速度减小，而压力则进一步提高。经扩压器后汽体汇集到蜗壳中，再经排气口引导至中间冷却器或冷凝器中。

二、离心式制冷压缩机的特点与特性

离心式制冷压缩机与活塞式制冷压缩机相比较，具有下列优点：

(1)单机制冷量大，在制冷量相同时它的体积小，占地面积少，重量较活塞式轻5～8倍。

(2)由于它没有汽阀活塞环等易损部件，又没有曲柄连杆机构，因而工作可靠、运转平稳、噪音小、 *** 作简单、维护费用低。

(3)工作轮和机壳之间没有摩擦，无需润滑。故制冷剂蒸汽与润滑油不接触，从而提高了蒸发器和冷凝器的传热性能。

(4)能经济方便的调节制冷量且调节的范围较大。

(5)对制冷剂的适应性差，一台结构一定的离心式制冷压缩机只能适应一种制冷剂。

(6)由于适宜采用分子量比较大的制冷剂，故只适用于大制冷量，一般都在25～30万大卡／时以上。如制冷量太少，则要求流量小，流道窄，从而使流动阻力大，效率低。但近年来经过不断改进，用于空调的离心式制冷压缩机，单机制冷量可以小到10万大卡／时左右。

制冷与冷凝温度、蒸发温度的关系。

由物理学可知，回转体的动量矩的变化等于外力矩，则

T=m(C2UR2-C1UR1)

两边都乘以角速度ω，得

Tω=m(C2UωR2-C1UωR1)

也就是说主轴上的外加功率N为：

N=m(U2C2U-U1C1U)

上式两边同除以m则得叶轮给予单位质量制冷剂蒸汽的功即叶轮的理论能量头。 U2 C2

ω2 C2U R1 R2 ω1 C1 U1 C2r β 离心式制冷压缩机的特性是指理论能量头与流量之间变化关系，也可以表示成制冷

W=U2C2U-U1C1U≈U2C2U

（因为进口C1U≈0）

又C2U=U2-C2rctgβ C2r=Vυ1/(A2υ2)

故有

W= U22(1-

Vυ1

ctgβ)

A2υ2U2

式中：V—叶轮吸入蒸汽的容积流量（m3/s）

υ1υ2 ——分别为叶轮入口和出口处的蒸汽比容（m3/kg）

A2、U2—叶轮外缘出口面积(m2)与圆周速度(m/s)

β—叶片安装角

由上式可见，理论能量头W与压缩机结构、转速、冷凝温度、蒸发温度及叶轮吸入蒸汽容积流量有关。对于结构一定、转速一定的压缩机来说，U2、A2、β皆为常量，则理论能量头W仅与流量V、蒸发温度、冷凝温度有关。

按照离心式制冷压缩机的特性，宜采用分子量比较大的制冷剂，目前离心式制冷机所用的制冷剂有F—11、F—12、F—22、F—113和F—114等。我国目前在空调用离心式压缩机中应用得最广泛的是F—11和F—12，且通常是在蒸发温度不太低和大制冷量的情况下，选用离心式制冷压缩机。此外，在石油化学工业中离心式的制冷压缩机则采用丙烯、乙烯作为制冷剂，只有制冷量特别大的离心式压缩机才用氨作为制冷剂。

三、离心式制冷压缩机的调节

离心式制冷压缩机和其它制冷设备共同构成一个能量供给与消耗的统一系统。制冷机组在运行时，只有当通过压缩机的制冷剂的流量与通过设备的流量相等时，以及压缩机所产生的能量头与制冷设备的阻力相适应时，制冷系统的工况才能保持稳定。但是制冷机的负荷总是随外界条件与用户对冷量的使用情况而变化的，因此为了适应用户对冷负荷变化的需要和安全经济运行，就需要根据外界的变化对制冷机组进行调节，离心式制冷机组制冷量的调节有：1°改变压缩机的转速；2°采用可转动的进口导叶；3°改变冷凝器的进水量；4°进汽节流等几种方式，其中最常用的是转动进口导叶调节和进汽节流两种调节方法。所谓转动进口导叶调节，就是转动压缩机进口处的导流叶片以使进入到叶轮去的汽体产生旋绕，从而使工作轮加给汽体的动能发生变化来调节制冷量。所谓进汽节流调节，就是在压缩机前的进汽管道上安装一个调节阀，如要改变压缩机的工况时，就调节阀门的大小，通过节流使压缩机进口的压力降低，从而实现调节制冷量。离心式压缩机制冷量的调节最经济有效的方法就是改变进口导叶角度，以改变蒸汽进入叶轮的速度方向(C1U)和流量V。但流量V必须控制在稳定工作范围内，以免效率下降。

人工神经网络早期的研究工作应追溯至上世纪40年代。下面以时间顺序，以著名的人物或某一方面突出的研究成果为线索，简要介绍人工神经网络的发展历史。

1943年，心理学家W·Mcculloch和数理逻辑学家W·Pitts在分析、总结神经元基本特性的基础上首先提出神经元的数学模型。此模型沿用至今，并且直接影响着这一领域研究的进展。因而，他们两人可称为人工神经网络研究的先驱。

1945年冯·诺依曼领导的设计小组试制成功存储程序式电子计算机，标志着电子计算机时代的开始。1948年，他在研究工作中比较了人脑结构与存储程序式计算机的根本区别，提出了以简单神经元构成的再生自动机网络结构。但是，由于指令存储式计算机技术的发展非常迅速，迫使他放弃了神经网络研究的新途径，继续投身于指令存储式计算机技术的研究，并在此领域作出了巨大贡献。虽然，冯·诺依曼的名字是与普通计算机联系在一起的，但他也是人工神经网络研究的先驱之一。

50年代末，F·Rosenblatt设计制作了“感知机”，它是一种多层的神经网络。这项工作首次把人工神经网络的研究从理论探讨付诸工程实践。当时，世界上许多实验室仿效制作感知机，分别应用于文字识别、声音识别、声纳信号识别以及学习记忆问题的研究。然而，这次人工神经网络的研究高潮未能持续很久，许多人陆续放弃了这方面的研究工作，这是因为当时数字计算机的发展处于全盛时期，许多人误以为数字计算机可以解决人工智能、模式识别、专家系统等方面的一切问题，使感知机的工作得不到重视；其次，当时的电子技术工艺水平比较落后，主要的元件是电子管或晶体管，利用它们制作的神经网络体积庞大，价格昂贵，要制作在规模上与真实的神经网络相似是完全不可能的；另外，在1968年一本名为《感知机》的著作中指出线性感知机功能是有限的，它不能解决如异或这样的基本问题，而且多层网络还不能找到有效的计算方法，这些论点促使大批研究人员对于人工神经网络的前景失去信心。60年代末期，人工神经网络的研究进入了低潮。

另外，在60年代初期，Widrow提出了自适应线性元件网络，这是一种连续取值的线性加权求和阈值网络。后来，在此基础上发展了非线性多层自适应网络。当时，这些工作虽未标出神经网络的名称，而实际上就是一种人工神经网络模型。

随着人们对感知机兴趣的衰退，神经网络的研究沉寂了相当长的时间。80年代初期，模拟与数字混合的超大规模集成电路制作技术提高到新的水平，完全付诸实用化，此外，数字计算机的发展在若干应用领域遇到困难。这一背景预示，向人工神经网络寻求出路的时机已经成熟。美国的物理学家Hopfield于1982年和1984年在美国科学院院刊上发表了两篇关于人工神经网络研究的论文，引起了巨大的反响。人们重新认识到神经网络的威力以及付诸应用的现实性。随即，一大批学者和研究人员围绕着 Hopfield提出的方法展开了进一步的工作，形成了80年代中期以来人工神经网络的研究热潮。

　　摘要：采用HyperChem70结构分析软件，对蜂毒溶血肽类似物的分子体积等结构参数进行了计算分析，分别利用多元线性回归、BP－神经网络计算法进行统计分析，获得两个相关性好的QSAR(quantitative structure-function relationship)模型，结果显示，蜂毒肽溶血活性与生成热、键合能、表面积、分子体积、极化能、醇水分配系数、水合能相关，为降低溶血作用，指出在设计蜂毒肽结构时应尽量避免螺旋状结构，少用疏水性氨基酸。

关键词：蜂毒溶血肽；构效关系；线性回归；BP－神经网络

中图分类号：Q786

文献标识码：A

文章编号：1007-7847(2007)02-0038-06

蜂毒溶血肽又称蜂毒素(melittin)，是欧洲蜜蜂(Apis mellifera)蜂毒的主要成分之一，它对20多种革兰氏阴性和阳性细菌有极强的抑杀作用，相对于医药上使用的传统抗生素来说，由于其特殊的作用机理而不易使细菌产生耐药性，然而，生物体存在的天然多肽其结构与功能之间的关系并非最适合，一般认为，蜂毒肽的溶血机理是其在红细胞质膜上穿孔而形成离子孔道，造成膜结构破坏，引起胞内物质大量渗出，导致溶血，本文以蜂毒肽类似物为目标分子，运用半经验计算法对其溶血活性的定量构效关系分析计算，再利用统计方法进行分子建模，找出影响活性的因素，为进一步预测和设计低溶血活性的蜂毒肽分子，避免表达或合成高副作用的蜂毒肽产物提供量化的理论依据。

1 方法

采用各种理论计算方法和分子图形模拟技术，以计算机为工具，根据累积的大量有关功能分子结构和活性的资料，设计具备某种目标功能的新分子，由于任何分子的生物活性都与它的化学结构密切相关，对目标分子进行结构修饰或改造，有可能使其功能增强、减弱、失活或发生其他改变，定量构效关系(quantitative structure-activity relationship，QSAR)采用数学模型描述分子的生物学活性与结构之间的定量依赖关系，架设分子的化学结构与生物学功能之间的桥梁，在应用上，QSAR能从一系列已知活性的化合物中找出其结构与活性之间的定量关系，进而预测新化合物活性，并指导新功能分子设计，借助多元统计分析方法能够将分子结构描述子和性质联系起来，同时近年来也发展了一些非统计学的方法，如人工神经网络，遗传算法等，本文采用逐步回归与BP神经网络方法分别对蜂毒肽类似物溶血活性进行建模。

选择分别删除了不同单一氨基酸的24个蜂毒肽类似物进行计算，溶血活性参考文献[3]，运用Hy-perChem70软件进行分子的量子化学与分子力学计算，用DNAstar分析多肽等电点，共计算了19个参数，采用DPS70统计软件，用上述两种统计方法建模，未特殊指明的参数均为系统默认值。

11 多元线性回归

采用多元线性回归(multiple linear regres－sion，MLR)，分析多个自变量与因变量之间的线性关系，设自变量为x1，x2，…，XM，因变量为Y，将一个m元线性回归的数学模型表示为：

Y=bo+b1X1+b2X2+…+bmXm

式中bo为常数项，自变量xj前的系数bj，称因变量Y，对自变量xj的偏回归系数，复相关系数尺为：

R=(SSR／SST)1/2

式中SSR为回归平方和，SST为总的偏差平方和。

12 BP人工神经网络

利用人工神经网络(artificial neural network，ANN)模拟人脑功能的信息处理系统，借鉴人脑神经系统处理信息的过程，并以数学网络连接的拓扑结构作为理论基础，BP(back-propagation)算法由正向传播和反向传播两个过程组成，正向传播的输入信息由输入层经隐含层传向输出层，如果在输出层不能得到期望的输出，则转入反向传播，将误差信息沿原来的连接通路返回，修改各层节点问的连接权重值，如此往复调整网络参数，使之误差函数达到极小为止，在处理实际问题时，利用一组已知的样本构成训练集(输入一输出模式)令其处理，根据一定处理规则调整连接权重，处理结束时，得到1组固定的连接权重值，并将其表达在网络的权重中，利用这组权重，根据未知样本的输入特性参数，可迅速输出预测结果。

2 计算与回归分析

21 参数计算

蜂毒溶血肽分子在HyperChem70中构建，采用MM+分子力场进行几何优化，用AM1力场进行半经验计算，自洽场(SCF)收敛条件为50个迭代，能量差小于001，采用Fletcher-Reeves共轭梯度法收敛，RMSf)、分子键合能(Ebinding)、分子核能(Enuclear)、分子静电能(Ee)、分子最高占据轨道能(EHOMO)、偶极距(Dipole)、分子最低空轨道能(ELUMO)、溶剂可及面积(Surface Area(Grid))，分子体积(Molectilar Volume)、分子范德华面积[Surface Area(Approa)]、水合能(Hydration Energy)、LogP、极化能(Polarizobility)、折光率(Refractivity)，分子质量(Mass)，EHOMO-ELUMO。

从24个蜂毒肽类似物中抽出17个作为训练集，另外7个作为预测集，以上述17个参数为自变量，HD50的对数Log(C)为因变量，采用DPS75统计软件对所取参数与分子活性的数据进行逐步(stepwise regression)多元线性回归和BP神经网络分析，得到了蜂毒肽类似物的定量构效关系方程，将经上述过程优化过的蜂毒肽及天然蜂毒肽分子用HyperChem70所模拟的分子结构如图1、2所示，优化前蜂毒肽分子近似一种结构紧密的螺旋，分子处于较高能量状态，优化后分子结构相对松驰，分子处于较低能量状态。

22 逐步多元线性回归

从所获得蜂毒肽结构类似物中随机抽出17 本文为全文原貌未安装PDF浏览器用户请先下载安装原版全文个样本，应用DPS75统计软件以溶血活性的对数值标准化后为因变量，17个QSAR参数为自变量进行逐步多元线性回归，选出9个有显著线性关系的变量，得到回归方程，9个结构描述变量与溶血活性数据logHDso见表1。

相关系数R=0888 665，决定系数RR=0799 069，

Y=-1383171+1079E-04X1-5714E-07X2-1072E-04X3+2268-04X4+4048E-04X5-1299E-03X6-7916E-03X7-6144E-01X8-2179E-01X9

其中y表示最小溶血浓度并取其负对数，X1X2，…，9分别表示Total Enerage，Ebinding，Ef，Surface area，Molecular Voltime，Hydration Energy，LooP，Polarizability。

23 BP-神经网络分析

根据DSP75统计软件中的BP神经网络所提供的变换参数建模，建立含一个隐含层的神经网络，输入层为蜂毒肽类似物的9个结构参数，输出层为实验所得HD50的对数值，并将输入和输出归一化到(-11)之间，挑选17个样本为训练集，建立QSAR模型，神经网络的训练终止情况、学习速率、隐含层数和节点数等的选择对网络的学习和预测都有较大影响，作者采用试算法，经多次训练调整，确定蜂毒肽类似物的QSAR模型为含一个隐含层，节点数为9，训练次数1000，目标误差001，学习速率01，学习增长率105，激活函数为Logistic函数的一个1710-1的3层网络拓扑结构。

24模拟统计结果

在24种蜂毒肽类似物中随机挑选17种。利用逐步回归与神经网络建立了QSAR模型，拟合结果见表2以剩余7种类似物为验证集，将变量输入QSAR模型中进行验证，预测结果见表3

3 讨论

由表2、3可见，用逐步线性回归与神经网络建立的QSAR模型得到蜂毒肽类似物溶血参数值HD50，其拟合值及验证值均较理想，图3，图4分别是用两种方法建模所得预测值和观测值的过原点回归曲线，其斜率均接近于1，用未参与建模的6个蜂毒肽类似物进行双侧显著性相关检验，发现4种方法均能在一定程度上使观测值与预测值在001水平上高度相关，表明所建模型正确。

比较表2、3中所列相对误差及图3、4的回归曲线可见，用BP-ANN建立的QSAR非线性模型优于多元线性回归线性模型，说明蜂毒肽类似物由于其相对分子质量大，不同于小分子化合物，且其作用机理也与小分子药物不同，从而使其分子结构与活性之间呈现出某种非线性关系，但BP-ANN近似黑箱 *** 作形式，通过已有数据进行训练，并把记忆的信息存储到连接神经元之间的连接权值上，即将蜂毒肽的溶血活性数据与结构物理参数之间关系的信息存储在神经元连接的权值和阈值上，而建模者却无法从权值和阈值中读取与蜂毒肽活性有关的相关信息，也无法分析哪些因子如何影响多肽活性，所以神经网络也有其不足之处，相对而言，多元线性回归属于开放型统计方法，它可以得出蜂毒肽的各种结构参数的回归系数，使我们知道哪些结构参数对其溶血活性起促进或抑制作用。

由线性回归得到的QSAR方程显示，蜂毒肽类似物表面积及体积对其溶血活性有重要影响，而表面积与活性呈负相关，与体积呈正相关，表明当分子的体积大而面积小时活性高，因此，只有在分子结构为中空管状结构时，才能满足这一要求，本文的计算结果表明，其活性状态的结构应主要为α－螺旋，通过对蜂毒肽的24个氨基酸进行逐个删除，测定观察其抗菌及溶血活性变化发现：除Pro－14外，删除组成两个α－螺旋的任一氨基酸(1－9，13－20)都明显地降低溶血活性，而删除组成“铰链”及C－端氨基酸对溶血活性影响不大，此外，N－端α－螺旋长度较短时，蜂毒肽的溶血活性也会降低，所以，兼性螺旋对溶血活性是必要的，而对抗菌作用并非如此，对蜂毒肽的非对映异构体、顺式和反式对映体的研究证实，非对映异构体蜂毒肽螺旋性很低，不具溶血性，但有抗菌作用，这些前人研究结果都与本模型得到的结论相符。

本文所建QSAR模型显示，醇水分配系数与溶血活性呈正相关，有研究表明，醇能诱导α－螺旋的形成，因为醇能够降低溶剂极性，在低极性环境中，醇的疏水基团与蜂毒肽上的疏水基团相互作用，屏蔽了蜂毒肽与水分子接触，使其与水形成分子间氢键的几率下降，增加了蜂毒肽分子内形成氢键的几率，醇分子在水溶液中一般倾向于形成微团结构，以减少与水的接触面，这种微团结构有可能增加醇分子疏水部位与蜂毒肽的接触面，在醇溶液中的蜂毒肽倾向于形成四聚体，对一些特殊的卤代醇(如HFIP)该作用尤为明显，提高醇水分配系数有利于增加蜂毒肽类似物的活性，从另一方面也说明蜂毒肽在细胞膜上易形成α－螺旋，并以四聚体形式存在，使膜穿孔导致溶血，删去任一疏水性氨基酸对溶血活性都有很大影响，当删去69、1520及13位氨基酸后，使溶血活性下降75％－90％，但删除亲水氨基酸Lys-21和23，则还保留94％和99％的溶血活性，模型还显示，蜂毒肽类似物的分子极性在溶血过程中起重要作用，分子的极化能与活性呈一定的负相关，即分子极性增强时有利于溶血活性下降，因此蜂毒肽C－端的正电荷区有利于与膜结合。

在模型中发现，另外两个能量参数，即分子总能量与水合能也涉及到分子体系的稳定性，能量越高的分子越不稳定，其活性相应下降，在QSAR模型中溶血活性与总体能量成负相关很好地说明了这一问题，分子水合能即水合焓，是物质溶于水后释放的能量，其值越大，溶解度就越大，模型显示它与溶血活性呈正相关，表明蜂毒肽的溶解度增大时，其水溶液中的浓度上升，形成四聚体机会越多，圆二色谱研究已证实，蜂毒肽的单体没有二级结构，4个单体聚集形成四聚体，每个单体疏水面向里，围成一个中心疏水区域，亲水面向外，单体之间相互接触的部位几乎全部是疏水区域，我们推测，当蜂毒溶血肽四聚体在细胞膜上的疏水作用力和各氨基酸基团间的相互吸引与电荷排斥力达到平衡时，其分子构象是有利于溶解破坏膜结构的形式。

综上所述，本文建立的蜂毒肽QSAR模型能够用于预测蜂毒肽类似物的溶血活性，为降低该分子溶血活性，可从以下几方面进行分子设计，1)结构上应避开中空的管状螺旋结构；2)性质上应尽量少用疏水性氨基酸；3)由于分子极性对溶血活性影响很小，但对抑菌活性又必不可少，故可适当增加带正电荷氨基酸比例，利用蜂毒肽类似物生物活性所建立的QSAR模型，可以大大减少筛选高抑菌低溶血蜂毒肽的繁琐程度，降低研究成本，不失为一种寻找和筛选优良活性肽的有效方法。

注：本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文。本文为全文原貌未安装PDF浏览器用户请先下载安装原版全文

欢迎分享，转载请注明来源：内存溢出

原文地址: https://www.outofmemory.cn/zaji/12179031.html

bp神经网络为什么要采用非线性函数来进行预测？

发表评论

评论列表（0条）