時間:2022-12-14 13:20:18
序論:在您撰寫神經網絡論文時,參考他人的優秀作品可以開闊視野,小編為您整理的7篇范文,希望這些建議能夠激發您的創作熱情,引導您走向新的創作高度。
EL檢測原理與檢測系統在文獻[1]中有詳細的描述。本文采用該文獻中的方法對太陽能電池片的EL圖像進行采集。圖1(a)、(b)、(c)分別表示由CCD采集的一塊大小為125bits×125bits的虛焊缺陷圖像、微裂缺陷圖像和斷指缺陷圖像。圖1(d)是無缺陷太陽能電池組圖像,它包含36(6×6)塊大小為125bits×125bits的太陽能電池片圖像。本文提出融合主成分分析(PCA)改進反向傳播神經網絡(BPNN)方法和徑向基神經網絡(RBFNN)方法對太陽能電池缺陷電致發光圖像進行處理,主要包括圖像采集、PCA特征提取降維、神經網絡分類訓練、預測輸出等部分,如圖2所示。
1.1PCA處理輸入數據當BPNN和RBFNN的輸入是太陽能電池板缺陷圖像集時,圖像是以向量的形式表示。向量維數太大將不利于網絡的計算。我們采用主成分分量分析(PCA)算法[15]來提取該向量的主要特征分量,既不損失重要信息又能減少網絡的計算量。PCA是基于協方差矩陣將樣本數據投影到一個新的空間中,那么表示該樣本數據就只需要該樣本數據最大的一個線性無關組的特征值對應的空間坐標即可。將特征值從大到小排列,取較大特征值對應的分量就稱為主成分分量。通過這種由高維數據空間向低維數據空間投影的方法,可以將原始的高維數據壓縮到低維。假設數據矩陣Xn×p由樣本圖像組成,n是樣本數,p是樣本圖像的大小。若Xn×p的每一行代表一幅樣本圖像,則Xn×p的PCA降維矩陣求解步驟如下。
1.2創建BPNN模型和RBFNN模型太陽能電池缺陷種類很多,不同缺陷類型圖像具有不同特征。對太陽能電池缺陷圖像求其主成分分量作為BPNN的輸入,缺陷的分類作為輸出,輸入層有k個神經元(降維后主成分分量個數),輸出層有1個神經元(缺陷的分類向量)。隱層的節點數可以憑經驗多次實驗確定,也可以設計一個隱含層數目可變的BPNN。通過誤差對比,選擇在給定對比次數內誤差最小所對應的隱含層神經元數目,從而確定BPNN的結構。一般來說,3層BPNN就能以任意的精度逼近任意的連續函數[16]。本論文選擇3層BPNN,結構為k-m-1,m為隱含層節點數。為了使網絡訓練時不發生“過擬合”現象,設計合理BPNN模型的過程是一個不斷調整參數對比結果的過程。確定BPNN結構后,就可以對該網絡進行訓練。訓練函數采用Levenberg-Marquardt函數,隱含層神經元傳遞函數為S型正切函數tansig,輸出層神經元函數為純線性函數purelin。調用格式:net=newff(Y,T,[m,1],{‘tansig’,‘purelin’},‘train-lm’);Y為神經網絡的輸入矩陣向量(PCA降維后的矩陣向量),T為神經網絡的輸出矩陣向量。Matlab自帶4種主要的函數來設計RBFNN:newrbe,newrb,newgrnn,newpnn。本文用相同的訓練樣本集和測試樣本集創建和測試了這4種網絡,其中,用newgrnn創建的網絡識別率最高,因此選用廣義回歸神經網絡newgrnn來創建RBFNN:(1)隱含層徑向基神經元層數目等于輸入樣本數,其權值等于輸入矩陣向量的轉置。(2)輸出層線性神經元層,以隱含層神經元的輸出作為該層的輸入,權值為輸出矩陣向量T,無閾值向量。調用格式:net=newgrnn(Y,T,Spread);Y為神經網絡的輸入矩陣向量(PCA降維后的矩陣向量),T為神經網絡的輸出矩陣向量,Spread為徑向基函數的擴展速度。
1.3太陽能電池缺陷的檢測算法(1)數據映射。取每種類型缺陷圖像的60%和40%分別作為BPNN和RBFNN的訓練樣本集和測試樣本集。將樣本集中每張圖片變成矩陣中的一列,形成一個矩陣,采用2.1節中的方法對該矩陣進行PCA降維后的矩陣作為BPNN和RBFNN的輸入。將虛焊、微裂、斷指和無缺陷4種不同類型圖像分別標記為1,2,3,4,作為網絡期望輸出T。(2)數據歸一化。將輸入輸出矩陣向量歸一化為[-1,1],利于神經網絡的計算。(3)分別調用2.2節中創建的BPNN和RBFNN,設置網絡參數,利用訓練樣本集先對網絡訓練,然后將訓練好的網絡對測試樣本集進行仿真,并對仿真結果進行反歸一化。(4)最后將仿真預測輸出分別和圖像1,2,3,4比較,差值的絕對值小于閾值0.5認為預測正確。閾值是根據網絡的期望輸出選擇的,以能正確區分不同缺陷類型為宜。識別率定義為正確識別的數量和樣本數的比值。
2實驗內容與結果分析
為了驗證本文方法的有效性,我們通過CCD圖像采集系統采集了1000張太陽能電池板EL圖片,包括250張虛焊樣本、250張微裂樣本、250張斷指樣本、250張無缺陷樣本,大小為125bits×125bits。我們利用圖片組成的樣本數據集進行了大量的實驗,將每種類型缺陷圖像的60%和40%分別作為BPNN和RBFNN的訓練樣本集和測試樣本集。算法測試硬件平臺為Inteli5750、主頻2.66GHz的CPU,4G內存的PC機,編譯環境為Mat-labR2012b。由于樣本圖像數據較大,需采用2.1節中的PCA算法進行降維處理。對樣本圖像集降維后,得到神經網絡的輸入矩陣。但是,隨著樣本數的增加,占有主要信息的主成分維數也在增加。因此,分別采用占有主要信息60%~90%的圖像作為BPNN的輸入,對應的降維后的主成分維數k為BPNN輸入層節點數。由于BPNN的結果每次都不同,所以運行50次,保存識別率最高的網絡。圖3是在不同樣本集數下的PCA-BPNN的最高識別率。其中,樣本數n=1000時的PCA-BPNN識別率如表1所示。同時網絡參數設置也列在表1中。隱含層中的最佳節點數是采用經驗公式所得[17]。從圖3和表1中可以看出,當維數降至20維(占主要信息70%)、總樣本數為1000(測試樣本400)時,4種類型總的最高識別率為93.5%。在相同的訓練樣本集和測試樣本集上,采用與BPNN同樣的輸入和輸出,在不同樣本集數下,PCA-RBFNN的最高識別率如圖4所示。其中,樣本數n=1000時的PCA-RBFNN識別率如表2所示。參數Spread的設置也列在表2中,首先設定Spread為1,然后以10倍的間隔速度遞減。從圖4和表2中可以看出,樣本數為1000(測試樣本400)時,PCA維數降到15(占主要信息65%),總的最高識別率為96.25%。兩種網絡的測試樣本集最高識別率對比分別如圖5和表3所示。圖5(a)、(b)分別為采用PCA-BPNN與PCA-RBFNN方法時測試樣本集中的4種缺陷樣本圖像的期望值與預測值。表3列出了兩種方法的具體識別結果。從表3可以看出,兩種方法對虛焊缺陷識別率均較高,分別為99%和100%;微裂缺陷識別率較低,分別為89%和92%。這是因為虛焊缺陷面積較大,顏色較深具有顯著特點;而微裂缺陷面積較小,與背景對比不強烈,導致錯誤分類。采用本文提出的BPNN和RBFNN方法處理一幅750×750大小的圖像大約分別需要1.8s和0.1s,PCA降維的時間大約為0.02s。將上述兩種方法與FCM[18]及ICA[3]方法進行比較,結果如表4所示??梢钥闯?,RBFNN方法具有較高的識別率和較短的計算時間,更適合于在線檢測。
3結論
[關鍵詞]軟件項目風險管理神經網絡粗集
本篇論文的中心是基于粗集的人工神經網絡(ANN)技術的高風險識別,這樣在制定開發計劃中,最大的減少風險發生的概率,形成對高風險的管理。
一、模型結構的建立
本文基于粗集的BP神經網絡的風險分析模型,對項目的風險進行評估,為項目進行中的風險管理提供決策支持。在這個模型中主要是粗糙集預處理神經網絡系統,即用RS理論對ANN輸入端的樣本約簡,尋找屬性間關系,約簡掉與決策無關的屬性。簡化輸入信息的表達空間維數,簡化ANN結構。本論文在此理論基礎上,建立一種風險評估的模型結構。這個模型由三部分組成即:風險辨識單元庫、神經網絡單元、風險預警單元。
1.風險辨識單元庫。由三個部分功能組成:歷史數據的輸入,屬性約簡和初始化數據.這里用戶需提供歷史的項目風險系數。所謂項目風險系數,是在項目評價中根據各種客觀定量指標加權推算出的一種評價項目風險程度的客觀指標。計算的方法:根據項目完成時間、項目費用和效益投入比三個客觀指標,結合項目對各種資源的要求,確定三個指標的權值。項目風險系數可以表述成:r=f(w1,w2,w3,T,T/T0,S/S0,U/U0),R<1;式中:r為風險系數;T、T0分別為實際時間和計劃時間;S、S0分別為實際費用和計劃費用;U、U0分別為實際效能和預計效能;w1、w2、w3分別是時間、費用和效能的加權系數,而且應滿足w1+w2+w3=1的條件。
2.神經網絡單元。完成風險辨識單元的輸入后,神經網絡單元需要先載入經初始化的核心風險因素的歷史數據,進行網絡中權值的訓練,可以得到輸入層與隱含層、隱含層與輸出層之間的權值和閥值。
(1)選取核心特征數據作為輸入,模式對xp=[xp1,xp2,.,xpn]T,dp(網絡期望輸出)提供給網絡。用輸入模式xp,連接權系數wij及閾值hj計算各隱含單元的輸出。
m
Ypj=1/{1+exp[-(∑wijxpi-hj)]},i=1,2,.,m;j=1,2,Λ,n,
i=1
(2)用隱含層輸出ypj,連接權系數wij及閾值h計算輸出單元的輸出
m
Yp=1/{1+exp[-(∑wjxpi-hj)]},i=1,2,.,m;j=1,2,Λ,n,
i=1
Yp=[y1,y2,……,yn]T
(3)比較已知輸出與計算輸出,計算下一次的隱含各層和輸出層之間新的連接權值及輸出神經元閾值。
wj(k+1)=wj(k)+η(k)σpσpj+α[wj(k)-wj(k-1)]
h(k+1)=h(k)+η(k)σp+α[h(k)-h(k-1)]
η(k)=η0(1-t/(T+M))
η0是初始步長;t是學習次數;T是總的迭代次數;M是一個正數,α∈(0,1)是動量系數。σp是一個與偏差有關的值,對輸出結點來說;σp=yp(1-yp)(dp-yp);對隱結點來說,因其輸出無法比較,所以經過反向推算;σpj=ypj(1-ypj)(ypwj)
(4)用σpj、xpj、wij和h計算下一次的輸入層和隱含層之間新的連接權值及隱含神經元閾值。wij(k+1)=wij(k)+η(t)σpjxpi+α[wij(k)-wij(k-1)]
3.風險預警單元
根據風險評價系數的取值,可以將項目的風險狀況分為若干個區間。本文提出的劃分方法是按照5個區間來劃分的:
r<0.2項目的風險很低,損失發生的概率或者額度很小;
0.2≤r<0.4項目的風險較低,但仍存在一定風險;
0.4≤r<0.6項目的風險處于中等水平,有出現重大損失的可能;
0.6≤r<0.8項目的風險較大,必須加強風險管理,采取避險措施;
0.8≤r<1項目的風險極大,重大損失出現的概率很高,建議重新考慮對于項目的投資決策。
總之,有許多因素影響著項目風險的各個對象,我們使用了用戶評級的方式,從風險評估單元中獲得評價系數五個等級。給出各風險指標的評價系數,衡量相關風險的大小。系數越低,項目風險越低;反之,系數越高,項目風險越高。
二、實證:以軟件開發風險因素為主要依據
這里我們從影響項目風險諸多因素中,經項目風險系數計算,作出決策表,利用粗集約簡,抽取出最核心的特征屬性(中間大量復雜的計算過程省略)??偣渤槿〕隽鶄€主要的指標(PersonnelManagement/Training,Schedule,ProductControl,Safety,ProjectOrganization,Communication)確定了6個輸入神經元,根據需求網絡隱含層神經元選為13個,一個取值在0到1的輸出三層神經元的BP網絡結構。將前十個季度的指標數據作為訓練樣本數據,對這些訓練樣本進行數值化和歸一化處理,給定學習率η=0.0001,動量因子α=0.01,非線性函數參數β=1.05,誤差閉值ε=0.01,經過多次迭代學習后訓練次數N=1800網絡趨于收斂,以確定神經網絡的權值。最后將后二個季度的指標數據作為測試數據,輸入到訓練好的神經網絡中,利用神經網絡系統進行識別和分類,以判斷軟件是否會發生危機。實驗結果表明,使用神經網絡方法進行風險預警工作是有效的,運用神經網絡方法對后二個季度的指標數據進行處理和計算,最后神經網絡的實際輸出值為r=0.57和r=0.77,該軟件開發風險處于中等和較大狀態,與用專家效績評價方法評價出的結果基本吻合。
參考文獻:
[1]王國胤“Rough:集理論與知識獲取”[M].西安交通大學出版社,2001
在水利及土木工程中經常會遇到地形面,地形面是典型的空間自由曲面,地形面在給出時,往往只給出一些反映地形、地貌特征的離散點,而無法給出描述地形面的曲面方程。然而有時需要對地形面進行描述,或者當給出的地形面的點不完整時,需要插補出合理的點。以往大多用最小二乘法或其它曲面擬合方法如三次參數樣條曲面、Bezier曲面或非均勻有理B樣條曲面等,這些擬合方法的缺點是:型值點一旦給定,就不能更改,否則必須重新構造表達函數;在構造曲線曲率變化較大或型值點奇異時,容易產生畸變,有時需要人為干預;此外,這些方法對數據格式都有要求。
神經網絡技術借用基于人類智能(如學習和自適應)的模型、模糊技術方法,利用人類的模糊思想來求解問題,在許多領域優于傳統技術。用神經網絡進行地形面構造,只要測量有限個點(可以是無序的),不需要其它更多的地形面信息和曲面知識,當地形面復雜或者是測量數據不完整時,用神經網絡方法更具優勢,而且還可以自動處理型值點奇異情況。
本文提出用BP神經網絡結合模擬退火算法進行地形面的曲面構造。
2模型與算法的選擇
為了對地形面進行曲面構造,首先要有一些用于神經網絡訓練的初始樣本點,對所建立的神經網絡進行學習訓練,學習訓練的本質就是通過改變網絡神經元之間的連接權值,使網絡能將樣本集的內涵以聯結權矩陣的方式存儲起來,從而具有完成某些特殊任務的能力。權值的改變依據是樣本點訓練時產生的實際輸出和期望輸出間的誤差,按一定方式來調整網絡權值,使誤差逐漸減少,當誤差降到給定的范圍內,就可認為學習結束,學習結束后,神經網絡模型就可用于地形面的構造。
BP網是一種單向傳播的多層前向網絡。網絡除輸入輸出節點外,還有一層或多層的隱層節點,同層節點中沒有任何耦合。輸入信號從輸入層節點依次傳過各隱層節點,然后傳到輸出節點,每一層節點的輸出只影響下一層節點的輸出。其節點單元傳遞函數通常為Sigmoid型。BP算法使神經網絡學習中一種廣泛采用的學習算法,具有簡單、有效、易于實現等優點。但因為BP算法是一種非線性優化方法,因此有可能會陷入局部極小點,無法得到預期結果,為解決BP算法的這一缺點,本文將模擬退火算法結合到BP算法中。
模擬退火算法是神經網絡學習中另一種被廣泛采用的一種學習算法。它的基本出發點就是金屬的退火過程和一般組合優化問題之間的相似性。在金屬熱加工過程中,要想使固體金屬達到低能態的晶格,需要將金屬升溫熔化,使其達到高能態,然后逐步降溫,使其凝固。若在凝固點附近,溫度降速足夠慢,則金屬一定可以形成最低能態。對優化問題來說,它也有類似的過程,它的解空間中的每一個點都代表一個解,每個解都有自己的目標函數,優化實際上就是在解空間中尋找目標函數使其達到最小或最大解。
(如果將網絡的訓練看成是讓網絡尋找最低能量狀態的過程,取網絡的目標函數為它的能量函數,再定義一個初值較大的數為人工溫度T。同時,在網絡的這個訓練過程中,依據網絡的能量和溫度來決定聯結權的調整量(稱為步長)。這種做法與金屬的退火過程非常相似,所以被稱為模擬退火算法。)
模擬退火算法用于神經網絡訓練的基本思想是,神經網絡的連接權值W可看作物體體系內的微觀狀態,網絡實際輸出和期望輸出的誤差e可看作物體的內能,對網絡訓練的目的就是找到恰當的狀態W使其內能e最小,因此設置一個參數T來類比退火溫度,然后在溫度T下計算當前神經網絡的e與上次訓練的e的差e,按概率exp(-e/T)來接受訓練權值,減小溫度T,這樣重復多次,只要T下降足夠慢,且T0,則網絡一定會穩定在最小的狀態。
模擬退火算法雖然可以達到全局最優,但需要較長時間,BP算法采用梯度下降方式使收斂速度相對較快。為取長補短,我們將兩種算法結合起來,采用BP算法的梯度快速下降方式,同時利用模擬退火算法技術按概率隨機接受一個不成功的訓練結果,使梯度快速下降過程產生一些隨機噪聲擾動,從而既保證了網絡訓練的快速度下降,又保證了訓練結果的最優性。
3網絡結構與學習算法
3.1網絡結構
如何選擇網絡的隱層數和節點數,還沒有確切的方法和理論,通常憑經驗和實驗選取。本文采用的BP網絡結構如圖1所示,輸入層兩個節點,分別輸入點的x坐標和y坐標;兩層隱層,每層10個節點,輸出層一個節點,輸出點的z坐標。
3.2學習算法
學習算法的具體過程如下:
其中Out_node為輸出神經元集合.
4計算實例
為了檢驗本文算法的有效性,我們用本文算法對黃河下游河灘地形面進行曲面構造,地形面數據按截面給出,我們用奇數截面上的點為學習樣本,偶數截面上的點用于檢驗本算法的精度.表1給出了測量值z1與本文算法計算結果z2,z2為本算法經過大約3500次迭代的結果.由這些數據可以看出,本文算法計算出的值與測量值的誤差大約在0.02左右.完全可以滿足實際工程要求的精度.
5結語
用神經網絡進行地形面的曲面構造,不必求出曲面的方程,只需知道有限個點即可,而且這些點可以是散亂點.與傳統方法相比,神經網絡方法具有很強的靈活性.
本文將BP算法和模擬退火算法結合起來,解決了BP算法容易陷入局部極小的致命缺點.但仍然沒有解決BP算法收斂速度慢的缺點.
NEURALNETWORKMETHODTOCONSTRUCTTERRAINSURFACE
LiuXue-mei1,2,DondWen-sheng1,2,ZhangShu-sheng1
(1NorthweasternPolytechnicalUniversity,ShanxiXiAn710072)
(2NorthChinaInstituteofWaterConservancyandHydroelectricPower,HenanZhengzhou450045)
Abstract
Thispaperpresentsanartificialneuralnetworkapproachtosolvetheproblemofterrainsurfaceconstruction.ThismethodtakesadvantageoftheglobalminimumpropertyofSimulatedProcedureonthebasisofBPalgorithm,thuscanjumpoutofthelocalminimumandconvergetotheglobalminimum..ThismethodwerevalidatedbysimulatingbottomlandterrainofYellowRiver.
Keywords:terrainsurface;freeformsurface;neuralnetwork;BPalgorithm;simulatedannealing
參考文獻
[1]王鎧,張彩明.重建自由曲面的神經網絡算法[J].計算機輔助設計與圖形學學報,1998,10(3):193-199
1.1BP神經網絡簡介神經網絡由大量簡單的單元構成的非線性系統,具有非線性映射能力,不需要精確的數學模型,擅長從輸入輸出數據中學習有用知識[7]。神經元是神經網絡基本單元。神經元模型如圖1所示。由連接權、加法器和非線性激活函數這3種元素組成。1986年,Rumelhart及其研究小組在Nature雜志上發表誤差反向傳播(errorback-propagation)算法[8],并將該算法用于神經網絡的研究,使之成為迄今為止最著名的多層神經網絡學習算法———BP算法[9]。由該算法訓練的網絡,稱為BP神經網絡。BP神經網絡是一種正向的、各層相互連接的網絡。輸入信號首先經過輸入層傳遞給各隱含層節點,經過激發函數,將隱含層節點的輸出傳遞到輸出節點,最后經過再經過激發函數后才給出輸出結果,若輸出層的輸出和期望輸出之間的誤差達不到要求,則轉入反方向傳播,將誤差信號沿原來的連接通路返回,通過修個神經網絡各層的權值,使過程的輸出和神經網絡的輸出之間的誤差信號達到期望值為止[10]。
1.2電池SOC的定義動力電池的剩余電量,是指電池在當前時刻,達到放電截止電壓前可以使用的電量。目前,國內外普遍采用荷電狀態來表征電池的剩余容量[11]。電池的荷電狀態(SOC)是電池的剩余電量與電池的額定電量的比值。
1.3影響電池SOC的因素動力電池是一個非線性系統,其中電池的荷電狀態受到很多種因素的影響,主要包括電池的充/放電倍率、自放電、環境溫度以及電池的工作狀態等因素。(1)電池的充/放電倍率電池的放電電流的大小,會影響電池的容量。在其他條件相同的情況下,電池的放電容量會隨著放電倍率的增加而降低[12]。(2)自放電自放電又稱荷電保持能力,指在一定的條件下,當電池處于開路狀態時,電池對電量的儲存能力。電池在自放電的作用下,SOC值會隨著存儲時間的增加而減小。(3)溫度首先,鋰離子電池正常工作的溫度有一定的要求。動力電池的使用環境溫度發生變化時,電池的可用容量也會隨之發生變化。在溫度較低時,電池活性較低,電池可用容量降低;當溫度升高時,電池活性增強,可用容量也隨之增多。因此,在預估電池的荷電狀態時,需要考慮到電池的溫度的影響。
2神經網絡SOC估計器設計
2.1實驗數據的獲取本研究的實驗數據是在ADVISOR2002汽車仿真軟件上仿真得到的。ADVISOR(AdvancedVehicleSim-ulator,高級車輛仿真器)是由美國可再生能源實驗室,在Matlab/Simulink軟件環境下開發的高級車輛仿真軟件[13]。該軟件的界面友好、源代碼完全開放,目前已經在世界范圍內廣泛使用。ADVISOR采用了前向、后向相結合的混合仿真方法。后向仿真方法是在假設車輛能滿足道路循環的請求行駛軌跡(包括汽車行駛速度、道路坡度和汽車動態質量)的前提下,計算汽車中各個部件性能的仿真方法,前向仿真是根據駕駛員行為調節部件,使得車輛各部件跟隨路面循環工況[14]。本研究在ADVISOR軟件搭建了某國產電動汽車的仿真平臺。整車的主要技術參數如表1所示[15-16]。模擬行駛程序使用的測試路程是ECE工況、UDDS工況和HWFET工況混合行駛工況,其速度與時間關系曲線如圖2所示。ECE工況、UDDS工況和HWFET工況均被廣泛應用于電動汽車性能測試。其中ECE工況為歐洲經濟委員會汽車法規規定的汽車測試循環工況。ECE工況是用來測試車輛在城市低速道路下車輛的循環工況。其循環時間為195s,車輛行駛的路程為0.99km,最高車速為50km/h。UDDS工況是美國環境保護署制訂的城市道路循環工況,用來測試車輛在城市道路下行駛的各種性能的循環工況。其循環時間為1367s,行駛路程為11.99km,最高車速為91.25km/h。HW-FET工況為美國環境保護署制訂的汽車在高速公路上的循環工況,用來測試汽車在高速道路上車輛行駛的循環工況,其循環時間為767s,行駛路程為1.51km,最高車速為96.4km/h。在搭建的仿真平臺上,本研究進行了仿真,其中電動汽車使用的電池為鋰電池。虛擬電動汽車共行駛了2329s,行駛的距離為14.49km。對電動汽車的電池的充放電電流、電池溫度和電池的SOC進行采集,得到結果如圖3~5所示。
2.2數據預處理根據前文的分析,本研究的神經網絡模型訓練數據選擇如下。本研究選擇動力電池的充放電電流和電池的溫度作為動力電池神經網絡的輸入,電池的SOC作為神經網絡的輸出。在對神經網絡訓練之前,對訓練數據進行歸一化操作。歸一化操作可以避免各個因子之間的量級差異,加快BP神經網絡訓練的收斂,減少計算難度。對數據進行如下操作。
2.3動力電池SOC神經網絡的訓練SOC估計是根據動力電池的電流、溫度的數值得到電池的SOC數值。使用神經網絡設計估計器的目的是為了能夠逼近函數。本研究使用了BP神經網絡模型來逼近動力電池的電流、溫度和SOC之間的關系,其中BP神經網絡的隱含層選擇tansig函數。學習算法使用基于數值最優化理論的Levenberg-Marquardt算法作為神經網絡的學習算法。
3實驗驗證及結果分析
為了驗證模型的有效性,本研究采用了另外3種工況混合的行駛工況的實驗數據作為測試樣本數據來驗證本研究得到的神經網絡模型。這3種工況分別是:普銳斯工況(Prius工況,該種工況用來測試豐田普銳斯混合動力汽車的行駛工況),CYC_Nuremberg_R36工況(該種工況用來測試德國紐倫堡市36路公共汽車線路工況)和CYC_US06工況(該種工況用來考察測試車輛在高速情況下的行駛狀況)。以上3種工況基本上能夠模擬出汽車在城市中行駛的加速、減速、低速和高速行駛的各種工況,測試混合工況如圖6所示。本研究對得到的測試數據同樣進行歸一化處理。模型的輸入為電池的電流和溫度,模型的輸出為SOC值。最后,得到的電池SOC的實際值和經過神經網絡得到的SOC估計值如圖7所示。通過求神經網絡模型的輸出值和真實值之間的誤差值,來評價本研究的神經網絡模型的精度。其計算公式如下式所示。得到的神經網模型的估計值與動力電池SOC的真實值之間的誤差如圖8所示。通過圖8可以看出,神經網絡估計器的估計值與電池SOC的真實值之間絕對誤差的最大值為4%左右,符合動力電池對SOC預測的精度要求。
4結束語
[關鍵詞]MATLABBP神經網絡預測模型數據歸一化
一、引言
自20世紀70年代初以來的30多年里,世界黃金價格出現了令人瞠目的劇烈變動。20世紀70年代初,每盎司黃金價格僅為30多美元。80年代初,黃金暴漲到每盎司近700美元。本世紀初,黃金價格處于每盎司270美元左右,此后逐年攀升,到2006年5月12日達到了26年高點,每盎司730美元,此后又暴跌,僅一個月時間內就下跌了約160美元,跌幅高達21.9%。最近兩年,黃金價格一度沖高到每盎司900多美元。黃金價格起伏如此之大,本文根據國際黃金價格的影響因素,通過BP神經網絡預測模型來預測長期黃金價格。
二、影響因素
劉曙光和胡再勇證實將觀察期延長為1972年~2006年時,則影響黃金價格的主要因素擴展至包含道瓊斯指數、美國消費者價格指數、美元名義有效匯率、美國聯邦基金利率和世界黃金儲備5個因素。本文利用此觀點,根據1972年~2006年各因素的值來建立神經網絡預測模型。
三、模型構建
1.模型選擇:BP網絡具有理論上能逼近任意非線性函數的能力,將輸入模式映射到輸出模式,只需用已知的模式訓練網絡,通過學習,網絡就有了這種映射能力。2.樣本數據歸一化:在訓練前,對數據進行歸一化處理,把輸入向量和輸出向量的取值范圍都歸一到[0,1]。
3.BP網絡設計:采用單隱層的BP網絡進行預測,由于輸入樣本為5維的輸入向量,因此輸入層一共有5個神經元,中間層取20個神經元,輸出層一個神經元(即黃金價格),網絡為5*20*1的結構。中間層的傳遞函數為S型正切函數,輸出層為S型對數函數。中間層的神經元個數很難確定,測試時分別對12,15,20個數進行測試,尋找誤差最小的。
4.網絡訓練:訓練次數epochs5000,訓練目標goal0.001
對30個樣本數據進行訓練,經過1818次的訓練,目標誤差達到要求,如圖2所示:神經元個數為20個時誤差最小,此時網絡的仿真結果如圖3所示,預測精度80%以上,效果滿意。
四、結論
在對1976年~2006年的影響國際黃金價格的五種因素的數據進行歸一化處理后,用MATLAB建立的BP神經網絡預測模型進行預測,達到了很好的效果。
國際黃金的長期價格受到許多因素的影響,本文只是對道瓊斯工業指數等影響因素諸如分析,來預測長期的國際金價。還有其他因素,如國際油價,局部政治因素等,如果考慮進去,預測精度會進一步提高。
參考文獻:
1.1概率性神經網絡(PNN)
地震屬性和測井數據的關系,并不一定是線性的,利用概率性神經網絡的方法彌補井和地震間的非線性關系。概率性神經網絡(PNN)類似于多維屬性空間上的克里金,采用了局部化的作用函數,具有最佳逼近特性,且沒有局部極小值。每個輸出點把新點處的新屬性組與已知的培訓例子中的屬性進行比較來確定的,得到的預測值是培訓目標值的加權組合。概率神經網絡方法具有高度的容錯性,即使某個井旁道地震參數或某個網絡連接有缺陷,也可以通過聯想得到全部或大部分信息。因此,用概率神經網絡建立地震屬性和測井特征屬性之間的映射關系可靠性高。概率神經網絡方法還具有動態適應性,當地質巖性類別變化或地震參數修改時,網絡可自動適應新的變量,調整權系數,直到收斂。對于受巖性控制的儲層,概率神經網絡是描述其地震屬性參數與巖性參數關系的有效方法。概率神經網絡是由多測井和多地震屬性參數組成的網絡。首先,將由測井曲線和井旁地震道提取的特征參數按照地質巖性參數分成若干類;然后,通過非線性數學模型的神經網絡學習系統,由輸入矢量產生輸出矢量,并把這個輸出矢量與目標矢量進行平方意義下的誤差對比;再以共軛迭代梯度下降法作權的調整,以減少輸出矢量與目標矢量的差異,直到兩者沒有差異訓練才結束。對于給定的培訓數據,PNN程序假設測井值和每一輸出端的新測井值為線性組合,新數據樣點值用屬性值X表示可寫。這里σ是PNN使用的高斯權重函數的關鍵參數,來控制高斯函數的寬度。式(2)和式(3)是概率神經網絡預測的基本原理,訓練神經網絡的過程實際上就是求解最優平滑因子的過程。
1.2交互驗證增加屬性類似于多項式擬合增加高階項,增加多項式高階將會使預測誤差總是變小,但屬性的個數絕不是越多越好。隨著屬性個數的增多,對預測的結果的影響越來越小,會明顯削弱未參與神經網絡訓練的那些點的預測能力,甚至造成預測誤差反而增大,這種現象稱為過度匹配。而且參與運算的屬性過多,也會影響到運算速度,因此通過計算驗證誤差來確定最佳的屬性個數,防止過度匹配,該過程就稱為交叉驗證。通過蘊藏井誤差分析的方法,驗證出現擬合過度的情況。求取遞歸系數時,選取一口井作為驗證井,不參與運算。利用擬合出的關系,得到驗證井的誤差值。以此類推,得到每一口井的誤差值,以參與運算井的平均誤差作為參考標準,來檢驗屬性組合個數是否出現擬合過度的情況。
2應用實例分析
研究區內油氣富集區主要為巖性控制,目的層段厚度70m左右,地震剖面上大約50ms,含油砂體主要發育在wellA,wellC附近,向周圍變化較快。針對目標層T41-T43之間進行井曲線交匯和巖性統計。wellA,wellC主要是含油砂巖,wellB、D、F主要是泥質砂巖、煤層,巖性差別很大。但從速度、密度曲線交匯圖版(圖1)來看,曲線交匯統計重疊較大,很難區分含油砂巖和泥質砂巖。wellA、wellB對應層位巖性明顯不同,在地震剖面也體現同樣的反射特征。因此基于測井和地震模型為基礎的常規疊后波阻抗反演很難準確識別這套含油砂巖。而更能反映巖性特征的GR曲線,則對這套砂體較為敏感,明顯地區分出了這套含油砂巖(如圖3所示)。因此我們采用本文介紹的神經網絡技術,在常規波阻抗反演的基礎上,預測GR曲線特征體。經過分析,把GR值65~75區間巖性賦值為含油砂巖,從而把這套儲層有效的區分出來,在此基礎上進一步計算砂巖厚度(圖4)。
3結論
[關鍵詞]反射認知創造神經網絡人工智能
一、生物神經網絡系統
生物神經系統是以神經元為基本單位,神經元的外部形態各異,但基本功能相同,在處于靜息狀態時(無刺激傳導),神經細胞膜處于極化狀態,膜內的電壓低于膜外電壓,當膜的某處受到的刺激足夠強時,刺激處會在極短的時間內出現去極化、反極化(膜內的電壓高于膜外電壓)、復極化的過程,當刺激部位處于反極化狀態時,鄰近未受刺激的部位仍處于極化狀態,兩著之間就會形成局部電流,這個局部電流又會刺激沒有去極化的細胞膜使之去極化等等,這樣不斷的重復這一過程,將動作電位傳播開去,一直到神經末梢。
神經元與神經元之間的信息傳遞是通過突觸相聯系的,前一個神經元的軸突末梢作用于下一個神經元的胞體、樹突或軸突等處組成突觸。不同神經元的軸突末梢可以釋放不同的化學遞質,這些遞質在與后膜受體結合時,有的能引起后膜去極化,當去極化足夠大時就形成了動作電位;也有的能引起后膜極化增強,即超極化,阻礙動作電位的形成,能釋放這種遞質的神經元被稱為抑制神經元。此外,有的神經元之間可以直接通過突觸間隙直接進行電位傳遞,稱為電突觸。還有的因樹突膜上電壓門控式鈉通道很少,樹突上的興奮或抑制活動是以電緊張性形式擴布的,這種擴布是具有衰減性的。
圖1
一個神經元可以通過軸突作用于成千上萬的神經元,也可以通過樹突從成千上萬的神經元接受信息,當多個突觸作用在神經元上面時,有的能引起去極化,有的能引起超極化,神經元的沖動,即能否產生動作電位,取決于全部突觸的去極化與超級化作用之后,膜的電位的總和以及自身的閾值。
神經纖維的電傳導速度因神經元的種類、形態、髓鞘有無等因素的不同而存在很大差異,大致從0.3m/s到100m/s不等。在神經元與神經元之間的信息交換速度也因突觸種類或神經遞質的不同而存在著不同的突觸延擱,突觸傳遞信息的功能有快有慢,快突觸傳遞以毫秒為單位計算,主要控制一些即時的反應;慢突觸傳遞可長達以秒為單位來進行,甚至以小時,日為單位計算,它主要和人的學習,記憶以及精神病的產生有關系。2000年諾貝爾生理學或醫學獎授予了瑞典哥德堡大學77歲的阿維·卡爾松、美國洛克菲勒大學74歲的保羅·格林加德以及出生于奧地利的美國哥倫比亞大學70歲的埃里克·坎德爾,以表彰他們發現了慢突觸傳遞這樣一種“神經細胞間的信號轉導形式”。本次獲獎者的主要貢獻在于揭示“慢突觸傳遞”,在此之前,“快突觸傳遞”已經得過諾貝爾獎。此外,使用頻繁的突觸聯系會變得更緊密,即突觸的特點之一是用進廢退,高頻刺激突觸前神經元后,在突觸后神經元上紀錄到的電位會增大,而且會維持相當長的時間。所以可以得出一條由若干不定種類的神經元排列構成的信息傳導鏈對信息的傳導速度會存在很大的彈性空間,這一點對神經系統認知事件有著非常重要的意義。
神經系統按功能可大致分為傳入神經(感覺神經)、中間神經(腦:延腦、腦橋、小腦、中腦、間腦、大腦脊髓)與傳出神經(運動神經)三類。
生物要適應外界環境的變化,就必須能夠感受到這種變化,才能做出反應。生物的感受器多種多樣,有的是單單感覺神經元的神經末梢;有的是感受器細胞;還有的感受器除了感受細胞外還增加了附屬裝置,且附屬裝置還很復雜,形成特殊的感覺器官。無論感受器的復雜程度如何,它在整個神經系統中都起著信息采集的作用,它將外界物理的或化學的動態信號反應在感覺神經細胞膜的電位變化上,膜上的電位變化可形成動作電位向遠端傳導。
中間神經在系統中起著計算及信息傳導的作用,通常感覺神經傳來的動作電位經過若干個中間神經元的計算響應后在傳遞到傳出神經形成反射弧,但也有的反射弧僅由傳入神經元與傳出神經元直接組成,如敲擊股四頭肌引起的膝反射。傳出神經可分為軀體神經與內臟神經兩類,它們都最終連接著效應器,只是內臟神經需要通過一個神經節來連接效應器,最后由效應器調空肌體器官做出相應的反應。
二、生物神經網絡的建立
1994年,一種被稱為Netrin-1、將軸突吸引到分泌它的神經細胞的可擴散蛋白被發現,此后人們發現,同一軸突引導分子既可吸引、也可排斥前來的軸突。其中,環狀AMP(也稱cAMP)、環狀GMP(也稱cGMP)和鈣離子,都可能是從參與將發育中的神經元引導到其目標上的受體中轉導信號的第二種信使。新的實驗表明,正是cAMP/cGMP的比例決定著Netrin-1是起一種吸引信號的作用還是起一種排斥信號的作用,這些環狀核苷通過控制軸突生長錐中的L-型鈣通道來起作用。
目前已經發現大量對神經軸突生長具有導向作用的分子,這些分子可以分為兩大類:一類分子固著在細胞膜表面或細胞外基質中,影響局部的神經纖維生長,這類因子包括ephrin,MAG(myelin-associatedglycoprotein),Nogo等;另一類是分泌性分子,能擴散一定的距離并形成濃度梯度起作用,如netrin,slit,semaphorin家族的大多數成員,及各種神經營養因子等。神經軸突的前端有生長錐(growthcone)的結構起到對環境信號的探測作用。神經生長錐表面存在各種導向因子的受體,它們特異地識別環境中各種因子,并向細胞內傳遞吸引(attractive)或是排斥(repulsive)的信號,從而通過調節生長錐內的細胞骨架的重組來引導神經纖維沿特定路線生長(我國科學家袁小兵等研究人員發現,在脊髓神經元上,神經細胞內RHOA酶和CDC酶直接傳遞外界方向信號,引導神經生長方向,同時這兩種酶相互作用,對生長方向進行細致的調節)。未成熟神經細胞柔弱的軸突在這些信號的引導下,試探地穿行于正處于發育階段、仍是一片紛亂的大腦之中,最終抵達適當的目的地。一旦軸突的末端找到了其正確的棲息地,它就開始與周圍神經元建立盡可能廣泛的突觸聯系,以便傳導信息。
脊椎動物出生后早期發育中的一個特征是,神經鍵(或神經連接)的消除。最初,一個神經肌肉連接被多個軸突支配,然后所有軸突都退出,只剩下一個,對相互競爭的神經元來說,決定勝負的是它們的相對活性。為了能準確的連接到目的地,單個或多個神經元會沿導向分子所確定的大致方向上生長出若干條神經纖維,其中總會有能正確連接到目的地的神經纖維,所建立的若干神經鏈路在刺激信號的作用下,正確的信息傳遞會使鏈接會變的更加穩固,反之則慢慢萎縮分離。打個比方講:兩個城市間原本沒有路,如果要修的話會先派人去探索出若干條路,最后去修筑被優選出來的路,而其他的則會被遺棄。
三、神經網絡的基本工作原理
1、反射
自然界中,事物的發展、能量的轉化、信息的傳遞等等各種的自然現象都包含著因果關系,只要時間沒有停滯,這種關系將廣泛存在,從“因”到“果”,貫穿著事物的發展過程,當過程長且復雜時我們稱之為“事件”,反之則稱之為“觸發”。
生物個體在與外界環境或是個體自身進行物質或信息交換時,也存在著這種現象,在這里我們稱之為“反射”。
反射是最基本的神經活動,現行的說法是將反射分為兩種,無條件反射和條件反射,其中,無條件反射是動物和人生下來就具有的,即遺傳下來的對外部生活條件特有的穩定的反應方式,在心理發展的早期階段,這種反應方式提供最基本的生存技能,也就是本能,如:食物反射、防御反射、定向反射,還有一些可能是在人類進化過程中,曾經有一定生物適應意義的無條件反射,如:巴賓斯基反射、抓握反射、驚跳反射(又叫摩羅反射)、游泳反射、行走反射等,此外,還有其他一些無條件反射,如眨眼反射、瞳孔反射、吞咽反射、打嗝、噴嚏等等。
條件反射是后天訓練出來的,著名科學家巴甫洛夫就曾對條件反射的形成、消退、自然恢復、泛化、分化以及各種抑制現象進行過相當細致、系統的實驗研究,。
無論是條件反射還是無條件反射,從主觀上都可以看作是一種因果作用關系,即都存在著觸發條件,都會導致某一結果的產生,所以無條件反射其實也屬于條件反射范疇。只有在成因上,無條件反射是根據遺傳信息形成的神經網絡結構,而條件反射是后天在先前的網絡基礎上,依據外界環境繼續發展完善的神經網絡結構。兩者之間是繼承和發展的關系,但從這兩個階段所形成的神經網絡功能來看,對外界的刺激都具備輸入、傳遞、輸出這一處理過程即反射過程,所以從某種意義上講,也可以把無條件反射歸類到條件反射范疇中去,或者說條件反射等同于反射。
神經系統中的條件反射具有三個要素:輸入、傳遞、輸出。其中的每一個要素既可以用單個神經元表示,也可以用一個神經群落來表示。當用少數幾個神經元表示時,對應的是生物個體對局部刺激的反應,當擴展到神經群落時,對應的就可能就是對某一激發事件的處理方法了。
反射中的輸入,最能使我們聯想到傳入神經元(感覺神經元),但在這里,它可以指單個的感覺神經元,也可以指一種感官(眼睛中的視神經群落、耳中的聽覺神經中樞、皮膚中與各類感受器連接的神經群落等等),甚至可以是大腦中某一區域內形成某一表象或是概念的神經群落。反射中的輸出同樣可以指傳出神經元(即脊髓前角或腦干的運動神經元),也可以指大腦中某一區域內形成某一概念或是表象的神經群落。反射中的中間傳遞過程是信息的加工處理的過程,可以由單個神經元、神經鏈路或是神經網絡來承擔,甚至可以直接由輸入與輸出的對應載體來分擔。這樣生物神經系統中的反射弧只是它的一個子項罷了,條件反射在主觀上也對應著我們常說的“產生、經過與結果”即因果關系。
2、認知
有一個低等生物海兔的記憶試驗:海兔本身具有被觸摸(水管部分)后的鰓縮反射,但連續十幾次的刺激后,鰓縮反應就逐漸減慢.經過研究發現,海兔的習慣化是由于神經遞質發生變化所致.進一步的研究發現這種變化是突觸中的感覺神經元的Ca離子門關閉,導致遞質的釋放量減少所致.上述試驗說明簡單的記憶與神經遞質和突觸有關.又如大鼠的大腦皮質切除試驗:用迷宮訓練大鼠,如果大鼠學會并記住順利走出迷宮的道路后,切除它的大腦皮質,記憶就會消退.不論切除的是大腦皮質的哪一部分,總是切除的多,記憶消退的多;切除的少,記憶消退的就少。
首先,認知通常強調的是結果,是神經網絡定型后的結果。神經網絡的定型過程就是認知的建立過程,也就是生物個體的學習過程,它同時表現了出生物的記憶過程。定型好的神經網絡對觸發信息的處理過程即反射過程,就是記憶的提取過程,也正是通過這一過程反映出了認知的存在。
生物個體對客觀事物的認知可以解釋為:客觀事物在主觀意識中形成了表象,并且該表象與一系列的活動(生理的或心理的)相聯系。換句話說,某一客觀事物的信息如果經過大腦處理能夠引發出一系列的動作(這是一種反射現象,符合前面對反射的定義),我們就可以說對這一事物已經認知了。
行為主義與符號主義中對認知建立過程中所顯現出的記憶現象都有很詳細的類別劃分,其中每一種記憶類別都僅與一種認知的建立模式相對應。所以,與其用記憶類別來劃分還不如用認知類別來劃分更為合理,在這里由于篇幅所限,我僅將認知簡單概括為以下三種類別:物體認知、事件認知以及兩種認知的衍生產物抽象事物認知。
a、物體認知
感受外界客觀環境最簡單的辦法是通過感官直接去“接觸”物質對象,并通過大腦處理,并最終導致一個或一系列的結果,這種因果過程就是對客觀物體的認知。如:看到一個蘋果,我們產生了拿的動作,同時也可以產生許多其他的動作如激活色彩感覺中樞、激活味覺中樞等等,當可以有這些動作產生時,就完成了對蘋果的認知。
下面我們將詳細講解神經網絡對物體認知的描述。
一個輸入集合I(觸覺、視覺等的感應細胞構成的集合或是處于某一層次上的神經元集合)對之內兩個不同區域(A、B)的刺激做出相應Y與X兩種不同反應的神經處理過程,如圖2。
圖2的a、b、c為三種AB可能存在的輸入情況。圖2a中A、B分別對應Y、X,神經鏈路沒有重疊,刺激A時得到Y的輸出,刺激B時得到X的輸出,結果不會出現問題,請注意:帶有方向的黑線只是代表邏輯上的鏈路,在實際中,鏈路與鏈路之間有質的區別,這里只做簡單的等價說明,用數量表示質量。圖2b中A、B間有了交叉,在處理過程中,當A受到刺激會產生Y的輸出,同時會有三條邏輯鏈路去刺激X,但做為X的全部決定因素,這三條相比從B到X余下的空閑聯絡,只占很小的一部分,它們還不足以激活X,所以分別刺激A、B仍然會得到正確的輸出。對于X這種在某一層次上的輸出神經元來說,是否能被激活,主要取決于所有處于不同狀態的輸入鏈路的能量對比,在這里能量被量化為邏輯鏈路的數量,這樣每個神經元對值的判斷則等價為判斷處于激活狀態的邏輯鏈路數是否過半。此類神經鏈路就是興奮類傳導神經網絡,單純采用此類神經鏈路的系統只需要根據相應刺激感受區域是否有刺激發生,就可以得出正確的輸出結果,但是在圖2c中,刺激區域A包含著B的情況下,如果刺激B區會有正確輸出X,然而如果刺激A區則會出錯,Y與X會同時有效,這時我們就需要一種鏈路來阻止這種錯誤的發生,這就是抑制類神經鏈路,如圖2c中的虛線箭頭所示,抑制類邏輯鏈路只起到沖減、抵消興奮類邏輯鏈路數量的作用,使得X在沖減后的興奮鏈路合計數小于閥值,從而達到唯一正確輸出Y得目的。
在圖2中列舉的神經網絡認知模式中,雖然只涉及到了輸入與輸出,但在兩者之間已經包含了計算的成分,或是說承擔了傳遞計算的功能,此外不難發現:能夠對某一物體認知,必須要首先區分開其他物體,尤其是符合圖2c中的情況,物體間的差異正好可以滿足這一需求。這樣,即使是從同一個感官傳來的信息,也能做到很好的區分。
當認知的對象較為復雜時(如蘋果),對象包含有各種各樣的屬性,其中的每一種屬性的響應過程,在局部都遵循著反射的定義。當在某一時刻,與蘋果相關的各種屬性的神經子網絡被大部分激活時,蘋果的表象就成了焦點。更確切的講是,感官捕捉的信息在傳遞的過程中,經過了代表各種屬性的神經子網絡,一些屬性因條件不滿足而停止傳遞,最后由可以通過的(即被確認的屬性)神經子網絡繼續向后傳遞,最后再引發一系列的動作,其中反射可以指局部的傳遞(單個屬性的確認),也可以指整個傳遞過程(看到蘋果后,可以去拿可以去想等等)。
蘋果在人腦中形成的表象,其實就是指感官根據蘋果實物產生的電信號所能經過的神經鏈路,神經鏈路與神經網絡的關系相當于行走路徑與公路網的關系。此外其他的神經區域輸出的電信號如果在傳遞過程中也能引發出與前面提到的“蘋果神經鏈路”相同或相似動作或是功能的話,也可以說是形成了蘋果的表象,這種現象可以使我們認知客觀世界不存在的事物或個體自身從未接觸過的事物。
b、事件認知
任何事物在一段時間內發生了變動,在這里都可以被稱之為事件。因果關系同樣也具備事件的屬性,如果能深入分析一下各種事件的過程,基本上都能找到因果關系的影子。在前面對物體的認知中,我們知道了神經網絡認知物體是以因果關系的方式建立的網絡鏈路,為了不引起混淆,下面以因果關系為認知對象的,我們用事件來代替,對事件的認知過程,近似于對物體的認知過程,相當于把事件等同于物體,由于事件具有時間性,所以神經網絡就必須能夠處理時間問題。
神經元的形狀各異,軸突有長有短,且對信息的加工時間與傳遞速度也各不相同,這樣對同一起點不同的傳遞路徑,信息的傳遞速度可能不同。還以圖2為例,現在假設每一個箭頭除了代表一個神經元連接外,還代表一個單位傳遞時間,當首先刺激A區后并在第二個單位時間內刺激B區,將兩次觸發過程當作一個事件,導致一個輸出Y;同法當先刺激B區,然后在刺激A區時會有另一個輸出X,如圖3
根據這種通過神經鏈路上神經元個數進行延時的方法,任何處于時間片段上的信息都可以被處理。我們再舉個更加復雜的例子,單輸入神經元網絡對摩爾斯電碼的識別與重現。
假設輸入神經元為A,按嚴格的爾斯電碼規則來刺激該神經元,最后由神經網絡得出字符序列,如圖4
當A收到刺激信號時,將信號廣播給不同的識別群體,圖4中只給出了其中的一個網絡群體,給出的這個群體只能認識字符“b”即電碼“—…”。為了簡化說明,圖4中舍棄了每個神經元的其他輸入輸出鏈路以及相關的抑制鏈路,所以圖中的每一個指向神經元的箭頭均存在著“與”的邏輯運算關系,在這里它們不表示邏輯數量。
由圖4可以看出,先收到的信號經過較多的傳遞神經元進行延時,再連同后面收到的信號一起同時傳遞到結果輸出上,這樣處于時間片段上的信息就可以被當作是一個整體來進行處理。粗虛線上半部分為輸入識別部分,下半部分為信息重現部分,仔細觀察就會發現,兩部分的神經鏈路并不是互成鏡像,輸入為前端延時,依次為:1、3、5、7、8、9,輸出為后端延時,依次為:9、7、5、3、2、1,所以認識事物與應用事物是由兩套不同的神經網絡來控制完成的。圖4中的兩條傾斜細虛線是一個虛擬的標示線,從某種意義上講這里是事物的表象層,中間本應該是更加復雜的表象處理網絡,在這里只簡單的假設性的給出了表象輸出與輸入。
c、抽象概括與抽象描述
對事物(事件、物體)的認知,使我們得以在大腦中建立出與客觀世界相對應的表象,作為記錄事物表象的神經鏈路網上的每一個分支與合并都可能是事物在不同層次上的一種“特征的概括與描述”(參見圖3左圖)。
神經網絡在認知新的事物時,輸入信息總是盡可能的使用已存在的網絡鏈路進行傳遞處理,當處理不足以產生正確的結果時才在信息的中斷處搭建新的網絡連接。在局部,如果已存在的網絡鏈路可以被使用,那么這部分網絡結構通常是一種共性的表達,當這種表達隨著同類認知的增加而逐漸完善時,就可以作為一種屬性的表象,這在主觀上是一種抽象概括的過程。
例如,對蘋果的認知,“蘋果”本身是一個概括出來的詞匯,它不具體指哪一個蘋果,但在認知若干個具體蘋果的過程中,與各個蘋果相對應的神經鏈路的共用部分被逐漸加強,這部分神經網絡就可以說是“蘋果”這一概念的表象區域。此外,神經網絡結構不光能實現對有形的抽象概括,也可以對無形的加以抽象概括,例如“水果”的表象,這一表象的形成可以說是用若干不同種類的水果培養出來的,也可以說是由“蘋果”、“梨”等等表象的神經鏈路的共用部分完善而成的,后一種方式可以理解為抽象概括可以建立在另一種抽象概念之上,即對無形的事物也可以做抽象概括。換個角度講,這些抽象出來的表象本身就是一種有形的物質,它是由若干神經元搭建起來的網絡系統,是客觀存在的東西,這樣的話就與第一種方式相一致了。
語言是生物間交流的工具,是生物為了更好的適應周圍的環境而進化產生的,在這里它包含有聲音、文字、動作、行為以及低等生物的化學接觸等等內容。就拿我們人類來說,每一個發音、每一個文字符號都可以說是對應著一種表象,這個表象可以是抽象出來的也可以是具體事物產生的。語言是通過觸發來進行工作,當然也可以說是一種反射或是因果現象。無論是說還是聽,也不論是寫還是看,對于說或者是寫這種輸出性質的處理,可以解釋為某個表象被激活時,它又被作為輸入信號沿著該表象至發音或是運動器官間的語言神經鏈路傳遞電信號,直至發音或是運動器官做出相應的動作。聽與看也是如此,感官接收到信息后傳遞直至激活某一個表象區域(請參見圖4)。語言與表象之間廣泛存在著對等映射關系,它可以使我們能夠直接去運用語言來進行思維,即便是表象與輸入輸出沒有語言神經鏈路對應關系的,如果需要我們也會臨時的建立起語言神經鏈路,如本文中說的圖幾圖幾、這個那個等等,或者用相關的有語言鏈路的表象通過塑造、闡述、刻畫、定位等等方式來體現或是建立該表象,這種建立神經鏈路的過程往往體現出不同種類的記憶模式。
生物的記憶過程與機械的存儲過程原理基本相同,都是通過改變載體的性狀來表達的,只是生物是通過神經網絡的響應過程來表達或再現記憶的內容,就是說該神經網絡的連接結構就反映著記憶的內容,所以生物的記憶過程就是建立特定連接方式的神經網絡的過程,而提取過程就是激活這部分神經網絡的過程。一旦載有相關記憶內容的神經網絡結構被確定時,能量只能體現在信息的提取與再現上,當然維持這種結構也需要一點能量,不然神經元就餓死了:)注意:這里強調的是“過程”。
生物的認知過程對外表現為學習過程,對內表現為神經網絡的建立及使用過程,在學習過程中往往會同時伴隨著反饋過程(內反饋或外反饋),生物從外界獲得信息,傳遞處理后再作用給外界,并同時獲取作用后新的信息,周而復始的運做,這就是外反饋過程。外反饋過程是依靠外界因素幫助或是引導或是促使生物個體建立起能與環境相協調運做的神經網絡系統,主觀上我們稱之為“教育”。內反饋主要體現在我們的思維活動上,通常外界事物在大腦中存在著對應的表象,被外反饋完善了的事物表象之間同樣可以建立起互動聯系,比如講一個事物的表象被激活(輸入),引發其他的表象也被激活(輸出),這些被激活的表象同樣也可以作為輸入去激活先前的或是其他的表象,然后周而復始的運做,使得信息得以在腦內進行反復的處理。內反饋過程實際上就是一種“自學”的過程,但它的激發源頭必定是與外界有關,并且最終要作用于外界,所以說內外反饋往往是兼而有之的。
在認知過程中隨著內反饋的素材(表象)不斷增多,生物個體漸漸能夠認知自身與外界間的互動關系,自我意識也就隨之產生,同時我們用以進行思維的素材及其運作方式,如概念,詞匯以及由這些材料所帶來的情感因素及組織方式等等,絕大部分都來源于前人或者是借用他人的經驗,生物個體對這些經驗素材的獲取,或是由于接觸的幾率的不同,或是由于認同的程度的高低,個體間總會存在著差異,這樣就產生了我們不同的個性特征。
3、創造
生物在與周圍環境發生相互作用時,不可避免的會對周圍的環境造成一定的影響,無論是主動的還是被動的,這些對環境的影響最終都是為了促使生物以更好的適應周圍的環境。遵循優勝劣汰的法則,好的影響將會被保留繼承下去,如搭窩、建巢、獲取食物等等,而壞的影響會增加生物生存的風險。
神經網絡在認知事物后,事物的表象往往不是特定對應著某一個具體事物,而是對應著在一個模糊的范圍內所含闊的一類事物。例如,我們認知的蘋果,泛指各種各樣的蘋果,甚至還包括那些嫁接出來的長的象其他水果的蘋果等等。在我們依據蘋果的表象勾勒出一個具體的蘋果時,這個蘋果將肯定不會與客觀世界中的任何一個蘋果相同,因為沒有兩樣東西是絕對相同的。產生一個客觀世界不存在的事物,就是創造,其過程就是創造的過程。
生物神經網絡中事物的表象往往穿插交錯在一起,它們以鏈路最省的方式構成。任何神經鏈路上的合并都可以說是事物的某一特征在某一層次上的概括,所以表象可以以不同的內涵層次來拆分成各種各樣的屬性單元(元素),而任何神經鏈路上的分支都可以說是事物的某一特征在某一層次上的副本,使得這些屬性單元也能夠隸屬于別的表象或是說用于構建(表達)別的表象,當若干種屬性單元在某一時刻都處于激活狀態時,就等同于一種表象被激活,無論這個表象是否對應著客觀世界中的事物,如果沒有對應關系那就是一個較高形式的創造過程。
創造的幾種主要的表達形式:聯想、推理、頓悟
a、聯想
當一個事物的表象被激活時,也就是說該表象所包含的若干屬性單元(元素)同時有效時,我們的注意力焦點就集中在這個表象上,如果對該表象的處理(內或外反饋)使的表象被否決時,也就是說由于一些屬性單元的失效(或被抑制,或處于高阻),導致該表象無法成立的時候,剩余的屬性單元或許可以構成另一種事物的表象,或許還需要結合那些被激活了的新的屬性(或是由外界事物具有的新的屬性所激活,或是因降低了對一些屬性的抑制所導致的激活)。
b、推理
聯想是一種去激活與事物表象相關聯的其他表象的過程,主觀上是一種橫向擴展的過程,那么縱向過程就是由于一個或若干個事物表象被激活,從而導致另一個表象也被激活的過程,即推理過程,其中的任何一個表象的確立(激活)都會通過反饋過程加以驗證。推理與聯想在神經網絡結構上十分的相似,功能上也基本相同,只是在主觀認識上,聯想更強調相關性或是相似性,而推理則強調的是次序性或層次性。
c、頓悟
當我們思考一件事情時,或設計一件東西的時候,常常會遇到百思不得其解的情況發生,但有時,在某個偶然的事件影響下,我們會突然明白或能夠解決這些問題,這就是頓悟現象。
事物的表象是由若干個神經網絡屬性單元所構成的,我們說的“問題”在大腦中也是一種表象,是一種經反饋過程沒有驗證通過的特殊的表象,這個表象的屬性單元可能包括具體的事物表象、抽象的事物表象、邏輯關系、公理、定律等等內容,但這些屬性同時有效時,問題的表象并不能通過內外反饋的驗證。作為一個急切需要解決的“問題”,“問題”的表象被反復的激活(深思熟慮反復思考),在一個偶然機會,一個別的事件表象被激活,或是因為此事件的某個屬性單元彌補了“問題”表象的一個重要的空缺;或是因為此事件“問題”表象中的某個關鍵的屬性單元被抑制失效,“問題”表象得以完善并能夠通過反饋驗證,這就是頓悟。
四、神經網絡的相關問題
人在成長過程中,他的學習過程就是構建相應神經網絡結構的過程,隨著認知程度的增加,網絡結構也日趨復雜,對刺激的反應過程也隨之復雜化,當復雜到無法預測時,主觀上就會認為反應過程是自發產生的,這是人的一種錯覺。
幼年,人腦神經網絡的建立過程需要大量的空閑神經元,基本雛形確定后,剩余的空閑神經元會損失大半,這樣才能夠給網絡的發展騰出空間。余留下來的空閑神經元或是成為新建神經鏈路中的一部分而被確定下來;或是被用于臨時搭建的某些鏈路;或是作為備用存在于網絡的空隙當中。
青少年,神經網絡屬于高速建立階段,這個階段的神經網絡可塑性極強,主要是因為針對事物的認知,即是以機械性記憶為主,對事物認知的量及內容是抽象邏輯思維建立的基礎及傾向,隨著量的增加抽象概括的能力會逐漸增強。
中青年,事物的認知量及邏輯思維能力的配比達到了最佳程度,不光有一套較好的能與外界交互的神經網絡系統,而且神經網絡還保留有發展的余地,即還保留有一定的可塑性。
中年,無論是抽象事物還是具體事物,認知量已基本確定,網絡的結構已日趨復雜化,在一些局部,需要修改的或是新建的神經鏈路對空閑神經元的需求也已日趨緊張,使得我們的認知速度逐漸減慢。
老年,在許多的神經網絡區域,空閑的神經元已開始滿足不了認知的需求,另外因為無法認知新的事物,對外界的反應能力也開始下降,連帶的相關神經區域得不到激活,神經鏈路的健壯性開始下降,以至于一些神經鏈路解體,伴隨的就是認知量的下降,即健忘等等現象,并且成為一種惡性循環發展下去……。
五、后記
為了能清楚的闡述它的運行機制,同時也是為了驗證這套理論,根據前面所提到的神經元的結構功能及組網方式,我通過計算機軟件設計了虛擬的神經網絡系統,2000年軟件完成了調試,并得到了很好實驗結果。
參考文獻
1《現代科學育兒答疑》(0-3歲)人民教育出版社1999年第1版
2陳守良等,《人類生物學》,北京大學出版社,2001年12月
3陳閱增等(1997).《普通生物學》.北京:高等教育出版社
4蘇珊·格林菲爾德,《人腦之謎》楊雄里等譯
5陳宜張《分子神經生物學》人民軍醫出版社1997年2月
6伊·普里戈金、伊·斯唐熱著、曾慶宏、沈小峰譯《從混沌到有序》,上海譯文出版社1987年版。