改進(jìn)的遞推主元分析及遞推主元回歸算法
程龍,王桂增
(清華大學(xué)自動(dòng)化系,北京100084)
摘 要:為了加速模型在線更新的速度以更好地適應(yīng)實(shí)際工業(yè)過(guò)程的動(dòng)態(tài)變化,通過(guò)在已有遞推主元分析(PCA)算法的基礎(chǔ)上簡(jiǎn)化了自相關(guān)矩陣的遞推公式,從而改進(jìn)了基于秩1更新的遞推PCA算法,把原來(lái)需要進(jìn)行2次秩1更新的步驟簡(jiǎn)化為僅僅需要進(jìn)行一次秩1更新,并在此基礎(chǔ)上提出了遞推主元回歸算法。仿真結(jié)果表明,改進(jìn)后的基于秩1更新的遞推PCA算法比原來(lái)的基于秩l曼新的遞推PCA算法縮短了近一半的運(yùn)算時(shí)間,而新的遞推主元回歸算法,不但能夠適應(yīng)工業(yè)過(guò)程的動(dòng)態(tài)變化,并且比批處理的方式節(jié)約了存儲(chǔ)空間與計(jì)算時(shí)間。
關(guān)鍵詞:遞推主元分析;自相關(guān)陣;秩1更新;遞稚主元回歸
中圖分類號(hào):TP 27 文獻(xiàn)標(biāo)識(shí)碼:A
Improved Recursive PCA a nd Recursive PCR Algorithms
CHENG Long,WANG Gui-zeng
(Department ofAutomation.Tsinghua University,Beringl00084,China)
Abstract.To accelerate the model 0n-line modificatlon a nd accommodate the industrial process change,an efficient recursive PCA al-gorithm using rank-one modification a nd a novel recursive PCR algorithm are proposed by improving the approach of updating correlationmatrix Simulation resuits show that the improved recursive PCA based on rank-one modification shotren the computational time in con-trast with the existing recursive PCA algorithm Moreover.the recursive PCR algorithm Call adapt process changes a nd need less corn-puting time a nd memm?usage than batch PCR algorithm
Key words:reellisive PCA;coneiation matrix;rank-one modification;recursive PCR
1引言
主元分析(PCA)是一種將多個(gè)相關(guān)變量轉(zhuǎn)化為少數(shù)幾個(gè)相互獨(dú)立變量的統(tǒng)計(jì)分析方法。
主元分析由Pearson[1]最早提出,后經(jīng)Hoteling[2]加以改進(jìn)。主元分析可以將很多相關(guān)過(guò)程變量壓縮為少數(shù)獨(dú)立的變量,因此被廣泛應(yīng)用于過(guò)程監(jiān)控[3],故障診斷[4]等領(lǐng)域。
實(shí)際的工業(yè)過(guò)程通常表現(xiàn)出時(shí)變特性,用主元分析法建立的模型隨著時(shí)間的推移將出現(xiàn)明顯的偏差,為此,需及時(shí)對(duì)模型進(jìn)行更新,而如果采用將新數(shù)據(jù)和舊數(shù)據(jù)結(jié)合重新進(jìn)行主元分析,計(jì)算量很大。針對(duì)上述情況,Wold提出了指數(shù)加權(quán)平均主元分析的方法[5],Rigopoulos等提出了滑動(dòng)窗結(jié)合主元分析的方法[6],而Liw H等提出了遞推PCA算法[7],對(duì)數(shù)據(jù)矩陣的均值、標(biāo)準(zhǔn)差進(jìn)行遞推更新,從而遞推求出規(guī)范化后的數(shù)據(jù)矩陣,進(jìn)而得出自相關(guān)陣的更新公式,最后利用秩1更新得出負(fù)荷向量和得分向量。
本文針對(duì)Li WH等提出的遞推PCA算法,簡(jiǎn)化了自相關(guān)陣的遞推公式,改進(jìn)了基于秩1更新的遞推PCA算法,并給出了輸入輸出變量協(xié)方差矩陣的遞推公式,提出了一種新的主元回歸遞推算法(PCR),仿真實(shí)驗(yàn)證明了方法的有效性。
2改進(jìn)的遞推PCA遞推算法
1)基于秩1更薪的遞推PCA算法定義全部k個(gè)原始輸入數(shù)據(jù)塊組成的矩陣為
其中,每一行代表一個(gè)樣本,每一列代表一個(gè)輸入變量。
全部(k+1)個(gè)原始數(shù)據(jù)塊組成的矩陣為Xok+1形式與Xok相同。若前K個(gè)數(shù)據(jù)塊長(zhǎng)度為Mk,考慮每采樣一次進(jìn)行一次遞推,則包括新來(lái)數(shù)據(jù)的所有(k+1)個(gè)數(shù)據(jù)塊的長(zhǎng)度為Nk+1=Nk+1。Weihua Li H指出[7],每當(dāng)新數(shù)據(jù)x0k+1來(lái)時(shí)。可以遞推計(jì)算出原始輸入數(shù)據(jù)矩陣中各變量的均值、標(biāo)準(zhǔn)差和規(guī)范化后的輸人數(shù)據(jù)矩陣,進(jìn)而得出自相關(guān)陣的遞推公式。
均值向量的遞推式為
|