高維的強相關數(shù)據(jù)的模型選擇.pdf_第1頁
已閱讀1頁,還剩117頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、本論文從模型選擇的角度研究如何處理高維的,強相關的,多維共線性又帶有噪音的數(shù)據(jù)。主要包括三章:
   第二章,我們提出了一種用于多主成份的光譜數(shù)據(jù)分析的波長區(qū)域選擇算法,即彈性網(wǎng)結合偏最小二乘的組變量選擇方法(EN-PLSR)。EN-PLSR算法通過兩步能夠自動地選擇連續(xù)的,強相關的預測變量波長區(qū)域。首先,一些與響應變量相關的預測變量被選擇出來并根據(jù)彈性網(wǎng)估計子的組效應分成一些子變量組。每個子變量組中的變量都是強相關的。然后我們

2、在交互驗證的均方根誤差(RMSECV)的標準下,提出了留一組的策略用來進一步的收縮變量,降低模型復雜度。現(xiàn)實的近紅外數(shù)據(jù)實驗結果表明,EN-PLSR算法比全譜的最小二乘方法和移動窗最小二乘方法效果要好,特別是當數(shù)據(jù)集呈現(xiàn)強相關的時候。
   第三章,我們同樣從組變量選擇的角度考慮強相關的多維共線性的數(shù)據(jù)的變量選擇和模型估計問題,提出了一種新穎的組變量選擇方法:權融合彈性網(wǎng)(WFEN)。WFEN結合了分別由彈性網(wǎng)和權融合LASSO

3、懲罰誘導出的兩種組變量選擇機制,能很好地統(tǒng)一在LASSO的框架上并能用有效地解出。我們利用模擬的和真實的數(shù)據(jù)檢驗WFEN模型,結果表明我們的算法與其他的LASSO類型的方法相比在處理多維共線性性數(shù)據(jù)時有較大的優(yōu)勢。
   第四章,我們提出了一種用于用于研究化合物的生物活性與描述子之間的所謂的結構.活性關系(SAR)的非線性分類方法。該方法主要由核主成份分析和線性支持向量機組成(KPCA+LSVM),我們用KPCA去除數(shù)據(jù)中的噪音

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論