稀疏優(yōu)化在機器學習中的若干應用.pdf_第1頁
已閱讀1頁,還剩141頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、近年來,利用解的稀疏性和其他內在結構成為眾多計算和工程領域中共同關注的問題.稀疏的內含不僅是指“只有很少的非零分量”,它蘊含著“具有一種簡單結構”.本文對機器學習中不同問題的稀疏結構進行建模,并在必要時改進經典的稀疏優(yōu)化算法進行求解.論文的主要工作可概括如下:
  1.第2章給出了本文在解決不同的機器學習問題中所提出的稀疏優(yōu)化模型及算法.所提出的稀疏優(yōu)化模型有同樣的抽象結構,即在一個具有某種簡單或特定結構的假設空間上極小化某個損失

2、泛函.本文中給出的盒子約束的Lasso模型及塊PCA模型均具有這一結構.該章給出了求解盒子約束的Lasso模型的同倫算法及求解塊PCA模型的Splitting算法.
  2.第3章研究了求解盒子約束的Lasso模型的同倫算法的收斂性并檢驗了該算法的數值性能.該章的工作指出同倫算法收斂性不是顯然成立.在無退化指標假設和其它較弱的條件下,該章證明了同倫算法具有有限終止性.另外,該章討論了退化和循環(huán)的問題.當前已有眾多算法可求解該模型,

3、但數值實驗證明同倫算法具有特別的優(yōu)勢:適于最優(yōu)解非常稀疏的問題及需要計算整條正則化路徑的情形.這是第4章協同過濾數據可預測性問題的計算中所采用的關鍵技術.
  3.第4章研究了協同過濾問題中評分數據的可預測性問題.當前協同過濾方面的大部分工作主要研究算法性能的改進.該章指出,受評分數據自身的限制,評分矩陣中有一部分未知評分是難于給出準確預測的.第4章提出了一個新的度量——相關性,以度量用戶在某個商品上的評分能被準確預測的可能性.一

4、個用戶一商品對的相關性由相關的用戶和商品構成的社區(qū)所確定.作為相關性度量的應用,提出了基于數據的組合方法(DOC)以應用于推薦系統.
  4.第5章研究從時間序列基因表達數據中推斷基因正則化網絡(GRN).由于計算復雜度較大,大部分GRN重建方法僅限于推斷較低連通性的單個網絡.該章提出了網絡和社區(qū)識別方法,結合社區(qū)結構信息,從基因表達數據中推斷多個子網絡.其中的塊PCA模型,通過第2章給出的Splitting算法,可有效求解網絡中

5、的社區(qū)結構.
  5.第6章研究了作為蛋白質鑒別關鍵步驟的肽段識別問題.序列數據庫搜索是當前肽段識別的主流方法.但搜索引擎給出的大量的匹配是不正確的.現有方法大多基于半監(jiān)督或監(jiān)督學習框架,充分利用了誘騙PSM的樣本及標簽信息,但目標PSM樣本點自身信息沒有被充分利用.該章提出了一個稱為FC-Ranker的新的評分方法,給每個目標PSM賦予一個非負權重,反映其匹配正確的可能性.特別地,FC-Ranker通過模糊支持向量機分類模型和所

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論