圖數(shù)據(jù)庫頻繁模式挖掘關鍵技術研究.pdf_第1頁
已閱讀1頁,還剩81頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、從圖數(shù)據(jù)庫挖掘頻繁模式在化學信息學、計算生物學、WEB信息管理、社會網(wǎng)絡分析等領域有著廣泛的應用。因此本文重點研究了從圖數(shù)據(jù)庫中挖掘頻繁模式的關鍵技術,并針對頻繁模式挖掘所面臨的效率瓶頸、結果集龐大以及高復雜、冗余性等問題,在本文中提出了基于隨機化挖掘極大頻繁子圖的方法RMPM、挖掘具有代表性頻繁子圖的算法FRSM、InRSM。本文的主要研究成果有:
   1.隨機化方法在挖掘海量數(shù)據(jù)集時非常高效,但是因為隨機性,會造成結果的重

2、復發(fā)現(xiàn),勢必造成很多重復和無用的子圖同構計算。本文提出的基于隨機化挖掘極大頻繁子圖的方法RMPM,通過對已挖掘到的結果建立索引,提高了隨機算法的效率。在真實和模擬數(shù)據(jù)集上的實驗結果也證實了RMPM算法是高效、可伸縮的。本文提出的隨機算法的思想是通用的,可以應用于各種各樣的模式,比如自由樹、項集等,在真實數(shù)據(jù)集上挖掘極大頻繁自由樹的實驗結果也證實了RMPM算法是通用的。
   2.為了壓縮頻繁模式集合,挖掘出更小、更有代表性的頻繁

3、模式集合,本文提出了挖掘具有代表性頻繁模式的算法FRSM,算法第一步采用本文提出的效率更高的RMPM算法作為頻繁模式挖掘算法,第二步在RMPM結果集上聚類,在聚類時,綜合考慮頻繁子圖在事務空間上的相似性和模式空間上的相似性,使得聚類的質量更好,獲得的模式更具代表性。在大量的實驗上也證明了FRSM算法所得到的代表模式集合比不考慮或只考慮模式在事務空間上的相似性的聚類所得到的模式更具代表性。
   3.本文也提出直接從圖數(shù)據(jù)庫中挖掘

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論