基于進化算法的本體匹配問題研究.pdf_第1頁
已閱讀1頁,還剩120頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、本體是最新的一種信息交換參考模型,它是迄今為止用于獲取最準確的語義規(guī)范化描述的技術。然而,由于本體設計者的主觀性,對于同一個領域中的同一對象可能會有不同的描述方式(同一個概念在不同本體中可能會有不同的名字),這就直接導致了術語和概念描述不一致的異質本體的產生(即語義異質問題)。為了克服這一問題,在實現(xiàn)語義層面交互的同時充分利用本體靈活的表達能力,目前普遍認可的可行方法是執(zhí)行本體匹配過程。本體匹配過程通過確定本體中語義相關的實體間的對應關

2、系來實現(xiàn)本體間的相互通信。由于本體匹配問題通常可以建立成一個復雜的(非線性且有許多局部最優(yōu)解)和耗時的(尤其當本體的規(guī)模龐大時)優(yōu)化模型,因此通常會采用近似的方法來確定本體匹配元素以求解本體匹配問題。從這個角度來看,進化算法是一種求解本體匹配問題的有效算法。然而,已有的基于進化算法的本體匹配系統(tǒng)都存在以下五個缺陷:
  (1)經典進化算法的收斂速度慢和早熟收斂問題使得這些系統(tǒng)無法有效地確定大規(guī)模的和復雜問題的最優(yōu)解;
  (

3、2)在求解的過程中需要專家事先提供標準的本體匹配結果,而這種標準的本體匹配結果在實際的應用場景中是很難獲得的;
  (3)無法一次同時匹配多對本體,即同時為不同的待匹配本體對確定一個統(tǒng)一的參數(shù)配置;
  (4)由經典的質量度量指標f-measure引起的質量度量偏好導致本體匹配結果的質量不高;
  (5)無法一次提供多組不同的本體匹配結果以滿足決策者不同的要求。針對上述的缺陷,本文的研究工作主要圍繞本體匹配領域中的單目

4、標和多目標優(yōu)化問題展開,全文的內容可概括為以下幾個方面:
  (1)建立了基于部分參考匹配結果的本體元匹配單目標優(yōu)化模型,提出了基于部分參考匹配結果的度量方法并進一步提出一種本體概念聚類算法以構建部分參考匹配結果,并在此基礎上提出了一種基于部分參考匹配結果的混合Memetic算法的本體匹配方法,給出了用混合Memetic算法求解基于部分參考匹配結果的本體元匹配單目標優(yōu)化模型的詳細步驟:預處理程序、混合Memetic算法個體編碼方案

5、、遺傳算子和局部搜索算法。實驗采用本體匹配領域公認的測試數(shù)據(jù)集,即本體匹配評價競賽(Ontology Alignment Evaluation Initiative,OAEI)的Benchmark測試數(shù)據(jù)集,提出了混合Memetic算法的本體匹配方法的參數(shù)選擇原則并給出了具體的參數(shù)配置。實驗結果表明,基于本體概念聚類方法構建的部分參考匹配結果的混合Memetic算法能比基于隨機方法構建的部分參考匹配結果的混合Memetic算法找到更好的

6、解,這些解的質量不僅十分接近基于參考匹配結果的方法而且解的查準率都很高。Wilcoxons測試結果表明本章提出的方法在性能上比起經典的基于進化算法的本體匹配系統(tǒng)GOAL的平均的改進程度為47.33%?;诓糠謪⒖计ヅ涞幕旌螹emetic算法也能夠克服經典遺傳算法的早熟收斂問題,從而獲取比基于經典的進化算法的本體匹配系統(tǒng)以及其他前沿的本體匹配系統(tǒng)質量更高的解。
  (2)建立了基于無參考匹配結果的本體元匹配單目標優(yōu)化模型,提出了基于

7、無參考匹配結果的度量方法,并進一步提出采用一致性度量比率(Unanimous Improvement Ratio,UIR)結合基于無參考匹配結果的度量方法來共同度量本體匹配結果的質量,以克服質量度量的偏好問題并實現(xiàn)同時匹配多對本體(即為多對本體提供一致的最優(yōu)參數(shù)匹配方案),并在此基礎上提出了一種基于無參考匹配結果和UIR的混合Memetic算法的本體匹配方法。實驗數(shù)據(jù)采用OAEI2012的Benchmark測試數(shù)據(jù)集,實驗的結果表明基于

8、無參考匹配結果的度量方法和一致性改進比率度量的混合Memetic算法不需要專家事先提供標準的本體匹配結果、能夠同時匹配多對本體、在克服質量度量偏好問題的同時能夠獲取比前沿的本體匹配系統(tǒng)質量更高的解。
  (3)建立了以查全率和查準率為目標的本體元匹配多目標優(yōu)化模型,給出了通過進化算法求解本體匹配多目標問題的動機和多目標進化算法的Pareto前沿中代表性解的選擇方法,分別采用NSGA-II和MOEA/D求解本體元匹配多目標優(yōu)化模型。

9、提出了一種自適應的相似度集成策略以提高NSGA-II的求解效率,給出了MOEA/D優(yōu)化目標的分解方法和算法的實現(xiàn)細節(jié)。實驗數(shù)據(jù)采用OAEI2012的Benchmark測試數(shù)據(jù)集,T-test靜態(tài)分析結果表明基于自適應的相似度集成策略的NSGA-II的本體匹配方法和基于MOEA/D的本體匹配方法都可以找到比基于傳統(tǒng)進化算法的本體匹配系統(tǒng)和其他前沿的本體匹配系統(tǒng)相同的或是更好的解。此外,通過Wilcoxons測試的結果表明基于MOEA/D的

10、本體匹配方法在性能上優(yōu)于基于NSGA-II的本體匹配方法。
  (4)建立了以查全率和查準率為目標的本體匹配多目標優(yōu)化模型,提出了新的實例相似度度量技術和相似度擴散算法,設計了新的個體編碼方案,并在此基礎上提出了一種基于實例的NSGA-II本體匹配方法。實驗數(shù)據(jù)采用OAEI2012的Benchmark、Anatomy和Library測試數(shù)據(jù)集,實驗結果表明基于實例的NSGA-II本體匹配方法獲取的本體匹配結果的質量在前沿的本體匹配

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論