基于語義網的Web資源管理研究.pdf_第1頁
已閱讀1頁,還剩79頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、獨創(chuàng)性聲明本人聲明所呈交的論文是我個人在導師指導下進行的研究工作及取得的研究成果。本論文除了文中特另]/Jrl以標注和致謝的內容外,不包含其他人或其他機構已經發(fā)表或撰寫過的研究成果,也不包含為獲得南京信息工程大學或其他教育機構的學位或證書而使用過的材料。其他同志對本研究所做的貢獻均已在論文中作了聲明并表示謝意。學位論文作者簽名:塞3盎簽字日期:2Ql!:選:2Z關于論文使用授權的說明南京信息工程大學、國家圖書館、中國學術期刊(光盤版)雜

2、志社、中國科學技術信息研究所的《中國學位論文全文數(shù)據(jù)庫》有權保留本人所送交學位論文的復印件和電子文檔,可以采用影印、縮印或其他復制手段保存論文,并通過網絡向社會提供信息服務。本人電子文檔的內容和紙質論文的內容相一致。除在保密期內的保密論文外,允許論文被查閱和借閱,可以公布(包括刊登)論文的全部或部分內容。論文的公布(包括刊登)授權南京信息工程大學研究生院辦理。日公開口保密(——年——月)(保密的學位論文在解密后應遵守此協(xié)議)學位論文作者

3、簽名:亟違盤簽字日期:絲!!:叢:羔2指導教師簽名:簽字日期:摘要隨著互聯(lián)網的迅速發(fā)展,Web資源急劇膨脹,目前已成為最重要的網絡資源。W|eb資源管理的主要目的是讓人們準確、迅速的從多而雜的Wreb資源中找到感興趣的信息,將大量無序的信息提取出并用結構化方式表示,以便于對資源的進一步操作。本文結合語義網技術對Web資源的獲取、識別、分析、抽取、結構化表示和查詢等進行了研究。本體是關于概念及概念間關系的描述;RDF(ResourceDe

4、scriptionFramework)是語義網中用來描述資源的通用框架,使用RDF技術描述Web資源可以為Web資源賦予語義信息,提高資源管理的效率;目前已經出現(xiàn)多種查詢RDF的語言,本文使用的SPARQL(SPARQLProtocolandRDFQueryLanguage)i吾言支持各種平臺和語言,對本地或遠程使用都適合。本文的主要研究內容和成果如下:(1)Web資源獲取與解析。本文采用通過HTTP協(xié)議直接獲取Web資源的方法,獲取W

5、eb網頁;再使用微軟的開源庫將網頁轉換成XML格式,通過遍歷XML中所有節(jié)點,將有用信息轉換成DOM樹,最后使用相關控件將DOM樹從內存中讀取出來,以實現(xiàn)Web資源解析;(2)Web資源抽取。結合用戶的需求和本體文件,生成抽取規(guī)則;并根據(jù)抽取規(guī)則遍歷DOM樹,完成Web資源的抽?。粚⒈倔w引入信息抽取過程,可以解決同義詞或多義詞等問題,抽取結果包含了更多用戶感興趣的信息;(3)Web資源的RDF表示。通過對Redland庫進行二次開發(fā),將

6、抽取結果用RDF/XML語法表示并存儲在XML/RDF文件中;RDF技術的應用使得抽取結果帶有更多的語義信息,更容易被機器處理;(4)Web資源的查詢。通過研究SPARQL語言的語法、語義以及具體使用等,可以對抽取結果進一步處理。在以上研究工作的基礎上,本文設計并實現(xiàn)了一個Web資源管理系統(tǒng)。該系統(tǒng)主要包含Web資源獲取與解析、Web資源抽取、Web資源表示并對抽取結果進行查詢等功能;本系統(tǒng)簡單易用,用戶并不需要具備專業(yè)知識就可以找到自

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論