January 19, 2009

參考文獻----下一代網際網路-語意網Semantic Web

下一代網際網路-語意網

網站系統已由資訊檢索進步到提供更有價值的資訊,目前知識性的服務有幾個研究正在進行,大多數為 Q&A。

Q&A 有兩種型式,一種是直接回答問題,一種是Answer extract,直接從文件中把答案抽出,

這答案可能是一個句子,這些研究自動化的成效目前並不夠好。

全球資訊網(WWW)發明人Tim Berners-Lee提出讓電腦可以瞭解人類語言的語意網(Semantic Web),把全球資訊網上的資料,變成電腦能理解的資料型態,讓網路能理解人類所輸入的字真正的意涵,進而提供更好、更方便的全球資訊網。為了讓電腦能達到這種境界,必須利用知識本體(Ontology),把人類所輸入的字進行剖析、推理以找出人類真正想要的資訊內容。

知識本體(ontology) 按字面意思解釋是「存有的知識」(knowledge of being)或是「存有之為存有的理論」,

由於存有與非存有、真實存在與表現的區分,因此本體論是論述事物與探究事物本質的學問,這是從哲學中引用而來的。

知識本體(ontology)在電腦科學是指某一個領域知識中相關的術語(詞彙)的集合,

這些專業術語(詞彙)都有明確定義與描述,可以用來陳述領域知識中的某一概念,也可以陳述概念與概念之間的關聯。

在真實世界的每一個領域(domain)都會有一個被定義的Ontology,這就是知識本體。

同一個術語(詞彙),在不同的領域、在不同的時代背景、不同的用法、其意義就不一樣。

所以,當進行網路搜尋時經常會獲得一大堆沒有用的資料。例如輸入「病毒」,也許指的是電腦中「病毒」,這是屬於電腦科學領域;但是也會找到醫學領域的資料,因為它們是使用相同的語詞。電腦系統並不知道每個詞彙屬於哪個領域,所以搜尋者必須要定義這個詞彙代表什麼意義,屬於哪個領域,而且還要定義詞彙之間的關係。

發展知識本體應包含下列四個步驟:定義知識本體中的類別(Class)、定義類別與類別之間的階層關係、定義類別中的屬性,

並且說明屬性值的限制,完成以上四個步驟才算是建構符合某個領域知識本體的特定個體。

知識本體區分為以下三類,可以根據需求選用不同的知識本體:

(1)上層知識本體(Top-level Ontology):描述最一般化的概念,例如空間、時間、事件、行動等,獨立於特定的問題與領域,作為大眾溝通的工具,可以說是真實世界中的常識。

(2)領域知識本體與作業知識本體(Domain Ontology and Task Ontology):定義或描述特殊領域(圖書分類)的相關知識,領域知識本體如同專家的專門知識,每一份專業知識都記載該領域中的事物。

(3)應用知識本體(Application Ontology):使用屬性、關係進行定義與描述真實世界中特定領域的知識。

目前知識本體的建構大多數是延伸XML 語法延伸,採用W3C 制定的RDF(Resource Description Framework) 、

RDFS(Resource Description Framework Schema) 二種知識本體語言。

RDF( Resource Description Framework,資源描述架構)是一種通用目的描述語言(general–purpose language ),

描述全球資訊網的資源及其相關的描述性資訊。

透過簡單與一致性的描述介面,使用屬性描述任何一種具有URI(Uniform Resource Identifier)的資源,

以及它與其他資源之間的關係。RDF 模型中最基本的元素是三元結構(triple)。

三元結構的構成三要素是主體資源(Subject)、述語資源(Predicate)、與目的資源(Object)。

R D F 無法描述一個資源所應擁有的屬性有哪些,以及這些屬性與其他資源之間的關係。

RDFS(資源描述架構綱要,RDFSchema ) 是RDF 的中介資料(meta-data),其內容定義基礎的詞彙,

RDF 可以依據這些辭彙來描述資源。

Tim Berners-Lee 對網路有二個夢想。第一個夢想是所有的人都可以透過全球資訊網(www)共享知識。

第二個夢想是電腦可以瞭解人類的語言,未來的網路是語意網(Semantic Web)。

柏納李提出以URI( Universal Resource Identifier) 、HTTP(Hypertext Transform Protocol)

以及HTML(Hypertext Markup Language)三要素所建構的全球資訊網(WWW)已經帶來革命性的改變。

Today's Visitors: 0 Total Visitors: 18
Personal Category: Uncategorized Articles Topic: technology / network / internet
[Trackback URL]

Post A Comment









Yes No



Please input the magic number:

( Prevent the annoy garbage messages )
( What if you cannot see the numbers? )
Please input the magic number

誰來收藏
Loading ...
unlog_NVPO 0