• <i id="549yd"></i>
  • 
    
  • 現在位置:范文先生網>教學論文>綜合教育論文>數字圖書館體系結構的發展

    數字圖書館體系結構的發展

    時間:2023-02-20 10:11:06 綜合教育論文 我要投稿
    • 相關推薦

    數字圖書館體系結構的發展

     【內容提要】首先介紹了目前大多數數字圖書館所遵循的基本的數字圖書館體系結構,該結構在功能上可劃分為四個邏輯組件:資源庫、命名系統、索引/搜索系統、用戶界面。然后介紹了NSDL、NCSTRL兩個最大的數字圖書館項目在體系結構的關鍵問題方面的實踐,最后,作者提出了數字圖書館體系結構發展的看法。
    【摘  要  題】專題探討
    【【關  鍵  詞】體系結構/互操作
          1 介紹
      世界上有許多國家進行數字圖書館的建設,但到目前為止,并不存在一個通用的數字圖書館體系結構,這是由于信息技術和相關標準不斷發展的結果,怎樣基于現有的技術并考慮到未來技術的發展,構筑一個靈活強大的數字圖書館體系結構,對于數字圖書館的建設是至關重要的,這需要我們了解相關技術和標準以及數字圖書館體系結構的發展變化。
      數字圖書館要為用戶提供各種簡單易用、功能強大的知識服務,通常從功能上可將數字圖書館劃分為:用戶界面、命名服務、搜索系統、資源庫等部分。數字圖書館的建設涵括各種數字資源的創建、管理、查詢、利用、存儲的整個過程。自從  william  Y.Arms等于1997年提出了數字圖書館的信息體系結構以來[1],數字圖書館的體系結構在不斷完善和發展,通過許多試驗項目仍在不斷改進。圖1代表了數字圖書館的基本體系結構。
      附圖
      圖1 數字圖書館的基本體系結構
      資源庫
      資源庫的功能包括存儲和管理各種數字對象,通常是由關系型數據庫來管理。應用程序通過資源庫提供的庫訪問協議(RAP)來訪問資源庫?蓪崿F存儲、訪問、復制、移動和刪除數字對象等操作。
      與web上的信息所不同,數字圖書館中數字資源是以數 字對象的形式進行封裝的,一個數字對象包括:
     、僖粋全球唯一的獨立于地址的長期標識符;
     、跀底仲Y料,存儲數字圖書館的資料,也就是最終用戶需要獲取的信息內容,如經XML置標后的文本、一本電子圖書等,
     、墼獢祿,關于數字資料的數據。一般情況下,元數據有三種:a.描述性元數據,用于發現和標識一個對象,如MARC和Dublin  Core。b.結構性元數據,為用戶顯示和導航一個對象(包括該對象的內部組織信息),如一本書由章節組成。c.管理性元數據,描述該對象的管理信息;創建日期、文件的格式、訪問權限、知識產權問題等。
      命名系統
      命名系統是針對長期標識符的分配、管理及解析的一個綜合系統,CNRI為數字圖書館提出了完整的命名系統“調度系統(Handle  System)”,它是一個獨立的系統,其職能是負責數字資源的全球唯一的、長期的、獨立于地址的命名的分配、管理和解析。在調度系統中,本地名稱空間通過獲取一個調度系統的命名授權,就可以納入到全球調度名稱空間,這樣所有的本地名稱在全球調度名稱空間中將是唯一的。
      索引與搜索系統
      索引的創建可能是由機器的自動掃描、手工錄入和干預,或者是這兩者的結合?蛻魴C把查詢式提交給索引服務器,將返回相匹配的數字對象的URN(統一資源命名,如調度碼)。索引服務還提供被索引信息的元數據和查詢機制。
      用戶界面
      用戶界面是用戶與數字圖書館的接口,數字圖書館向用戶提供的最終服務都是通過用戶界面來實現的。一般情況下,數字圖書館借助通用的Web瀏覽器作為其用戶界面工具。此外,用戶界面的內容編排和服務方式問題是很復雜的,不同的用戶需求是不同的,用戶對數字圖書館的簡單靈活的需求首先就表現在用戶界面上。
          2 NSDL項目的體系結構介紹
      NSDL(National  STEM  Digital  Library,STEM—Science,Technology,Engineering  and  Mathematics)是NSF資助的、由多家單位來實施數字圖書館項目,它包括64個子項目,其目的是支持科學、技術、工程和數學教育,提供廣泛接入和方便使用的分布式資源網絡和學習機制,NSDL一期工程已于2002年底為公眾提供服務,它是目前規模最大的數字圖書館項目。
      由于NSDL的內容和用戶的多樣性,為讓各種用戶共享不同的信息,最初的體系結構設計就是通過共享元數據,并利用元數據開發核心服務(如,搜索和發現)。其體系結構(見圖2),包括以下幾個基本概念:[2][3]
      附圖
      圖2 NSDL體系結構
      ·采用公共的核心元數據實現異構系統間的資源發現。
      ·核心元數據與具體領域的擴展元數據相結合。
      ·以元數據為基礎實現跨庫搜索并創建更豐富的服務。
      ·采用自動索引和檢索系統來減少編目工作。
      元數據庫—NSDL體系結構的關鍵部分是元數據庫。元數據庫存儲所有藏品集的元數據,并通過OAI協議把它們提供給服務商,服務商通過元數據可以開發出各種服務。在NDSL中,元數據庫可能分布在多個服務器上,并有多個鏡像。NSDL早期采用分布式元數據庫,現在改成集中式。這是因為分布式元數據庫在檢索時會因為其中的一個元數據庫的查詢失敗或響應較慢,而造成整個檢索的失敗或長時間的響應,而集中式元數據庫可以避免這種現象。
      NSDL的互操作性問題
      NSDL的互操作性采用三種方式來實現:[4]
      ·聯合:這是一種傳統的方法,其所有的成員組織都遵從某些標準規范,如通過Z39.50協議共享在線目錄。
      ·OAI采集:以OAI元數據采集為基礎。每個數字圖書館藏品的元數據都能提供到Dublin  Core的映射,并以簡單的交換格式向外提供,這樣,服務提供商就能采集這些元數據,把它建入到信息發現系統中,而且這些藏品能夠實現良好的互操作性。
      ·搜集:即使各種不同的組織之間不存在任何形式的合作,通過網絡爬蟲收集開放訪問的信息仍然可以實現一定程度上的互操作。各種網絡搜索引擎就是這樣。
      NSDL主要通過OAI元數據采集來實現互操作。2001年初,NSDL確定支持8種標準元數據格式,這8種元數據之間的互換通過Dublin  Core元數據核心集作為過渡。
     。1)Dublin  Core
     。2)Dublin  Core  with  DC—Ed  Extensions
     。3)LTSC(IMS)
     。4)ADL(SCORM)
     。5)MARC  21
     。6)Content  

    數字圖書館體系結構的發展

    ;Standard  for  Digital  Geospatial  Metadata(FGDC)
     。7)Global  Information  Locator  Service(GILS)
     。8)Encoded  Archival  Description
          3 NCSTRL項目體系結構介紹
      NCSTRL。∟etworked Computer Science Technical  Reference  Library)是另一個有代表性的數字圖書館項目,其規模僅次于NSDL,它是由DARPA資助的,來自北美、歐洲和亞洲的160多家學術研究機構參與了該項目。其體系結構以  Dienst體系結構為基礎,該體系結構的一個重要特征就是分布式搜索(見圖3)[5]。
      附圖
      圖3 NCSTRL的體系結構
      在NCSTRL的早期項目中,用戶的查詢式被直接提交給所有的索引服務器,但隨著參與機構的增多,檢索時同樣會因為其中的一個元數據庫的查詢失敗或響應較慢,而造成整個檢索的失敗或長時間的響應,為了解決這一問題,NCSTRL引入了查詢路由器的概念[6][7]。
      查詢路由器QR(Query  Routers):根據一定的機制把查詢式發送到分布式的索引服務器中,并負責合并來自不同的索引服務器的查詢結果。另外,該體系結構還引入了藏品服務(Collection  Service)的概念,它是查詢路由的基礎,提供把各種服務集成到數字圖書館中的各種機制。按照當前的藏品服務定義,它提供以下信息:
      ·參與該藏品服務各單位的目錄
      ·每個單位的索引服務器的網絡地址
      ·索引服務器的元信息(為查詢路由提供依據)
      查詢路由
      查詢路由器定期地與藏品服務通信,藏品服務數據包括索引信息(每個機構的藏品)在索引服務器之間的分布情況,如斯坦福大學藏品的索引可能在I1和I2兩個索引服務器上有備份,康奈爾大學藏品的索引可能在I2和I3兩個索引服務器上有備份。通過這些信息,查詢路由器將決定查詢式被提交給哪些索引服務器來處理。
      附圖
      圖4 查詢路由
      連通域
      由于全球范圍內的Internet的連通性差別相差巨大,為了提高數字圖書館的分布式搜索的相應時間,NCSTRL引入了連通域的概念,連通域是指網絡上具有高度連通性的一組節點。連通域的概念是藏品服務的一部分,藏品服務分布在一組區域元服務器RMS(Regional  Meta  Servers)中——每個連通域一個RMS。每個RMS從主元服務器MMS(Master  Meta  Server)獲取特定域的信息,見圖5。
      附圖
      圖5 連通域
      連通域之外的索引信息在連通域內的索引服務器上有備份,這樣用戶的查詢將在連通域內部完成,只有當其中的索引服務器查詢失敗時,查詢式就被提交給主元服務器,主元服務器再把該查詢式分配給到其它的連通域。
      索引服務器的動態調整
      由于考慮到單個搜索的失敗,故NCSTRL元數據在多個索引服務器中存在備份。藏品服務中的數據列出了索引服務器接受查詢式的優先順序,有的索引服務器被設定為主索引服務器,有的被設定為次級服務器。主索引服務器首先接受查詢式,如果在一定的時間內沒有完成查詢任務,查詢式就會轉交給次級索引服務器。
      需要說明的是,主索引服務器和次級索引服務器的順序并不是固定不變的,而是動態調整的,其中的參數可由管理員來設定。這個動態調整的過程是通過一個簡單算法來實現的。在索引服務器成功完成一次查詢之前,查詢路由器給每個索引服務器增加一個失敗記數,如果查詢成功,失敗記數就減一。當查詢路由器通過藏品服務提供的信息來選擇索引服務器時,它進行一個穩定性測試:該索引服務器最近是否有N次連續響應失。∟是可以設定的)?如果一個索引服務器沒有通過這種穩定性測試,它就會被降級,也就是說,如果是一個主索引服務器就降級為次級目錄服務器,而另一個次級目錄服務器就有可能升級為主目錄服務器。
          4 對數字圖書館體系結構發展的看法
      由于用戶對數字圖書館的功能需求不斷發展,信息技術的迅速進步,數字圖書館的概念和功能都在不斷發展。通過對上述兩個項目的體系結構的分析,加上筆者的探索和實踐,我們認為數字圖書館的體系結構的設計必須事先考慮到開放性、互操作性、擴展性以及伸縮性。
        4.1 開放性
      數字圖書館系統必須是一個開放的系統,開放的含義包括一下幾個方面:
     。1)能夠與第三方系統或功能模塊實現良好的對接和集成;
     。2)能夠方便地在本系統內部增加刪除或修改某些功能模塊;
     。3)盡可能廣地支持各種資源格式和標準;
      因此在系統設計時需要遵循一下原則:
     。1)基本體系結構簡單化,在設計基本體系結構時主要考慮信息的流通和管理機制,強調系統的通用性和穩固性;
     。2)功能模塊化,數字圖書館的服務功能是不斷發展的,因此數字圖書館的每一項服務應該是相對獨立的,便于安裝、撤銷和維護;
     。3)選取成熱的通用的標準和協議。如用戶界面采用通行的Web瀏覽器,文檔表現采用XML定義,元數據采用Dublin  Core、中文元數據標準等。
        4.2 互操作性
      通過信息資源本身實現互操作是最應該受到鼓勵的方法,因為數字圖書館建設的基礎是資源,用戶最終利用的也是資源,而且與信息系統比較起來,資源從類型上(如圖書、期刊、科學數據、地圖、檔案)要容易預見,發展變化也相對緩慢,從資源的格式上講(如標準的文件格式.txt、.html、.mpeg等),大家對通用標準的認同更加一致。因此,通過一定的標準規范讓不同的藏品遵循相應的元數據標準,并通過元數據的共享或互換,可以實現資源間的共享,就如上面所介紹的NCSTRL項目,也已采用OAI元數據采集協議來實現來自不同單位的藏品的互操作?上驳氖,現在許多數字圖書館項目一般都主動遵循一定的元數據標準去創建元數據。并出現了一些工具和方案能夠實現不同元數據標準的元數據元素的映射。當然,信息系統之間的互操作隨著中間件和代理技術的發展也取得了很大的進步,同時近年來,Web服務技術為網絡軟件的共享和互操作方面提供了新的機制,將來隨著這些技術的進一步發展,實現信息系統間的互操作將越來越簡單。
        4.3 擴展性
      NCSTRL為我們在擴展性方面提供了很好的經驗。由于NCSTRL的成員單位比較分散,并且不斷有新的成員單位及新的用戶加入,最終選擇了把數字圖書館劃分成不同的區域,這

    樣不但適應了數字圖書館不斷延伸的特點,而且還能為本地用戶提供及時的、具有本地特色的服務。在中國數字圖書館工程建設一期規劃(2000—2005)就采用了區域服務的思想。
        4.4 伸縮性
      由于各數字圖書館建設單位在經濟、技術、管藏資源、用戶需求等方面都不平衡,因此不同數字圖書館的建設規模也將是不同的。一個好的體系結構設計必須能夠適應不同規模的系統,使不同規模的系統都能夠獲取最佳的效率。
    【參考文獻】
      [1]  William  Y.  Arms  etc,  An  Architecture  for  Information  in  Digital  Libraries,D—Lib  Magazine,  February  1997  http://www.  dlib.  org/dlib/february97/cnri/02armsl,  htm
      [2]  C.  Lagoze  (ed.),  W.  Arms,  S.  Gan,  D.  Hillmann,  C.  Ingram,  D.  Krafft,  R.  Marisa,  J.  Phipps,  J.  Saylor,  and  C.  Terrizzi.  Core  services  in  the  architecture  of  the  National  Digital  Library  for  science  education  NSDL). In  Proceedings  of  the  Second  ACM/IEEE—CS  Joint  Conference  on  Digital  Libraries,  Portland,  OR,  2002.
      [3]  D.  Fulker  and  G.  Janee.  Components  of  an  NSDL  architecture:  Technical  scope  and  functional  model.  In  Proceedings  of  the  second  ACM/IEEECS  Joint  Conference  on  Digital  Libraries.  Portland.  OR.  submitted  in  January  2002.
      [4]  William  Y.  Arms,  Diane  Hillmann  etc.  A  Spectrum  of  Interoperability  The  Site  for  Science  Prototype  for  the  NSDL,  D—Lib  Magazine  January  2002  http  ://www.  dlib.  org/dlib/january02/arms/01arms,  html
      [5]  Dushay,  N.  ,  J.  C.  French,  and  C.  Lagoze,  “A  Characterization  Study  of  NCSTRL  Distributed  Searching,”  Cornell  University  Computer  Science,  Technical  Report  TR99—1725.January  1999
      [6]  Ca

    rl  Lagoze,  David  Fielding.  Sandra  Payette,  Making  global  digital  libraries  work:  collection  services,  connectivity  regions,  and  collection  views,  Proceedings  of  the  third  ACM  conference  on  Digital  libraries,  p.  134—143,  June  23—26,  1998,  Pittsburgh,  Pennsylvania,  United  States
      [7]  Dienst  Architecture  Summary  Description.  http://www.cs.  cornell,  edu/cdlrg/dienst/architecture/architecture,  htm


    【數字圖書館體系結構的發展】相關文章:

    網格技術的發展與數字圖書館建設08-05

    數字圖書館館藏評價08-05

    數字圖書館的評估研究08-05

    鍵控技術的數字實現與發展08-06

    IDC與數字圖書館建設論文05-31

    數字圖書館建設的探索與認識08-05

    數字鄉村發展工作總結12-31

    圖書館立法與公共圖書館的發展08-05

    互操作聯邦數字圖書館研究08-05

    av片在线观看无码免费_日日高潮夜夜爽高清视频_久久精品中文字幕乱码视频_在线亚州av播放