- 相關推薦
分布式參考咨詢服務標準與規范研究與應用
【內容提要】根據網上數字參考咨詢服務發展,介紹了國內外主要的數字(或網上)參考咨詢服務系統的問答內容創建、對象描述、知識組織、數據存取傳遞。專家信息管理、協作館信息管理、服務流程管理、質量控制、知識產權管理、個人隱私控制等方面的標準規范的研究和發展。討論了國家科學數字圖書館分布式參考咨詢服務和管理標準規范研究和規定。【摘 要 題】信息服務
[分類號]G255.54
數字化信息環境下的數字化參考咨詢服務,不僅可以體現文獻信息服務的專業化,自動化、智能化和知識化程度,同時能夠更有效地幫助用戶充分、高效地利用文獻信息資源與服務。
隨著數字化參考咨詢服務和協作咨詢服務網絡的發展,需要研究和制訂咨詢系統和參考服務管理標準,以保證服務質量和系統的互操作。目前國內外很多網上參考咨詢服務系統日益重視咨詢服務及其管理的標準化問題,正在研究和制訂一系列相關標準規范。
1 數字參考咨詢標準研究概況
目前國內外數字參考咨詢系統及其服務標準研究及其規范工作,主要集中在三個方面:
。1)專家或成員信息描述標準。用于識別咨詢(學科)專家(館員)或協作成員。
。2)知識庫標準。主要用于收集、描述、加工、存儲和共享問題和答案的知識庫建設。
。3)問題傳輸協議。主要解決參考咨詢服務機構之間的信息交換。
目前通常采用Web表單或者電子信箱等工具來處理這個問題。這意味著大量的數據的流動,包括從數據庫或電子信箱中導出或導入。創建一種信息交互的無縫方式能夠使信息共享更加容易,更加經濟。
2 參考咨詢標準內容研究
2.1 咨詢數據庫格式與標準
知識庫的數據格式提供了廣泛的問答知識的組織框架,以獲取咨詢業務中的知識層面的信息,定義參考咨詢業務流程、管理和問答知識組織、描述、存取數據。知識庫格式把參考咨詢交互轉換經過編目,并且能夠妥善保存、便于編輯修改的可靠、嚴格的知識數據。制定知識庫格式的基本原則是:必須能處理咨詢業務中濃縮的信息比特內容;在形成對信息來源的選擇和評價過程中,必須能將圖書館員的知識具體化。
目前,知識庫標準主要包括知識內容、數據元素/元數據、過程維護和功能報告。內容包括一個問/答過程完成后的問題、答案、匹配和指示/鏈接。數據和元數據元素包括信息描述、問答記錄、個人信息、權力管理、費用信息和回答者及資源的確認/證明。過程維護包括記錄的更新、增加、刪除和記錄之間的相互參見。功能報告包括知識庫記錄的趨勢、統計和分析。知識庫標準可以與資源描述、質量、權限管理、隱私、版權、統計、鑒定和存檔等方面的標準進行整合和協調。此外,需進一步研究與語言和文化、隱私、版權、行政權限以及文化、法律和政治敏感性等相關的標準。
專家與成員館描述標準須考慮提問者的描述元素和答者的描述元素,以及二者的有機結合?蓞⒖嫉哪P陀蠧PEX(Customer Profile Exchange)和CDRS.CPEX中劃分類別包括代理/參與者/執行者(如統一標識符,國籍、角色)、聯系方式、參與人數統計、交易對象參考、管理、交互歷史、優先信息/約束以及司法和隱私限定。
交換協議包括描述過程模型,消息和功能,內容描述包。目前有許多現存的標準或推薦標準可以參考借鑒,或者可以與之整合、協調。如ILL、SOAP、QuIF、ISO2146、N-CIP、Z39.50等。需要研究和試驗的內容包括:問/答交換模式的應用、元素和元數據交換性測試、參考咨詢軟件包之間的測試。協議標準的發展過程中對一些涉及國際性的問題比較敏感,如語言、時區和司法問題。
知識庫格式與標準需要進一步解決的主要問題包括:版權、問題和答案的所有者、語言、文化、主題分類法的選擇、采用受控詞表還是自然語言等,知識庫中提問信息之間的平衡、數據元素、權重、值是否正確及其表單設計等。另外,作為協作式參考咨詢,需要解決合作型知識庫系統、問題交換標準、資源共享、標準化的度量和計費系統。
數字參考咨詢標準研究主要針對數字參考咨詢過程中獲取的數據進行描述、共享和存儲說明。目前,美國ABC公司(AnswerBase Corporation)和OCLC分別聯合研究型圖書館和數字圖書館聯盟(Digital Library Federation)研究提出了2個標準:KnowBit(KBIT)和QuIP。
。1)KBIT 數據庫格式
KnowBit是一種管理咨詢信息交互的標準數據格式。該格式為集成、可升級、鏈接和可擴展的數據標準,能夠將各種信息成分組合到一個簡單的格式中。它既包括對敘詞表或分類詞表的選擇,還包括與MARC及其它標準有關字段的連接。KnowBit格式區分了問題的類型:原始問題,咨詢過程問題和正式問題,并通過提問目的和所問問題類型來識別問題。描述字段可以對問題的地理范圍,語種,版權狀態和可獲得狀態進行識別。除此以外,采用主題分類,關鍵詞術語,數據條目,著者和來源評價、數據頻率等途徑可以進行分類、評價和統計分析,為獲取、識別、分類問題答案庫中的信息提出了有效手段。KBIT數據格式具有多種特點。
。2)QuIP數據標準
QuIP是針對基于網絡的數字化參考咨詢服務的問題和答案內容描述的一個交換協議。以分布式協作型為基礎,為Internet不同域的用戶設計。QuIP是一種基于元數據的線程化的數據格式,能以統一的格式維護、跟蹤、存儲咨詢服務的問題和答案。其核心是一個問答流。數字咨詢交換是多個問題/答案的交互。這種交換可能是多個交互,包括問題主題和咨詢人員或用戶的變化或變更。QuIP是面向過程的。QuIP支持基于多個服務器的問題和答案序列的知識共享的發展,輔助平衡服務器之間的問題負載。QuIP有三個主要概念:元數據模式,語法綁定,協議集。QuIP可分為兩個部分:
、僭獢祿。確定數據存儲、交換的結構和格式。
、趨f議。協議能夠實現計算機到計算機的事務處理(如處理問題)和其它服務(如提問狀態)。
3 問答知識元數據研究
3.1 數據元素特征
知識庫格式和標準建有數據元素、字段或者數據詞典,力圖使問答過程的描述和數據庫的存儲格式化、標準化。
咨詢問答過程(交互)中通常有若干個屬性。每個屬性可能會有子元素,或子屬性。
以QuIP數據標準為例,可以得出知識庫數據元素一般具備以下特征:
。1)數據元素是可強制、有條件或可選擇的。
。2)數據元素可重復或不可重復。
。3)可預定元素值。
。4)元素和屬性可擴展。
。5)建立一些控制元素。
。6)建立唯一識別符,一般分為“
注冊識別符”和“本地識別符”兩種。
。7)建立注冊信息元素。
3.2 數據元素設置
知識庫格式一般由數據字段(即元素屬性)和數據元素(即屬性子元素)組成。根據目前已有的幾個數字參考咨詢數據庫格式內容,通常數據字段分四個部分:問題字段、答案字段、成員描述字段和代理描述字段。
問題字段和答案字段十分相似,都有提問/回答跟蹤、成員館、控制、內容等幾個部分。提問/回答跟蹤字段有提問/回答代碼、時間和日期標識等元素。成員館字段主要有代碼、電子信箱、網址,館藏實力、館員實力、回答范圍、回答數量、代理份額、技術環境等元素?刂谱侄伟▽栴}難度、教育層次、提問/拒絕原因、詞表、分類表,已查資源、時間限制的說明性元素。內容字段則包括具體問題/答案的內容、提問關鍵詞、答案引文等元素。另外,問題字段還包括一個最終用戶手段,對個體用戶的說明。咨詢服務代理(方)描述字段主要有名稱、地址、電子信箱、網址、實力等元素。
目前OCLC提出的QP(Question Point)元素和虛擬咨詢臺(VRD)研究的QuIP數據元素如下:
。1)QP 數據元素設置
OCLC的QP(Question Point)數據庫格式以及數據元素主要包括五個部分:
、儆脩、代理users/agents;
、诔蓡T檔案數據庫member profile database;
、厶釂柟芾砥鱮equest manager;
、苤R庫knowledge base;
、莘⻊账絽f議service level agreement.其成員館描述分為幾個層次:沒有或最少信息型、基本信息型、指導支持型、研究型、全面型。
QP也設置了問題字段和答案字段,分別對問題和答案的具體描述。問題字段包括問題內容、機構、提問文件、提問來源、教育水平、關鍵詞、提問日期、主題、地理代號、機構代號、代理代號、提問原因、提問語言、已查資源等元素(或子元素)。答案字段包括答案內容、機構名稱、答案狀態、關鍵詞、機構代號、回答日期、格式、答案語言、當前問答狀態等元素(或子元素)。
。2)QuIP數據元素設置
虛擬咨詢臺(VRD)使用的QuIP數據元素按其間關系可以形成一個等級樹狀表。QuIP線程位于最上層,包括QUID標識號和問答交互(interchange)。QUID又分為注冊號和本地號,交互流則包括次序、發起者、日期、狀態,交互控制,主題、內容等幾個部分。其中,發起者是對提問/回答的組織或個人情況的描述,有名稱、地址、電子信箱、電話號碼以及在問答過程中的角色(回答者的資格或資歷、專業水平)等幾方面。內容是對問答具體內容的描述,包括格式、語種、描述、信息正文四個方面。
2002年QuIP推出了2.0版的草案,對QuIP元素作了較大修改和精簡。Interchanges用event代替,date用temporal indicator代替,text用body代替。調整后的元素等級表更為簡明清晰,主要由兩個一類對象Profile和Event組成,把問答發起者、代理的描述和問答流的描述區分開來,這與CDRS的元素結構更接近了。Profile包括代碼(PID)和描述內容(P_ Content)兩部分;Event包括狀態(State)、次序(Sequence)、內容(Content)、主題(Subject)、發起者(Actor)、時間標識(temporal indicator)、控制(Restriction)等幾個部分。其中,內容依舊由格式、語種、正文幾方面組成。
3.3 數據元素與DC元數據的映射關系
DC(Dublin Core)正在成為元數據的通用語言,因此在問答知識庫元素與DC元數據間實現映射有一定的意義。VRD在制定知識庫標準時就注意其QuIP元素與DC元數據的對應和映射。DC是對文件對象進行最基本的描述,而知識庫是將一次問答交互等同于一個文件,對問答數據交互進行描述,所以二者之間不能進行簡單的映射。另外,問答交互文件是動態的,在用戶和服務器,服務器和服務器之間進行數據交換時,是不斷變化的。DC元數據的特征之一就是可以根據特定的團體和應用需求進行擴展。因此,知識庫的許多元素可以從DC中擴展而來,當然也有DC中不存在的元素。
3.4 問答數據的XML描述
問答數據可以用多種方式進行描述,并能基于不同協議進行傳輸。例如,具有自己的DTD文件,能與XML語言進行綁定。以QuIP為例:
QuIP的DTD片斷:
。!——The root of a QuIP threaded interchange.——>
。!ELEMENT QuIPThread(QUIP,Interchange+)>
。!——A unique identifier of thread.——>
。!ELEMENT QUIP(QUIP_Registry_ID.Local_ID)>
。!——Basic repeating element of a thread.——>
。!ELEMENT Interchange
。⊿equence,Instigator,Dates+,State?,Restriction *, Subject,Content+>
。!ELEMENT QuIP_Registry_ID(#PCDATA)>
。!ELEMENT Local ID(#PCDATA)>
4 分布式參考咨詢服務標準研究與設計
“分布式參考咨詢服務系統”是中國科學數字圖書館研究項目。在考察了國內外分布式數字參考咨詢系統的基礎之上,針對我院文獻情報系統網絡文獻信息服務的需要與發展,研究和設計了一個基于網絡環境下的“分布式參考咨詢服務系統。
系統建于通用性網絡平臺之上,整個參考咨詢系統采用“咨詢控制中心+成員館”的模式。主要包括單館式和實時參考咨詢。系統集成二種參考咨詢方式:脫機模式(Offline interactio
n),實時聯機(Real time interaction)。系統由讀者服務系統和管理系統組成,讀者服務系統能夠提供:讀者注冊、我的問題、表單咨詢、E-mail咨詢、實時咨詢、網站內容發布、咨詢專家推介、問題征解,最新問題/答案列表、Q/A檢索、FAQ、服務聲明、系統幫助等功能。管理系統功能主要包括系統的服務與管理以及11個子系統的運行管理。
4.1 數據模型研究與設計
根據分布式數字參考咨詢服務實際環境設計和建立系統數據標準。以元數據設計為基礎,通過對分布式數字參考咨詢過程、管理對象、對象與過程間關系、管理過程以及知識組織與利用進行分析和分解,建立了系統服務標準設計邏輯功能,并在此基礎上構建了分布式數字參考咨詢服務系統標準數據模型,基于這個數據模型,設計并建立了分布式數字參考咨詢服務的整個業務流程管理、咨詢專家(成員館管理)調用、咨詢質量控制與評價和知識信息組織與利用描述元數據標準與規范。分布式數字參考咨詢服務及系統數據模型如圖1:
附圖
圖1
4.2 數據庫格式與標準研究與設計
為了保存和共享豐富、有價值的信息和學科專業知識以及專家資源,提高系統的自動化和智能化管理程度,提供更多、更便捷的信息和專業知識導航,系統按照上述數據模型,分析提出了實現業務流程、專家管理、質量控制、問答知識組織與利用等各個環節、過程的數據元素,形成了系統的數據文件模型,并在此基礎上提出并建立了系統數據庫格式與標準。
分布式參考咨詢系統數據庫格式和數據標準是基于元數據設計制定的數據格式與標準。數據標準結構主要包括答案表、問題分配表、分類表、專家表、問題征詢表、成員館表、讀者表、問題請求表、主題詞表等9個數據表。
。1)答案表的元素設計主要有:回答、請求、次序、專家、成員、回答類型、答案內容、語言、格式、版權、時間、參考資源、質量評價等。
。2)問題分配表數據員主要有:問題分配、請求、專家、分配時間、響應時間、完成時間、答復結果。
。3)分類表的數據元素主要包括:分類號,類別名稱、類別等級等。
。4)專家表數據元素有:專家識別號、專家注冊、密碼、角色、專家姓名、成員、教育程度等。
。5)問題征詢表元素主要包括:請求識別號、次序、出處,發起者、主題、全文等。
。6)成員館表的數據元素有:成員館識別號、成員館名稱、成員館服務時間、成員館數字參考URL、成員館地址、電話等。
。7)讀者表數據元素主要包括:讀者識別號E-mail、密碼、姓名、國別、地址、郵編、電話等。
。8)問題請求表數據元素有:請求識別號、讀者識別號,成員識別號、分類號、問題主題、詞匯、問題深度、問題難度,響應時間、處理狀態、發表確認、問題IP地址等。
。9)主題詞表數據元素主要包括:詞表識別號、分類號、主題詞。
在設計分布式參考咨詢服務與管理數據標準時充分注意采用元數據標準和開放描述語言(例如DC元數據、XML、DTD)并保持與之直接對應關系,以增進系統數據標準的開放性和規范性。
4.3 咨詢服務與管理數據元素著錄規范
咨詢服務與管理標準化工作將提高系統的流程管理與信息管理效率,增加網絡參考咨詢務工作中各個不同成員之間、不同平臺與環境之間信息的互操作能力,提高參考咨詢服務質量,保證問答知識庫的數據質量,提高知識庫的利用率和準確率,分布式參考咨詢服務系統準備進一步研究和制定有關數據著錄規范。
。1)知識庫數據著錄規范
問答知識庫是由若干組經過核實、標引、編輯的問答記錄所組成的可供檢索的數據庫。知識庫可為讀者和咨詢專家提供答案檢索服務,根據知識庫的數據格式與標準要求,知識庫的數據收入范圍規定設計為:
、俜灿斜A魞r值的問題/答案須編輯處理、標引加工,存入知識庫;
、诜矊俪R、常識性問題/答案應編輯處理、標引加工,存入知識庫;
、鄯矊僖话阈钥萍贾R類問題/答案應編輯處理、標引加工,存入知識庫;
、芊矊偈聦嵭裕〝祿、名詞解釋)問題/答案應編輯處理、標引加工,存入知識庫。
、莘灿芯唧w出處(網址除外)等文獻信息指南性答案應編輯處理、標引加工,存入知識庫;
、薹灿忻鞔_的信息檢索查詢指導步驟的答案應編輯處理、標引加工,存入知識庫。知識庫的數據著錄規定設計為:
、邔栴}/答案中的個人信息:姓名、E-mail地址、機構名稱、密碼、國別、地址、郵編、電話等信息經刪除后編輯加工入數據庫;
、啻鸢钢幸玫奈墨I信息書目須采用《國家文獻著錄標準—檢索期刊條目著錄規則》(GB3793-92)格式進行規范處理;
、釋栴}/答案進行學科分類審核和維護;
、庥孟到y知識庫分類主題詞匯,對問題/答案進行主題詞或關鍵詞標引。
。2)系統數據元素著錄規則
根據分布式參考咨詢服務系統數據庫建設,設計和制定了9個數據元素著錄規則:
、俅鸢笖祿浺巹t 、趩栴}分配數據著錄規則
、鄯诸悢祿浺巹t 、軐<覕祿浺巹t
、輪栴}征詢數據著錄規則 、蕹蓡T館數據著錄規則
、咦x者數據著錄規則 、鄦栴}請求數據著錄規則
、嶂黝}詞數據著錄規則
國家科學數字圖書館分布式參考咨詢服務系統是基于開放體系結構的數字化網上咨詢服務系統,通過開放建設和集成各種分布、 異構服務和多樣化數字信息資源,形成個性化的虛擬參考咨詢服務和完善的服務機制。為了保證數字參考咨詢服務順利開展,并高效、可持續進展,分布式參考咨詢服務系統將不斷按照國際化、開放性、技術成熟性等原則,明確確定本系統的各項服務與管理標準,以提供準確、方便的網絡數字參考咨詢服務。
【參考文獻】
[1]R.David Lankes.The virtual reference desk:question intercha nge profile http://www.vrd.org
[2]Blithe Allison Bennett.Virtual reference desk Incubator:A De mo.http://www.vrd.org
[3] 張奇.虛擬參考服務的成功范例——CDRS.戰略思考——圖書館發展十大熱門話題.上?茖W技術文獻出版社,2001
[4]莫少強等.數字圖書館參考咨詢服務的實踐與研究.知識導航與圖書館服務(第一界國際圖書
館論壇論文集),上?茖W技術文獻出版社,2002
[5]吳建中,DC元數據,上?茖W技術文獻出版社,2000
[6] Abby S. Kasowitz. Trends and issues in digital reference servi ces. http://www. ericit. org
[7] Butler Brett. KnowledgeBit: A database format for reference ve rsion 2.0. http://www. vrd. org
[8] Marsh Geoffrey. A help desk knowledge database: the first year. http://csb. dcrt. nih. gov/kbwhite/firstyear/index. html
[9] Streenivasulu V. The role of a digital librarian
【分布式參考咨詢服務標準與規范研究與應用】相關文章:
IEEE 1394標準的網絡應用研究08-06
分布式發電系統的應用及前景08-06
分布式發電系統的應用及前景08-06
分布式對象技術及其在Web上的應用08-09
Jini在分布式嵌入式系統中的應用08-06
分布式對象技術及其在Web上的應用08-06
網絡技術在分布式測試系統上的應用08-06
參考文獻的規范要求01-26