試論網絡信息分類法的構建

>>>  技術話題—商業文明的嶄新時代  >>> 簡體     傳統


  自因特網誕生以來,網絡資源日益膨漲,信息可獲得量呈幾何級數增長,并且表現出分散、無序、變幻多端的特點。無序擴張的網絡信息,一方面使網上信息包羅萬象,分布組合復雜、垃圾堆積,另一方面,使網絡信息用戶面對如此海量信息,無法快速、便捷有序地獲取所需信息。因此,解決網絡信息無序擴張與網絡信息有序利用之間的矛盾,有效組織網上信息,變無序信息為有序信息,為網絡信息用戶提供便利的信息獲取途徑和方法,便成為網絡環境下信息組織與管理的出發點和目的,其核心是信息檢索問題。從分類角度檢索網上信息資源是人們檢索時最常用的方法之一,但到目前為止,對網絡信息資源的分類還沒有一致的標準和公認的劃分結果。因此,網絡信息分類方法的研究具有極強的現實意義。如何吸收傳統文獻分類法的優點,根據網絡信息及用戶檢索需求的特點,依據計算機技術及網絡環境,構建科學、實用的網絡信息資源分類法是當前信息資源管理研究的重點。
   1 網絡信息分類存在的問題及其原因
  人類認識世界的統一性和多樣性產生了認識事物的分類方法,分類作為一種科學方法是人們認識客觀世界的重要手段之一,其基本職能是知識的整序,即通過“物以類聚”,使知識得以類集,形成知識的有序集合。分類法的主要特點是按學科、專業集中信息,并從知識分類的角度揭示各類信息在內容上的區別和聯系,提供從知識分類角度檢索資源的途徑。
  網絡分類其本質是目錄分類,它是由網絡開發者對所收集的網絡資源,進行組織整理,并和檢索法集成在一起的信息查詢方式。它一般由人工方式采集信息,以某種分類體系為依據,并通常按網絡資源的主題性進行分類,將信息資源分為若干領域的主題范疇,然后再細分為各學科專題目錄,最后列出具體的相關網站資源,形成一個由信息鏈組成的樹狀結構,即總目——專題目錄——鏈接——文本。目前網絡分類法的類型主要有:主題分類法、學科分類法、圖書分類法和分面組配法。
  網絡分類法從其誕生起,就在網絡資源組織與檢索中發揮了不可取代的作用,顯示出強大的生命力,但是其存在的問題也是顯而易見的,這主要表現在以下幾方面:1.1 分類體系中知識領域不全和知識體系不嚴密, 不少信息難以歸類,同時覆蓋面太廣,但專指性太差。基本大類可以說是分類法的大綱,是分類體系中的第一級類目。基本大類的設置確定了整個分類體系的基本框架以及所含信息的內容范圍。網絡分類法設置基本大類時,對知識的系統性考慮不足,更多的是以信息量、信息內容的重要性及其使用頻率為標準。大多數網絡分類只選取些熱點事物作為主題類目,如計算機與因特網、教育、休閑娛樂等。1.2 類目概念劃分邏輯混亂,常有隸屬關系不清的現象,混淆了概念間的邏輯關系,不利于用戶查詢瀏覽。例如,“搜狐”在18個基本大類中,將“計算機與互聯網”與“科學與技術”并列;“東方網景”將教育歸于自然科學類;“網易”將文學列入歷史和宗教類;關于“圖書館”類目,“司南”將其設置為“社會與文化”的下位類;“中國導航”將其設為“教育與科技”的下位類;“常青藤”、“搜狐”將其定義為“參考信息”的下位類;“悠游”則將其安排為“圖書出版”的下位類。這種子目設置的隨意性,為用戶檢索制造了障礙,而且,各類分類工具都各自為政,我行我素,沒有統一的規范標準。用戶必須了解各個網站的分類體系,否則很容易迷航。1.3 類目設置隨意,類目劃分缺少規范,無規律可尋。 如“搜狐”的教育類,有高等教育,卻無中等和初等教育,有國內院校無國外院校,有音樂教育無素質教育,在教育類下,又出現了一個聊天與BBS。 類目劃分極為隨意,跳躍性過大,這些問題都是缺少嚴格的詞匯控制所致。1.4 類名概念選用不科學。由于網上分類法類型非常多,又存在著同義詞和語言表達的豐富性,又沒有什么標準對各類分類法的類名進行規范,因此不同分類系統對相同主題,在選用類名時有時相同,有時不同,甚至在同一個分類系統中,對類名的選用還會出現不一致的現象。如,在“常青藤”類表中,“特殊教育”的含義為:殘疾人的教育;但在“若比鄰”中,則是指計算機輔助教育等內容。這種概念內涵的巨大差異為用戶檢索人為地制造了不必要的障礙。而且,大多數的網絡分類體系沒有類目注釋,這無疑對類名表義的準確性要求更高。所以,無論從用戶檢索實用性考慮,還是從分類體系科學性出發,類名概念的科學性都應是各網絡分類法必須遵守的原則。
  造成這些問題的原因主要在于網絡信息分類體系的設計者。目前網絡上的檢索工具大都是研究機構、電腦工作者設計的,他們的優勢是計算機技術十分精通,熟悉網上信息,重視用戶需求,所以設計出的分類體系直觀、實用而又易用。但是,他們的弱點是不懂分類學和信息管理學知識,缺少情報檢索語言理論的指導,不重視知識體系的完整性和邏輯性,對網上信息的處理較為隨意,缺乏邏輯性和科學性。同時傳統文獻分類法的嚴密性、等級性、專業性、體系的龐大、內容的陳舊,也使少數試圖利用傳統文獻分類法的電腦設計者望而生畏。從事文獻分類工作和情報檢索語言研究的圖書情報專業人員,其特點是重視知識體系的構建和揭示,強調語匯控制,熟悉分類法、主題法等情報檢索語言,熟悉圖書館、情報所等正式出版的紙質印刷型文獻環境及其用戶,但實際參加網絡研究和建設的很少,可以說我國現有的網上信息檢索工具還沒有一個是圖書情報人員設計的,還不能不是一種遺憾。如若電腦工作者同圖書情報工作者聯手,揚長避短,相信編制一部適用于網絡信息組織的分類法并不是可望而不可及的事。
   2 網絡分類法的優點
  目前的網絡分類體系主要有以下優點:第一,充分考慮網上信息的類型和特點;第二,充分重視網上用戶的需求;第三,依托計算機操作技術和環境建構起多維的分類體系。這些優點相輔相成,相互促進。其中,最大的優點是構建了多維的分類體系。網絡分類中超文本技術的運用,使網絡分類體系在類目間關系顯示、類目設置以及相關材料組織等方面比傳統分類體系具有更大的靈活性、動態性,并且為分類法的系統展開提供了交互式的友好界面。這主要表現在以下幾個方面:2.1 揭示了類目間的多維關系。知識之間的聯系是多方面的, 一個主題或事物對象,可以同時從屬于兩個或多個知識門類,也可以在從屬關系以外有其他的聯系,即相關關系。傳統文獻分類法由于其單線型結構,雖然也設置了部分交替類目和類目參照,但仍無法充分揭示主題之間的客觀聯系。網絡分類則采用超文本技術,克服了傳統分類法的不足,根據知識門類之間的聯系和使用需要,通過鏈接的方式,在相應的類目下重復反映,充分揭示類目之間的多維聯系。2.2 事物多重屬性得到充分揭示,多重列類得以真正實現。 知識門類的復雜性來源于其屬性的多樣化,當依據屬性對事物進行歸類時就要涉及與相關上位類屬性的匹配問題,往往是一個下位類同時與幾個上位類的某種屬性相匹配。對此傳統分類法的解決辦法是適當采用多重列類,其目的一方面是為了使事物所具有的多種屬性在一個相對較高的劃分層次下被同時作為分類標準使用,以避免造成聚類能力的降低。另一方面是為用戶提供不同的屬性作為檢索入口。為了充分發揮多重列類的功能,傳統分類法在編制技術上采用了組配法加以輔助,但實踐證明,在傳統手工標引和檢索條件下多重列類和組配技術只能發揮極有限的作用。
  在網絡資源的組織中,多重列類的功能發揮了應有的作用。利用鏈接技術,可以根據需要,有選擇地同時建立多個引用次序的類目體系,提供更多的能獨立描述信息主題因素的類目,以滿足用戶檢索的不同需要。如網絡分類體系中,對文學類作品,同時選擇按國家、題材、體裁、時代等為劃分標準,通過引用次序的調整,展開多個不同的類目體系。按不同的引用次序設置類目,不僅可以提供不同的檢索入口,而且具有建立不同功能的分類體系的作用。2.3 實現了分類體系的動態組織。 動態組織分類體系包括動態設置類目和動態提示類間關系。前者例如,在某體育賽事、節日前,將有關類目提前設置,使分類體系具有較強的動態性、靈活性,方便用戶實際使用。鏡像類目就是這類動態設類采用的基本形式。所謂鏡像類目,是指采用鏡像技術,以“拷貝”的方式設置的類目。根據使用需要,通過設置鏡像類目,對某些重點類目或熱點類目,加以突出反映,使分類法在保持系統性,又不增加工作量的同時,具有較強的靈活性和適用性。根據需要動態調整類目之間的聯系,充分反映有關類目之間的關系和變化。如根據動態情況,在一定時期里加強對某些熱點類類間關系的顯示。對類目聯系的揭示還可以擴大到相關的文獻資源、檢索頻道、其他搜索引擎的相關門類。這類類目設置或關系的揭示一旦不再需要,可以隨時取消。2.4 體現了分類法的靈活性。傳統的分類法具有相當的穩定性, 一般要使用多年才作一次修訂,即使修訂也往往是縫縫補補,一般不會從根本上改動其體系結構,而且從修訂到出版的周期很長,這就使得分類法存在滯后現象,許多新學科、新事物、新概念得不到及時反映。而網絡分類法則具有很大的靈活性,可以隨時進行結構的調整和類目的增刪變更,并能根據網絡的需要作較大的改造。
   3 編制網絡分類法的基本原則
  網絡分類的目的是使無序的信息有序化,以便于用戶檢索網絡信息資源,與傳統文獻分類法不同,它是一個檢索系統而不是一個標引工具。在編制分類法時除了繼續發揚、完善其原有優勢:類目間關系(橫向、縱向)多維性、多重性;類目設置動態性、靈活性等之外,還應加強科學性、兼容性、通用性等原則的建設。3.1 科學性原則。這主要體現在網絡分類法的體系結構、 類目設置與劃分、類名概念選擇上。類目的設置與排序時,必須遵守基本的學科劃分和邏輯劃分原則。目前網絡分類法中,不論是基本大類,還是各級子類的設置都存在著過分的隨意性,違背了類目概念劃分中的學科性及邏輯性原則,人為地制造了分類體系的混亂,降低了檢索效率。
  與傳統分類法相比,網絡分類中同位類排列順序的重要性不斷降低,但是類目的排列順序畢竟體現著分類系統的邏輯性和系統性,同時,由于人們的閱讀習慣、終端屏幕大小的限制、分頁顯示各條款目以及信息下載速度和先后順序等因素的影響,類目的排列與其被引用率有著一定的影響,排在前面的就比排在后面的有更多機會可供利用,因此,對同位類的排列進行有效的科學控制是非常必要的。
  其次,表現為類名概念選擇的科學性。類名反映和限定著類目所表達概念的內涵和外延。整個分類體系就是通過類名體現出來的,用戶也是通過類名來識別和選擇檢索路徑的,所以對類名的要求通常是:科學、確切和簡潔。另外,大多數的網絡分類體系沒有類目注釋,這無疑對類名表義的準確性要求更高。
  另外,注重類目注釋的科學性。目前,許多網絡分類目錄對上位類進行注釋,這種作法既可以提高分類法的實用性,又可以節省用戶查詢和下載信息的時間。3.2 兼容性原則。 體現在各種分類法之間的兼容互換及其與主題法的兼容上。捷克學者托曼(Toman,I)曾深刻地指出:“對字順主題和分類系統的研究表明,任何一種系統只不過是對同一組織原則進行另一種組合而已”,“當這些系統用于電子計算機時,所有的差別都消失了”。在網絡信息資源組織中,分類檢索語言和主題檢索語言已由原來的涇渭分明、相互對立,轉而相互滲透、相互結合。目前,世界上幾部大型分類法都在尋求聯合,例如,DDC與UDC計劃合作編制地區表,希望在國家及地區概念的表達上達到一致。3.3 通用性原則。在網絡中應用的分類法必然會跨越國界, 達到國際通用性,這主要表現在兩個方面:一是作為網絡信息組織工具的分類法幾乎都是多語種的,如DDC已被譯成30多種語言; 二是它們具有更少的政治和宗教傾向性,如,DDC21版就對第20 版的宗教類作了較大的修訂,旨在降低其基督教傾向。
  自從20世紀90年代中期一些試驗性的網絡分類編目計劃在歐美發達國家陸續啟動以后,構建網絡分類法的可行性已被證明。例如,國際著名的幾部分類法DDC、UDC及LCC在網絡信息分類中都有成功的經驗,特別是DDC網站的顯赫戰績,更令人信心倍增。至于我國, 雖然在這一領域剛剛起步,但目前也已經取得補步成績,如《中圖法》已經實現計算機化,并推出了電子版;中國教育與科研網已開始應用《中圖法》組織網絡信息。總之,網絡信息分類法的構建是無可爭議的必然。至于如何構建,目前的答案似乎就是將新的軟件技術與圖書館傳統的分類理論、方法、實踐緊密結合起來,傳統文獻分類法在網絡資源組織中的巨大作用由此得以體現。
圖書館學研究長春36~38G9圖書館學、信息科學、資料工作許磊20022002本文通過對網絡分類法的優勢及其缺點的分析,闡述了網絡分類法存在的必要性,探討了構建網絡分類法的基本原則。網絡分類法/網絡信息組織  Network classification/Network information organizationAfter analyzing the predominance and shortcoming of network classification, this article tells you the necessity ofConstructing network classification and the basic principles of constructing networking classification.許磊,聊城師范學院圖書館 作者:圖書館學研究長春36~38G9圖書館學、信息科學、資料工作許磊20022002本文通過對網絡分類法的優勢及其缺點的分析,闡述了網絡分類法存在的必要性,探討了構建網絡分類法的基本原則。網絡分類法/網絡信息組織  Network classification/Network information organization

網載 2013-09-10 21:18:15

[新一篇] 試論網絡傳播與記者傳播方式的調適

[舊一篇] 試論網絡社會的實踐與人的主體性
回頂部
寫評論


評論集


暫無評論。

稱謂:

内容:

驗證:


返回列表