20年可視化發展歷程對情報學的影響

>>>  當代歷史與思想  >>> 簡體     傳統


  1 可視化的發展歷程
  迄今為止,可視化的發展經歷了科學計算可視化、信息可視化和知識可視化3個階段。
  1987年美國國家科學基金會舉辦的可視化會議,首次正式提出可視化這一術語,標志著可視化作為一個研究領域開始出現在人們的視野中。這次會議對可視化的定義如下:可視化是一種計算和處理的方法,它將抽象的符號表示成具體的幾何關系,使研究者能親眼看見他們所模擬和計算的結果,使用戶看見原本不能看見的東西。它豐富了科學發現的進程,增強了人們的洞察力。可視化的目的是通過這種視覺的方法提供一種新的科學洞察分析方法,從而彌補現有科學分析方法的缺陷[1]。從這個定義我們可以看出,它主要是針對科學計算可視化而定義的,其研究對象主要是科研試驗中產生的大量數據,它的定義存在一定的局限性,可視化不僅僅是一種計算方法,它可將所有這些非空間抽象的信息全都可以通過映射為或轉化為一種可視化形式來方便觀察。
  隨著人們對可視化研究的加深,可視化研究范圍的不斷擴大,1989年,Robertson,Card和Mackinlay在《用于交互性用戶界面的認知協處理器》[2]一文中首次提出了“信息可視化”這個概念。他們認為,由于技術的發展,使得在用戶界面中使用硬件系統的圖形性能和速度來探索3D和動畫成為可能,為了充分發揮其功效,必須開發新的軟件結構以支持復雜的多智能體異步交互的問題。而信息可視化技術是解決問題的關鍵所在,此后信息可視化作為一個學科逐漸成長起來。而實際上信息可視化的提出是基于3D動畫提出的,如今,信息可視化的研究范圍已遠遠超出這個領域。
  在科學計算可視化和信息可視化發展的基礎上,知識可視化應運而生。知識可視化是在科學計算可視化、數據可視化、信息可視化基礎上發展起來的新興領域,它應用視覺表征手段,促進群體知識的傳播和創新[3-4]。一般來講,知識可視化領域研究的是視覺表達方式在提高兩人或兩人以上之間的知識傳播和創新中的作用。這樣,知識可視化指的是所有可以用來建構和傳達復雜知識的圖解手段。除了傳達事實信息之外,知識可視化的目標在于傳輸見解、經驗、態度、價值觀、期望和預測等,并以這種方式幫助他人正確地重構、記憶和應用這些知識[5]。
  2 信息時代情報分析的關鍵環節
  傳統情報研究的步驟包括情報搜集、資料整理、情報分析和形成研究報告等。信息時代,情報學從對文獻的研究已擴大到對信息和知識的研究,情報分析也逐漸演變為信息分析。筆者認為,一個完整的信息分析系統應包括信息組織、信息檢索、信息分析和信息服務,這四要素之間的關系如圖1所示。有機的信息組織和有效的信息檢索方式是快速獲取有用信息的基礎,是信息分析的前提條件,而信息分析則是對檢索獲得的信息的深度挖掘。信息服務是信息分析的最終表達形式。
  G9S501.jpg
  圖1 信息分析系統四要素關系圖
  2.1 信息組織
  信息組織是對信息的序化或整序,它是信息管理和信息分析的前提條件。傳統的信息組織以文獻為主要研究對象,采用手工編制目錄、索引、文獻、綜述等形式進行信息組織。在網絡時代,針對文獻信息的標引方式已不能滿足網絡信息資源的有效組織,人們開始研究利用XML、RDF(Resource Description Framework)、元數據、網絡技術、語義網和本體等信息技術組織信息。
  2.2 信息檢索
  檢索是人類從大量信息中獲取相關的有用信息的途徑,檢索問題的研究貫穿了情報學的始終,它從最早的手工文獻檢索已經發展到了今天的信息檢索。信息檢索指“將信息按照一定的方式組織和存儲起來,并根據用戶的需要找出有關信息的過程”[6]。信息檢索經歷了機械化檢索—自動化檢索—聯機檢索—網絡檢索4個發展過程。在計算機出現后,信息檢索擺脫機械化檢索,步入自動化檢索階段,并且在自動標引、自動文摘和自動分類等方面取得了一系列研究成果。
  2.3 信息分析
  信息分析是進行情報研究的一個重要環節,是理解信息的關鍵,它是以對已知信息的內容進行整序和科學抽象為主要特征的一項信息深加工活動,目的是為了產生具有決策作用的增值信息,以便更好地開發和利用信息資源[7]。傳統的信息分析方法包括定性分析方法和定量分析方法兩大類。定性分析方法包括因素分解法、邏輯方法、歷史比較法、社會調查法和德爾菲法。定量分析方法包括時間序列分析法、因子分析法、聚類分析法、引文分析法和主成分分析法。定性分析和定量分析經常結合使用。
  2.4 信息服務
  廣義上講,信息服務是指根據用戶的需求,提供有用的顯性知識(如用文字、圖像、符號表述的印刷品或電子產品)內容的一切信息服務性活動。依據這個定義,信息組織、信息檢索和信息分析都是信息服務的手段,其中,信息組織和信息檢索是基礎性的信息服務,而信息分析則是增值性的信息服務。在本文中,信息服務特指信息服務提供的最終表達形式。
  3 可視化在情報分析的應用與發展
  實現對信息的理解是情報學研究的終極目的,情報學研究的最終成果應該實現對信息理解。可視化這種方法具有“一圖勝千言”的強大理解力,因此,可視化在情報學界廣泛展開研究。從可視化的發展歷程可以看出,可視化在正式提出的20年來,已從科學計算可視化、信息可視化發展到知識可視化,其研究對象已從數據、信息擴展到知識。通過對可視化20年發展歷程的思考,我們發現可視化已滲透到情報學的各個領域。
  3.1 可視化與信息組織
  本體和語義網是新興的信息組織方式,它們的應用將促進信息組織向知識組織發展。由于本體之間關系的復雜性,引入可視化技術表現本體,能加深人們對信息的理解和認識。本體可視化的發展已取得了一定的進展,開發出了一些比較成熟的本體可視化工具,如Protégé和Kano,它們都能提供多種可視化技術表達本體。Protégé由斯坦福大學研究設計,它是目前比較完善的一種本體支持工具,目前,已經有很多專業領域的本體利用Protégé構建。Protégé使用到的可視化方法包括分類瀏覽器、Jambalaya、TGVizTab和OntoViz等。分類瀏覽器提供了一個Windows瀏覽器界面,通過分層的方法表達本體之間的關系。
  3.2 可視化與信息檢索
  傳統信息檢索模式利用主題詞、關鍵詞和摘要等相關項進行檢索,實際上是將提問詞與文獻標引詞進行嚴格匹配,這種檢索方式在用戶對要檢索的領域不熟悉時,很難得到準確的檢索結果。傳統信息檢索模式對用戶來講是一個不透明的黑箱[8],用戶輸入檢索詞后,檢索過程交給計算機處理,計算機系統怎樣實現檢索詞與文獻標引詞的匹配,以及怎樣對檢索結果進行排序等對用戶都是不透明的,因此,更談不上用戶對檢索過程的控制。傳統信息檢索模式不能有效地展示檢索結果,當檢索返回的信息量很大時,為瀏覽所有的結果,用戶只能不停地翻頁。
  為解決傳統信息檢索模式中存在的一些問題,把可視化引入到信息檢索中來。信息檢索可視化是指把文獻信息、用戶提問、各類情報檢索模型以及利用檢索模型進行信息檢索的過程中不可見的內部語義關系轉化成圖形,在一個二維或三維的可視化空間中顯示出來,并向用戶提供信息檢索的技術。檢索可視化技術應用可以貫穿到整個信息檢索過程。信息檢索可視化為用戶提供了一個良好的人機交互環境,能根據用戶的需求,自動調整檢索策略,并使檢索過程變得透明,從而加大了人們對信息檢索過程的控制能力。對于檢索結果,可視化的信息檢索環境則向用戶提供了更為豐富的信息,除檢索結果外,還能反映出文獻之間的聯系及文獻與引文之間的聯系等。
  目前已有一些信息檢索的可視化系統投入應用。如用于對一個文獻全文進行可視化處理的TileBars、通用信息檢索可視化平臺Visual Net,對ACM Computing Classification System信息系統進行可視化信息管理的GRIDL和基于空間距離和角度的信息檢索可視化系統DARE。
  3.3 可視化與信息分析
  數據挖掘是一種信息分析常用的技術,它是從大量的數據中挖掘出有用的信息,即從大量的、不完全的、有噪聲的、模糊的、隨機的數據集中發現隱含的、規律性的、人們事先未知的,但又是潛在有用的并且最終可理解的信息和知識的非平凡過程[9]。
  數據挖掘成熟的理論方法為發現顯性信息背后隱藏的隱性知識提供了強有力的技術依據。然而,美中不足的是數據挖掘是一門多學科的交叉技術,它是在統計學、數據庫和人工智能等學科基礎上發展起來的,數據挖掘算法本身都相當復雜,所以一般的用戶難以理解和接受。為彌補數據挖掘算法復雜性的缺陷,把可視化技術引入到數據挖掘中,由此產生了可視化數據挖掘技術。可視化數據挖掘充分利用可視化的直觀性,從可視化角度分析和理解數據挖掘的全過程,最大限度地彌補了數據挖掘算法復雜性這一缺陷。可視化數據挖掘的出現為用戶提供了一種易于理解的信息分析工具,提高了人們理解信息的能力。
  可視化數據挖掘包括數據預處理階段的可視化、數據挖掘過程的可視化和數據挖掘結果的可視化。目前的可視化數據挖掘工具能夠提供常用的挖掘技術,但可視化技術的應用仍然有限,主要體現在數據預處理階段的可視化和對數據挖掘結果的可視化,對數據挖掘過程的可視化的研究還比較薄弱。
  目前已出現一些比較成熟的數據挖掘工具,如IBM開發的Intelligent Miner、SAS公司的Enterprise Miner、SGI公司的MineSet、Thinking Machines開發的Dawin、SPSS公司的Clementine和IBM Almaden研究中心開發的Quest系統等。其中,SGI公司的MineSet挖掘器和IBM公司的Intelligent Miner挖掘器將關聯規則生成、聚類、決策數分類等數據挖掘操作與數據可視化捆綁在一起,這樣既能對結果進行評估,又能實時調整挖掘過程中的算法及參數。其他系統提供的可視化工具遠不能滿足用戶的需要。
  3.4 可視化與信息服務
  數字圖書館是信息服務的典型代表,在數字圖書館中,可視化的應用主要體現在信息資源的可視化、信息檢索的可視化和人機界面的可視化。數字圖書館為用戶提供了一個虛擬的圖書館環境,在這個虛擬的信息環境中,用戶可以很好地從視覺上實現和計算機的交互,實現信息的檢索和瀏覽。構建一個數字圖書館要綜合運用到信息組織技術、信息檢索技術和信息分析技術,因此,可視化與情報分析的應用能在數字圖書館中得到集中體現。
  Visual Net是可視化在數字圖書館應用中的一個案例。它將Belmont Abbey學院圖書館的館藏投影到一個以等級結構為基礎的可視化主題地圖上。在這個可視化主題地圖上,用戶可以進行數據挖掘,數據檢索,尋找所需的資料。它的可視化空間實際上是一個語義地圖。在對圖書資源的館藏分布上,Visual Net采用目標體(文獻)圖標釋義圖,用圖標的中心圓、白色圓和綠色圓分別代表文獻的類型、文獻的長短和文獻的新舊,藍色箭頭代表文獻是外文文獻,黃色箭頭代表文獻是參考文獻。用戶可以通過點擊這種表達清晰的圖標選擇所需文獻。
  4 可視化在情報學應用中存在的問題及建議
  4.1 可視化在情報學應用中存在的問題
  目前,可視化技術雖然已趨于成熟,但卻并沒有得到更加廣泛的應用,造成這種情況的原因是可視化是一門涉及多個學科的交叉學科,而情報研究人員大多不是技術人員,因此導致情報人員有時對可視化方法感到無所適從,不知怎么使用這些可視化技術為情報分析服務,造成其應用受限。面對可視化這一新涌現的熱點問題,研究者們開始在各個領域展開對可視化的研究,試圖讓可視化成為自己領域內的有力工具,然而,可視化不是神話,它并不能解決所有的問題,錯誤的使用非但不能提高人們的認知理解能力,反而成為人們理解的障礙。
  4.2 可視化在情報學應用中的幾點建議
  可視化方法已滲透到信息組織、信息檢索、信息分析和信息服務這4個情報分析的關鍵環節中,在情報分析中發揮著重要的作用。這表明,可視化已成為情報學重要的一份子,與情報學研究成為密不可分的一體。在對可視化的研究中,我們應當注意以下幾點。
  1)明確可視化的目的是提高對信息的理解力。在實際應用中不要盲目地追逐潮流,一味地采用可視化方法解決問題。可視化雖然是一種行之有效的提高理解力的方法,但并不適用于所有的情況,在情報學的研究中,應結合情報學的特征,正確使用可視化技術。
  2)明晰可視化的分類方法。建立正確的可視化分類方法不僅能幫助可視化的理論研究者理解可視化設計,而且能幫助可視化的應用者理解怎樣選取可視化方案和應用已有的可視化技術,從而推進可視化技術的應用,使可視化逐步發展成為一個完善的學科體系。
  3)與應用領域緊密結合,對不同對象所采用的可視化方法有時可能完全不同,甚至大相徑庭,脫離實際應用的可視化研究缺乏實際意義,應開發研制與應用領域相結合的可視化技術模塊,使可視化技術黑箱化、模塊化及在特定領域的成品化,使情報分析人員無須了解可視化的技術原理,也能利用這些特定的模塊從事情報分析工作。
  4)進一步研究可視化的評價標準。目前,人們用表現力和有效性來評價可視化的效果,表現力是指可視化的結果使所有的數據得到表現,而且沒有其他的東西被引入;有效性是指可視化能夠使用戶充分發現數據之間的關系和理解數據[10]。評價標準有助于指導用戶設計合理的可視化方案。
情報理論與實踐京15~17,3G9圖書館學、信息科學、資料工作劉波/馬紅妹/徐學文20082008
可視化/信息組織/信息檢索/信息分析/信息服務/情報學/應用
  Visualization/information organization/information retrieval/information analysis/information service/information science/application
Abstract: Visualization is a new hot spot springing up in information science research. From the point of view of information analysis, this paper analyzes the impact of 20 years' development of visualization on information science and offers some suggestions about the application of visualization in information science so as to promote the practical application of lots of visualization technologies in developing information science.
可視化是情報學研究中涌現出的一個新熱點,本文通過對可視化發展20年歷程的思考,從情報分析的角度,分析可視化的發展對情報學的影響,給出可視化在情報學應用中的幾點建議,旨在推動目前存在的大量可視化技術走向實際應用,使可視化切實為情報學的發展服務。
作者:情報理論與實踐京15~17,3G9圖書館學、信息科學、資料工作劉波/馬紅妹/徐學文20082008
可視化/信息組織/信息檢索/信息分析/信息服務/情報學/應用
  Visualization/information organization/information retrieval/information analysis/information service/information science/application

網載 2013-09-10 20:58:00

[新一篇] 20世紀西方課程實驗的歷史經驗及其啟示

[舊一篇] 21世紀中俄關系的回顧與展望  ——“中俄關系:歷史、現狀與未來”國際會議綜述
回頂部
寫評論


評論集


暫無評論。

稱謂:

内容:

驗證:


返回列表