企業競爭情報系統建設中的情報信息收集

>>>  新興科技、社會發展等人文科學探討  >>> 簡體     傳統


  競爭情報系統是對企業整體競爭環境與競爭對手活動信息的一個全面監測過程。它通過合法手段收集和分析商業競爭中有關商業行為的各類信息,整合企業內部信息資源,為企業的決策部門和管理者提供多種途徑、方便快捷的情報信息服務,為企業戰略決策提供依據。競爭情報系統包括:一個中心(競爭情報數據中心);三個網絡(情報組織網絡、人際情報網絡、信息網絡)、三個應用子系統(情報收集系統、情報處理與分析系統、情報服務系統)。
  情報收集系統為競爭情報系統提供穩定可靠與豐富多樣的信息資源,是實施競爭情報系統的關鍵環節。目前,情報收集的主要渠道與手段有:公開的信息收集渠道,如互聯網與聯機商用數據庫;行業出版物、媒體雜志與廣告;行業性會議與展會;工商企業名錄等。非公開的信息收集渠道包括:企業內部及代理商、專業信息咨詢服務機構及行業研究調查報告、逆向工程分解、顧客及行業供應商等。
  隨著網絡技術與互聯網應用的飛速發展,互聯網上的信息資源日益豐富。因此,通過互聯網收集信息應逐步成為企業收集競爭情報的重要渠道與手段。
  1 網絡情報收集渠道分析
  互聯網是浩瀚的信息海洋,是企業獲取情報信息的最便捷高效的渠道。收集互聯網情報的渠道與手段主要有以下幾個。
  1.1 網絡搜索引擎
  利用網絡搜索引擎(如GOOGLE、百度等),根據情報規劃的相關關鍵詞進行搜索,將符合要求的信息下載下來。
  互聯網搜索引擎信息收集方法的優點是操作簡單,容易上手;面向整個互聯網數據源,信息量非常龐大;投入與采集成本低廉。缺點是搜索引擎數據更新需要一定的周期,容易造成收集的情報信息滯后;通過搜索引擎搜索到的信息質量參差不齊,需要大量的人工進行篩選過濾,收集效率低;很多富有參考價值的情報信息搜索引擎往往收錄不了,比如一些商用數據庫中的信息,而這些情報信息恰恰是企業所需要的。
  1.2 商用數據庫
  利用聯機商用數據庫(如萬方數據庫、中國科技成果數據庫、中國科技文獻數據庫等),也是比較理想的網絡情報信息收集渠道。數據庫在競爭情報收集中發揮越來越大的作用,企業可以從一些有利用價值的商用數據庫中得到競爭情報。目前國內外比較適于用作競爭情報源的商用數據庫有:中國百萬商務通訊數據庫、中國經濟信息數據庫、中國科技經濟新聞數據庫、中國科技成果數據庫、中國科技文獻數據庫、中國化學文獻數據庫、中文科技期刊篇名數據庫、中國專利數據庫、中國國家標準目錄與科技標準術語詞典、DIALOG、DATA-BASE、BRS、NEXIS、NEWSNET等。
  通過查詢商用數據庫收集企業競爭情報方法的優點是:這些數據庫覆蓋面廣而細,內容定期更新,有的數據庫甚至是每日更新,時效性較強;目前國內外大多數商業數據庫已經與因特網聯網,查詢方便;這些商用數據庫信息都是來源于權威的媒體與相關機構,可信度比較高。缺點是這些商用數據庫每年均需支付相應的使用費,使用成本較高,尤其是一些知名的商用數據庫更是如此,這就增加了情報信息采集的成本;查詢這些商用數據庫需要一定的專業知識,而且查詢平臺與瀏覽界面不統一,使用者不得不穿梭于各商用數據庫,而且需要人工單篇下載與保存,收集效率極低;收集的信息格式不統一,需要人工整理與格式轉換,這就造成了情報信息無法高效利用。
  1.3 第三方情報代理
  使用第三方情報代理服務,如365Agent、銥星企業情報系統、中國企業競爭情報網等,可以實時獲取互聯網上的競爭情報信息。第三方情報代理服務模式主要有兩種:一是通過信息自動收集系統,實時收集各大門戶網站、行業網站與地方新聞網站等各類知名權威網絡媒體發布的信息,經過機器初步篩選后由人工篩選,按行業進行分類,通過一站式網絡門戶模式向訂購服務的企業提供行業情報的全文檢索與主動推送服務,365Agent即屬于此種服務模式。二是情報代理服務機構收集各類行業與企業的信息,訂購情報信息服務的企業可以根據需要,在第三方代理服務門戶網站上生成如本企業情報信息、行業實時新聞、行業研究報告、競爭對手情報信息等個性化情報服務欄目,用戶可以通過身份驗證進行瀏覽與查詢,銥星企業情報系統、中國企業競爭情報網即屬于此種服務模式。
  利用第三方情報代理服務的優點是:可以實時掌握行業動態,了解全國各地的行業、本企業與競爭對手的活動信息;信息查詢與利用方便快捷。缺點是無法按照企業特定的需要進行信息收集;第三方情報代理機構提供的信息大部分是新聞報道,信息質量不高,利用價值不大;信息存儲在服務機構服務器里,企業無法批量存儲到本地進行信息的分析與挖掘。
  1.4 智能情報信息收集系統
  采用網絡智能情報信息收集系統,可以快速收集企業所需要的特定網絡情報信息。其特點是根據情報收集規劃的需要,對特定的網站進行監測與定時掃描,將滿足采集條件的信息抓取下來,另外也可以按照一個或一組關鍵詞,對搜索引擎搜索的結果進行自動采集與過濾。系統把采集的信息通過智能處理并存儲到情報信息庫中進行利用。目前,企業通常都是采用智能信息收集系統采集互聯網情報信息。
  網絡智能情報信息收集系統的優點是:企業一次性投入可以永久使用,總體而言信息采集與使用成本較低;企業可以根據特定需要靈活定制收集規則,獲取特定的情報信息,使用效率高;系統可以有多重信息過濾機制,可以大大提高信息收集的質量;收集的信息時效性極強;一次性設置完畢,系統便自動根據規則主動監測、跟蹤與掃描特定的網站,自動抓取滿足過濾條件的信息,并批量下載下來,自動存儲到情報信息庫中,中間環節無須人工干預,是真正意義上的智能化情報信息收集系統。缺點是對于系統的操作人員要求比較高,初次設置較麻煩;監測的網站出現變動,收集規則需要人工進行相應的修改。
  目前,應用最廣泛的網絡情報收集渠道是借助與利用智能情報信息收集系統。智能收集技術發展到現在已經比較成熟。
  2 智能情報收集技術
  智能情報收集系統采用的收集與處理技術主要包括:網頁批量抓取與下載技術、自動過濾與去重技術、情報自動分類技術等。
  2.1 網頁批量抓取與下載技術
  在互聯網情報收集過程中,首先需要對目標網站上的符合收集規則的網頁批量抓取下來,這就是網頁批量下載技術。目前,互聯網上的網頁格式復雜,這就給網頁批量下載帶來了挑戰。智能情報收集系統的網頁批量下載技術必須實現如下功能:(1)能夠對各種標準格式信息資源進行批量下載,如HTML頁面、文本信息、表格、圖片(尤其是網頁正文的內聯圖片)、聲音、視頻等;(2)能夠抓取由程序自動生成的網頁,如由JavaScript生成的頁面;(3)能抓取目標網站的后臺數據庫內容(如JSP,ASP,CGI等),同時也可以抓取需要通過用戶身份校驗的網頁內容。
  2.2 自動過濾與去重技術
  網頁抓取與下載完畢,系統會對下載后的頁面進行內容的智能化提取,自動過濾干擾信息,將需要的情報信息抽取出來,并能夠將重復的內容自動剔除。自動過濾與去重技術可以實現如下功能:可以設定一個或一組關鍵詞,根據關鍵詞過濾規則,系統對滿足關鍵詞過濾規則的網頁進行內容的智能提取與干擾信息的過濾,自動剔除網頁的干擾與無用信息。
  2.3 情報自動分類技術
  自動抓取與過濾的情報信息量往往比較大,來源廣泛,這就需要對收集與處理后的情報信息進行自動分類,以提高情報的利用效率。情報自動分類技術目前還不是十分成熟,但是應用需求非常迫切。情報自動分類技術主要表現在以下幾個方面:通過計算機學習自動分類規則,然后對采集的內容進行計算機自動分類;對下載的內容按照主題詞分類方法,計算機輔助人工進行批量分類;用戶可自定義分類規則,通過正則表達式匹配定義來進行分類。
  收稿日期:2007-05-17
L1情報資料工作鞠洪斌/馬林山20072007
競爭情報/網絡/智能采集
文章從企業競爭情報系統建設及應用角度,闡述了互聯網情報對企業戰略決策與發展的重要性,并就網絡情報收集方法、渠道與智能情報收集技術做了相應的分析與闡述。
作者:L1情報資料工作鞠洪斌/馬林山20072007
競爭情報/網絡/智能采集

網載 2013-09-10 21:28:57

[新一篇] 企業排名的價值取向

[舊一篇] 企業要學會六種拋棄
回頂部
寫評論


評論集


暫無評論。

稱謂:

内容:

驗證:


返回列表