建議CSDN用5個9的標準要求服務質量

>>>  技術話題—商業文明的嶄新時代  >>> 簡體     傳統

最近CSDN的Blog板塊不是一般的不穩定,重大故障是屢屢發生。

首先是一次失敗的換版,增加了一些無謂的功能,如最新更新,在每個博客里增加一些頂端鏈接等等。剛上去不久,站點http://blog.csdn.net就不可訪問了。CSDN于是回退倒上一個版本,很多數據出現顯示丟失現象。

接著不久,又有一次更離譜的問題,訪問http://blog.csdn.net居然要求輸入Windows的用戶認證密碼!大概這個時候,CSDN的員工正在現場搶修。

隨著這個周末,CSDN的站點又劇慢無比了!點擊任何一個Blog都需要10分鐘以上才能打開。

這對于提供服務為主要業務的CSDN可以說是企業生存性命攸關的大事故!在我看來,CSDN應該也是列數SaaS(軟件作為服務)的企業,SaaS最重要的是什么?是高可用性(High Available),就是讓用戶始終可以訪問到站點和功能。高可用性對SaaS企業就像水對魚那樣的重要!Salesforce公司,一家被認為是SaaS企業中的翹楚,由于2006年初幾次事故,盡管客戶成長,收入和現金流都非常好,股票卻在數月間跌了25%。為什么,因為投資者對企業的Hosting能力產生了懷疑。

對CSDN來說,提高Hosting能力應該是當務之急。作為一個CSDN的多年用戶,我在這里提幾個建議:

1、少就是多。
產品特性不是越多越好,而是有核心競爭力的特性要穩固易用。少一點特性,多一些易用,是SaaS企業應該奉為圭皋的信條。CSDN的核心客戶應該是博友們,留住這些博友就是所謂的產品的粘性(Stick),而產品粘性最重要的就是易用穩定。

2、Blog板塊的運作應該圍繞Hosting,設定質量指標,如5個9的目標。這里介紹一家國外頂級SaaS公司的運作。
整個企業的由三大板塊組成:Marketing,R&D和Hosting。Marketing負責研究市場,提出新特性,銷售;R&D是做產品;Hosting則負責把R&D研發出來的產品發布到Production環境中去以及各種各樣的監控和維護。這里特別要說明的是,Hosting部門由CIO領銜,人員配備齊全,占公司總人數近1/3,資金充足,是最重要的核心部門之一。就像是電信公司的運行部門一樣。

而R&D部分呢,研發的產品是不能隨便上到Production環境上去的。其產品要上Production的基本流程是這樣:

產品ER - 指Engineering團隊把產品特性完成,通過QA的驗證,作為一個可用版本保存。
 ||
 \/
服務發布驗證 - QA驗證完還不夠,專門一個小組將發布的可用版本做一次模擬安裝,這種模擬安裝要求Engineering提高的安裝說明必須是傻瓜型的,任何錯誤都會被打回去。
 ||
 \/
Beta - 請少數關系良好的客戶,當然包括內部用戶試用。
 ||
 \/
LA - Limit Available,表示讓少數少數關系良好的客戶正式使用。
 ||
 \/
GA - Global Available,全部使用,這時所有客戶才會看到全新產品。

經過的這么都手續,目的就是一個,保證產品升級換代的穩定性。SaaS的軟件比傳統的軟件開發難度大多了,傳統賣拷貝的軟件,安裝新版本,如果出問題,是一個一個個體的問題,而SaaS軟件,則所有的客戶立刻都遇到問題。只要犯一次錯,所有的客戶都知道了。

所以SaaS企業往往特別強調他們的服務的穩定性,通常宣稱的指標就是5個9,既到達99.999%的高可用性。用一個更直觀的說法就是,一年之中,故障時間小于8.76小時。因為全年有365×24=8760個小時,乘以0.001就是8.76小時。

通常這個水平是很難到達的,其影響因素包括網絡、硬件、軟件、數據庫和人員執行等各方面問題。現在最好的SaaS公司大約達到99.990-99.998之間。

建議CSDN迅速采取行動,改善現在糟糕的Hosting能力。
 


網載 2011-02-22 20:27:56

[新一篇] 劍客vs刀客 Java vs .NET之霸道的.NET

[舊一篇] 難倒游戲開發的八道關
回頂部
寫評論


評論集


暫無評論。

稱謂:

内容:

驗證:


返回列表