企業戰略從"業務驅動"轉向"數(shù)據驅動"

随着近年來(lái)企業信息化建設的不斷深化、社會(huì)化網絡的興起,以及移動互聯網等新一代信息技(jì)術(shù)的廣泛應用,全球數(shù)據規模及其存儲容量正在迅速增長,數(shù)據的類型也變得(de)複雜多(duō)樣。海量多(duō)樣化的數(shù)據對信息的有(yǒu)效存儲、快速讀取、檢索提出了挑戰;且其中所蘊藏的巨大(dà)商業價值也引發了對數(shù)據處理(lǐ)、分析的巨大(dà)需求。當前,大(dà)數(shù)據已逐漸滲透到各個(gè)行(xíng)業和(hé)業務職能領域,數(shù)據成為(wèi)企業戰略資産,企業戰略逐漸從"業務驅動"轉向"數(shù)據驅動"。如何通(tōng)過收集和(hé)分析大(dà)量內(nèi)部和(hé)外部的數(shù)據,獲取有(yǒu)價值的信息将成為(wèi)指導企業經營決策、業務運作(zuò)中的核心環節。


什麽是大(dà)數(shù)據(Big Data)

大(dà)數(shù)據技(jì)術(shù)的戰略意義不在于掌握龐大(dà)的數(shù)據信息,而在于對這些(xiē)含有(yǒu)意義的數(shù)據進行(xíng)專業化處理(lǐ)。換而言之,如果把大(dà)數(shù)據比作(zuò)一種産業,那(nà)麽這種産業實現盈利的關鍵,在于提高(gāo)對數(shù)據的“加工能力”,通(tōng)過“加工”實現數(shù)據的“增值”。

從技(jì)術(shù)上(shàng)看,大(dà)數(shù)據與雲計(jì)算(suàn)的關系就像一枚硬币的正反面一樣密不可(kě)分。大(dà)數(shù)據必然無法用單台的計(jì)算(suàn)機進行(xíng)處理(lǐ),必須采用分布式架構。它的特色在于對海量數(shù)據進行(xíng)分布式數(shù)據挖掘。但(dàn)它必須依托雲計(jì)算(suàn)的分布式處理(lǐ)、分布式數(shù)據庫和(hé)雲存儲、虛拟化技(jì)術(shù)。

随着雲時(shí)代的來(lái)臨,大(dà)數(shù)據也吸引了越來(lái)越多(duō)的關注。大(dà)數(shù)據通(tōng)常用來(lái)形容一個(gè)公司創造的大(dà)量非結構化數(shù)據和(hé)半結構化數(shù)據,這些(xiē)數(shù)據在下載到關系型數(shù)據庫用于分析時(shí)會(huì)花(huā)費過多(duō)時(shí)間(jiān)和(hé)金錢(qián)。大(dà)數(shù)據分析常和(hé)雲計(jì)算(suàn)聯系到一起,因為(wèi)實時(shí)的大(dà)型數(shù)據集分析需要像MapReduce一樣的框架來(lái)向數(shù)十、數(shù)百或甚至數(shù)千的電(diàn)腦(nǎo)分配工作(zuò)。

大(dà)數(shù)據需要特殊的技(jì)術(shù),以有(yǒu)效地處理(lǐ)大(dà)量的容忍經過時(shí)間(jiān)內(nèi)的數(shù)據。适用于大(dà)數(shù)據的技(jì)術(shù),包括大(dà)規模并行(xíng)處理(lǐ)(MPP)數(shù)據庫、數(shù)據挖掘、分布式文件系統、分布式數(shù)據庫、雲計(jì)算(suàn)平台、互聯網和(hé)可(kě)擴展的存儲系統。

數(shù)據采集:實現将異構數(shù)據從系統外部采集并傳輸到大(dà)數(shù)據平台的過程,包括數(shù)據爬取、提取、清洗、轉換和(hé)裝載等,保證數(shù)據獲取和(hé)驗證數(shù)據的有(yǒu)效性。

數(shù)據存儲與分析:負責海量多(duō)态數(shù)據的存儲及處理(lǐ),以混搭架構模式實現多(duō)種數(shù)據存儲策略;對經過存儲和(hé)處理(lǐ)後的數(shù)據進行(xíng)分析,主要包括自然語言處理(lǐ)、數(shù)據統計(jì)分析以及數(shù)據挖掘。

數(shù)據服務:将屏蔽底層針對各類數(shù)據服務需求的數(shù)據處理(lǐ)過程,将加工後的數(shù)據、應用等通(tōng)過集中的數(shù)據服務提供功能,為(wèi)外部合作(zuò)夥伴提供數(shù)據服務能力,簡化數(shù)據共享邏輯,集約化數(shù)據分析能力。

數(shù)據應用:通(tōng)過固定報表、多(duō)維分析等方式展現數(shù)據,對內(nèi)支撐企業管理(lǐ)分析、經營分析、服務分析、銷售分析及産品開(kāi)發;對外支撐産品化的數(shù)據服務以及數(shù)據提供。

數(shù)據管控:實現數(shù)據全生(shēng)命周期管理(lǐ),提升企業數(shù)據标準、數(shù)據質量、數(shù)據安全、元數(shù)據管理(lǐ)等基礎數(shù)據管控能力。


大(dà)數(shù)據的價值體(tǐ)現

(1)對大(dà)量消費者提供産品或服務的企業可(kě)以利用大(dà)數(shù)據進行(xíng)精準營銷;

(2)做(zuò)小(xiǎo)而美模式的中小(xiǎo)微企業可(kě)以利用大(dà)數(shù)據做(zuò)服務轉型;

(3)面臨互聯網壓力之下必須轉型的傳統企業需要與時(shí)俱進充分利用大(dà)數(shù)據的價值。

不過,“大(dà)數(shù)據”在經濟發展中的巨大(dà)意義并不代表其能取代一切對于社會(huì)問題的理(lǐ)性思考,科學發展的邏輯不能被湮沒在海量數(shù)據中。著名經濟學家(jiā)路德維希·馮·米塞斯曾提醒過:“就今日言,有(yǒu)很(hěn)多(duō)人(rén)忙碌于資料之無益累積,以緻對問題之說明(míng)與解決,喪失了其對特殊的經濟意義的了解。”這确實是需要警惕的。

在這個(gè)快速發展的智能硬件時(shí)代,困擾應用開(kāi)發者的一個(gè)重要問題就是如何在功率、覆蓋範圍、傳輸速率和(hé)成本之間(jiān)找到那(nà)個(gè)微妙的平衡點。企業組織利用相關數(shù)據和(hé)分析可(kě)以幫助它們降低(dī)成本、提高(gāo)效率、開(kāi)發新産品、做(zuò)出更明(míng)智的業務決策等等。例如,通(tōng)過結合大(dà)數(shù)據和(hé)高(gāo)性能的分析,下面這些(xiē)對企業有(yǒu)益的情況都可(kě)能會(huì)發生(shēng):

(1)及時(shí)解析故障、問題和(hé)缺陷的根源,每年可(kě)能為(wèi)企業節省數(shù)十億元。

(2)為(wèi)成千上(shàng)萬的快遞車(chē)輛(liàng)規劃實時(shí)交通(tōng)路線,躲避擁堵。

(3)分析所有(yǒu)SKU,以利潤最大(dà)化為(wèi)目标來(lái)定價和(hé)清理(lǐ)庫存。

(4)根據客戶的購買習慣,為(wèi)其推送他可(kě)能感興趣的優惠信息。

(5)從大(dà)量客戶中快速識别出金牌客戶。

(6)使用點擊流分析和(hé)數(shù)據挖掘來(lái)規避欺詐行(xíng)為(wèi)。