shanghai security defense & alarm association 愛建網(wǎng)">
這個(gè)世界上什么最值錢?鉆石、黃金、土地?數(shù)據(jù),這個(gè)世界上最值錢的是數(shù)據(jù),確切的說是數(shù)據(jù)背后所隱藏的豐富信息。管理好數(shù)據(jù),分析出其背后的信息至關(guān)重要。
新互聯(lián)網(wǎng)時(shí)代下,各種數(shù)據(jù)源和數(shù)據(jù)量爆炸性增加,大數(shù)據(jù)的概念也應(yīng)運(yùn)而生。大數(shù)據(jù)是“由數(shù)量巨大、結(jié)構(gòu)復(fù)雜、類型眾多數(shù)據(jù)構(gòu)成的數(shù)據(jù)集合”,現(xiàn)今的數(shù)據(jù)里,80%是傳統(tǒng)、結(jié)構(gòu)化的數(shù)據(jù),另外20%的數(shù)據(jù)包括視頻數(shù)據(jù)、圖片數(shù)據(jù)、音頻數(shù)據(jù)、郵件數(shù)據(jù)、社交類數(shù)據(jù)(如微博、微信、Facebook、Twitter等所產(chǎn)生的數(shù)據(jù))等非結(jié)構(gòu)化數(shù)據(jù)。
大數(shù)據(jù)所引發(fā)的新問題
大數(shù)據(jù)首先所帶來(lái)的就是“量”上的問題,如此海量的數(shù)據(jù),需要加大、加快硬件底層的運(yùn)算能力,需要能夠?qū)Ω黝愋滦螒B(tài)數(shù)據(jù)進(jìn)行處理。虛擬化在解決大數(shù)據(jù)“量”的問題方面起到了很好的作用。虛擬化一個(gè)最直接的好處是可以節(jié)省成本,虛擬化技術(shù)的廣泛采用,充分利用了服務(wù)器里的硬件資源,將原本20-30%的服務(wù)器CPU利用率提升到80-90%。這使得海量數(shù)據(jù)可以更高效、快速的存儲(chǔ)在服務(wù)器里。另外通過加大內(nèi)存、優(yōu)化內(nèi)存算法都可以應(yīng)對(duì)大數(shù)據(jù)對(duì)于存儲(chǔ)所帶來(lái)的新問題。
把海量數(shù)據(jù)存儲(chǔ)好就萬(wàn)事大吉了么?現(xiàn)在戴爾軟件事業(yè)部任大中華區(qū)售前及售后支持技術(shù)總監(jiān)的高國(guó)輝認(rèn)為單純談數(shù)據(jù)沒有價(jià)值,數(shù)據(jù)背后所蘊(yùn)藏的信息才是價(jià)值所在。“在大數(shù)據(jù)的處理過程中,除了加大、加快硬件底層運(yùn)算能力,讓處理形態(tài)更加豐富外,另外的重點(diǎn)是怎樣把它從一個(gè)數(shù)據(jù)變成一個(gè)信息。”高國(guó)輝舉了一個(gè)例子:星巴克所關(guān)心的不僅僅是每天來(lái)了多少人、賣了多少咖啡這些數(shù)據(jù),它所更關(guān)注的是通過這些數(shù)據(jù)所分析出的每天都來(lái)了哪些人群、購(gòu)買了哪種咖啡、搭配購(gòu)買了哪些東西。
挖掘大數(shù)據(jù)里的寶藏
大數(shù)據(jù)時(shí)代,企業(yè)希望從大數(shù)據(jù)里挖掘出更具價(jià)值的信息。如果不能發(fā)現(xiàn)數(shù)據(jù)里所蘊(yùn)藏的信息,就需要不斷在存儲(chǔ)設(shè)備與網(wǎng)絡(luò)設(shè)備上增加投入,此時(shí)數(shù)據(jù)就會(huì)從公司資產(chǎn)變成公司“負(fù)債”。那么如何才能做到對(duì)大數(shù)據(jù)的有效分析挖掘?
要想對(duì)數(shù)據(jù)進(jìn)行分析,那么首先就需要將數(shù)據(jù)進(jìn)行整合,這就需要借助類似Toad這類的軟件把不同的數(shù)據(jù)庫(kù)連接起來(lái),實(shí)現(xiàn)數(shù)據(jù)庫(kù)開發(fā)和管理自動(dòng)化。進(jìn)一步可以借助Boomi確保數(shù)據(jù)的準(zhǔn)確性、完整性和集成性。通過Foglight這類產(chǎn)品能夠?qū)?shù)據(jù)的效能進(jìn)行分析,利用SharePlex強(qiáng)大的復(fù)制和集成功能可以確保數(shù)據(jù)庫(kù)的高可用性,而戴爾的B.I.套件則能實(shí)現(xiàn)對(duì)不同類型數(shù)據(jù)的訪問、分析、集成和同步,將數(shù)據(jù)拉進(jìn)來(lái)進(jìn)行處理,進(jìn)行展示。
大數(shù)據(jù)里蘊(yùn)藏著豐富的寶藏,但由于數(shù)據(jù)的復(fù)雜多樣性,需要將所有數(shù)據(jù)有效的整合起來(lái)。但僅僅這樣還不夠,如果大數(shù)據(jù)里參雜了過多“混淆視線”的無(wú)效數(shù)據(jù),那么分析所得的結(jié)果很可能會(huì)南轅北轍。要想保證對(duì)數(shù)據(jù)的有效分析,就需要保證數(shù)據(jù)的質(zhì)量,保證數(shù)據(jù)沒有丟失、數(shù)據(jù)本身沒有冗余。只有這樣才能實(shí)現(xiàn)有效的數(shù)據(jù)整理、分析,挖掘出用戶所需要的信息。
另外,將企業(yè)數(shù)據(jù)從業(yè)務(wù)系統(tǒng)抽取出來(lái),單獨(dú)進(jìn)行分析處理,這需要有一套獨(dú)立的IT架構(gòu)進(jìn)行支撐,同時(shí)要保證數(shù)據(jù)復(fù)制傳輸?shù)募皶r(shí)性。
變革IT架構(gòu)應(yīng)對(duì)大數(shù)據(jù)
大數(shù)據(jù)正在給傳統(tǒng)IT架構(gòu)帶來(lái)新的壓力,IT架構(gòu)需要進(jìn)行適當(dāng)?shù)恼{(diào)整、變革才能適應(yīng)大數(shù)據(jù)。應(yīng)對(duì)大數(shù)據(jù)需要看企業(yè)的考慮重點(diǎn)在哪里:是數(shù)據(jù)在軟件架構(gòu)上的調(diào)整,還是整體硬件的效能。如果希望提升硬件效能,就要考慮虛擬化的問題,比如存儲(chǔ)虛擬化、網(wǎng)絡(luò)虛擬化、服務(wù)器虛擬化、應(yīng)用虛擬化。如果需要實(shí)時(shí)分析傳輸數(shù)據(jù),就需要及時(shí)拓展網(wǎng)絡(luò)帶寬。如果想要將數(shù)據(jù)開放給更多人訪問,就需要考慮將數(shù)據(jù)遷移到云端,甚至要考慮移動(dòng)辦公的問題。這需要對(duì)數(shù)據(jù)進(jìn)行很好的優(yōu)化,這樣才能夠有利于數(shù)據(jù)遷移到云端,方便用戶對(duì)數(shù)據(jù)的訪問。
縮短數(shù)據(jù)的生命周期是現(xiàn)在應(yīng)該考慮的問題,這需要透過虛擬化實(shí)現(xiàn)對(duì)系統(tǒng)的精簡(jiǎn),從硬件層面實(shí)現(xiàn)“優(yōu)化”。最后需要考慮數(shù)據(jù)的安全問題,比如身份識(shí)別及訪問管理,數(shù)據(jù)的備份及恢復(fù)等等。
滬公網(wǎng)安備 31011202001934號(hào)