shanghai security defense & alarm association 愛建網">
這個世界上什么最值錢?鉆石、黃金、土地?數據,這個世界上最值錢的是數據,確切的說是數據背后所隱藏的豐富信息。管理好數據,分析出其背后的信息至關重要。
新互聯網時代下,各種數據源和數據量爆炸性增加,大數據的概念也應運而生。大數據是“由數量巨大、結構復雜、類型眾多數據構成的數據集合”,現今的數據里,80%是傳統、結構化的數據,另外20%的數據包括視頻數據、圖片數據、音頻數據、郵件數據、社交類數據(如微博、微信、Facebook、Twitter等所產生的數據)等非結構化數據。
大數據所引發的新問題
大數據首先所帶來的就是“量”上的問題,如此海量的數據,需要加大、加快硬件底層的運算能力,需要能夠對各類新形態數據進行處理。虛擬化在解決大數據“量”的問題方面起到了很好的作用。虛擬化一個最直接的好處是可以節省成本,虛擬化技術的廣泛采用,充分利用了服務器里的硬件資源,將原本20-30%的服務器CPU利用率提升到80-90%。這使得海量數據可以更高效、快速的存儲在服務器里。另外通過加大內存、優化內存算法都可以應對大數據對于存儲所帶來的新問題。
把海量數據存儲好就萬事大吉了么?現在戴爾軟件事業部任大中華區售前及售后支持技術總監的高國輝認為單純談數據沒有價值,數據背后所蘊藏的信息才是價值所在。“在大數據的處理過程中,除了加大、加快硬件底層運算能力,讓處理形態更加豐富外,另外的重點是怎樣把它從一個數據變成一個信息。”高國輝舉了一個例子:星巴克所關心的不僅僅是每天來了多少人、賣了多少咖啡這些數據,它所更關注的是通過這些數據所分析出的每天都來了哪些人群、購買了哪種咖啡、搭配購買了哪些東西。
挖掘大數據里的寶藏
大數據時代,企業希望從大數據里挖掘出更具價值的信息。如果不能發現數據里所蘊藏的信息,就需要不斷在存儲設備與網絡設備上增加投入,此時數據就會從公司資產變成公司“負債”。那么如何才能做到對大數據的有效分析挖掘?
要想對數據進行分析,那么首先就需要將數據進行整合,這就需要借助類似Toad這類的軟件把不同的數據庫連接起來,實現數據庫開發和管理自動化。進一步可以借助Boomi確保數據的準確性、完整性和集成性。通過Foglight這類產品能夠對數據的效能進行分析,利用SharePlex強大的復制和集成功能可以確保數據庫的高可用性,而戴爾的B.I.套件則能實現對不同類型數據的訪問、分析、集成和同步,將數據拉進來進行處理,進行展示。
大數據里蘊藏著豐富的寶藏,但由于數據的復雜多樣性,需要將所有數據有效的整合起來。但僅僅這樣還不夠,如果大數據里參雜了過多“混淆視線”的無效數據,那么分析所得的結果很可能會南轅北轍。要想保證對數據的有效分析,就需要保證數據的質量,保證數據沒有丟失、數據本身沒有冗余。只有這樣才能實現有效的數據整理、分析,挖掘出用戶所需要的信息。
另外,將企業數據從業務系統抽取出來,單獨進行分析處理,這需要有一套獨立的IT架構進行支撐,同時要保證數據復制傳輸的及時性。
變革IT架構應對大數據
大數據正在給傳統IT架構帶來新的壓力,IT架構需要進行適當的調整、變革才能適應大數據。應對大數據需要看企業的考慮重點在哪里:是數據在軟件架構上的調整,還是整體硬件的效能。如果希望提升硬件效能,就要考慮虛擬化的問題,比如存儲虛擬化、網絡虛擬化、服務器虛擬化、應用虛擬化。如果需要實時分析傳輸數據,就需要及時拓展網絡帶寬。如果想要將數據開放給更多人訪問,就需要考慮將數據遷移到云端,甚至要考慮移動辦公的問題。這需要對數據進行很好的優化,這樣才能夠有利于數據遷移到云端,方便用戶對數據的訪問。
縮短數據的生命周期是現在應該考慮的問題,這需要透過虛擬化實現對系統的精簡,從硬件層面實現“優化”。最后需要考慮數據的安全問題,比如身份識別及訪問管理,數據的備份及恢復等等。
滬公網安備 31011202001934號