根據《哈佛商業(yè)評論》最近一份研究報告顯示,越來越多的企業(yè)在尋求企業(yè)級成熟穩(wěn)定的平臺解決方案,在完成基本的數據攝取、數據整合批量處理以及數據倉庫功能的基礎上,還能面向業(yè)務人員提供即時互動的分析工具,以及提供建模、數據科學、機器學習,甚至是一些深度訓練的平臺工具。
Cloudera持續(xù)推動數據管理創(chuàng)新
Cloudera作為企業(yè)數據云的領導者,多年來一直致力于將復雜的數據轉換為清晰而可行的洞察力。2008 年,順應技術發(fā)展潮流的Cloudera 成立,持續(xù)關注如何能讓用戶更快的從數據里獲取價值。2019 年,Cloudera 提出了全新利用數據的方式-- Cloudera Data Platform(以下簡稱 CDP),賦能企業(yè) IT 從而應對新的商業(yè)挑戰(zhàn)。CDP 是世界上第一款企業(yè)數據云平臺產品,Cloudera 的開源的商業(yè)模式發(fā)展戰(zhàn)略以及新的開源許可模式,為 CDP 未來的發(fā)展提供原動力。
本文將探討 Cloudera對于企業(yè)級數據管理的深刻理解,以及如何在數據管理需求不斷更替的今天推動開源和創(chuàng)新。
企業(yè)的數據管理需求日新月異
以 2020 年為時間節(jié)點,回看過去十年以及展望未來十年,企業(yè)對數據的應用需求迥異。
過去的十年里,用戶需求主要集中在解決高效的存儲,并且能夠同時處理大規(guī)模數據。通過分布式的方式把數據分散在不同的服務器上,以分而治之的方式來并發(fā)處理數據,避免網絡傳輸帶來的消耗和延遲等。Hadoop 在過去十年里解決用戶需求的同時也在不斷自我演進。Cloudera's Distribution Including Apache Hadoop(CDH)作為眾多 Hadoop 分支的一種,得到了企業(yè)用戶廣泛的認可和使用。
未來十年里,現有的數據管理使用架構與解決方案面臨新的諸多挑戰(zhàn)。例如龐大集群規(guī)模部署時間長,企業(yè)實際應用中缺乏高效數據隱私與安全管理,數據災難恢復能力弱,多云及混合云跨云管理繁瑣等。都需要在現有技術架構基礎上進行延展從而來應對這些新的挑戰(zhàn)。Cloudera 的全新 CDP 產品就是為了幫助用戶應對未來的新挑戰(zhàn)。
從 Cloudera 數據架構的迭代,看數據管理方式的轉變
Cloudera 在 Hadoop 基礎架構下發(fā)展出的商業(yè)版 CDH,是第一代架構的代表,主要關注在本地部署云上集中同位的存儲和計算以及大型共享集群;Cloudera 認為的第二代架構,主要關注在公有云上的存儲與計算解耦和多集群,例如 Amazon EMR;Cloudera 目前提出的平臺方案 CDP 被認為是第三代架構,主要關注在多云以及混合云上的存儲與計算解耦,多租戶以及容器化的 SaaS 體驗。
去年年初,Cloudera 正式完成與 Hortonwork 的合并,新公司采用 Cloudera 品牌,新數據平臺將 HDP(Hortonworks 數據平臺)和 CDH(Cloudera Distribution Hadoop)的功能進行結合,加入安全治理堆棧,支持百分百開源,同時支持國際主流的五大公有云平臺,這意味著Cloudera 開始全面轉變?yōu)橐患覕祿乒尽?/div>
數據云公司Cloudera致力于建設多重能力
"在任何云上面,不管是在公有云、私有云,混合云,還是公有云上的任何一朵云,都可以來運行 Cloudera 的數據平臺。
"提供全數據生命周期支持,不只是提供 Hadoop 技術本身的支持,還提供在整個數據生命周期所有使用到的工具和平臺,包括數據采集、IoT、數據分析、BI、數據倉庫、機器學習、數據科學等。
"在數據安全和治理上,提出了共享的數據體驗架構,實現存儲層和計算層的解耦,更好的管理源數據,同時實現數據存儲分離。對數據的安全、治理、血緣和審計方面,提供了單獨的 SDX 工具。
"延續(xù) 100% 開源宗旨,保證產品開源開放。
多重能力轉化為Cloudera 云數據平臺軟件 CDP
Cloudera 的云數據平臺軟件 CDP可以為企業(yè)從數據戰(zhàn)略上提供完整的服務,其多云和混合云的統(tǒng)一平臺解決方案,可以實現快速部署,并靈活適用于企業(yè)各自的云使用策略,節(jié)約成本同時實現快速上線。全數據生命周期的支持可以讓企業(yè)更加高效的使用數據和挖掘數據,提升企業(yè)數據價值。同時數據安全治理為分布各種云上的數據提供有效管理。因此,現在的 CDP,既能提供多云與混合云的統(tǒng)一平臺解決方案,又可以支持企業(yè)全數據生命周期中提升數據價值,還能實現企業(yè)云上的數據安全治理。
管理多云、公有云、私有云與混合云的新理念
企業(yè)在使用云的策略上,通常會根據其業(yè)務特點選擇公有云或私有云,有的企業(yè)也會選擇公有云 + 私有云,并構建混合云環(huán)境。Cloudera 在多云以及混合云的使用方面提出了很多新的理念和實踐。
私有云對象存儲標準
對公有云來說,原生云服務商建立了相關的對象存儲標準,但私有云目前并沒有對應的標準。Cloudera 通過主推 Ozone 為私有云提供未來的對象存儲標準。Ozone 是 Cloudera 在 2019 年創(chuàng)建并引入的一個 Hadoop 子項目,是一個開源的對象存儲項目。引入 Ozone 是為了能夠徹底解決 HDFS 文件數量的限制的弱點。目前很多企業(yè)用戶在部署大規(guī)模集群的時候,都需要使用 HDFS 聯邦,而 HDFS 聯邦在實際應用中也存在各種問題,并不是最佳的解決方案,隨著集群規(guī)模不斷的增長,局限性也日益突出。
Cloudera 在不斷研發(fā)一些底層的新的存儲技術,計劃未來幾年能夠替換 HDFS,為企業(yè)用戶部署大規(guī)模集群提供更加優(yōu)化的解決方案。
數據存儲與數據處理的集成
結合 CDP 存儲跟計算分離的概念,Cloudera 將 Ozone 定位為私有云的數據存儲引擎。Ozone 可以被理解為私有云里面的"S3",所有數據都是存放在 Ozone 里面,而分離的計算集群都是通過源數據,網絡遠程處理。未來規(guī)劃中,Hive、Spark、Impala 等一系列的處理引擎都會跟 Ozone 集成。
同時私有云版上跟公有云版進行映射,從而使存儲的接口和計算引擎都可以在 Ozone 上實施。由此不但可以滿足用戶使用對象存儲接口的需求,而且可以靈活的去分配計算資源,為開發(fā)帶來便捷。
混合云體驗
從不同云的使用上講,CDP 提供公有云、Data Center和私有云版本,并提供體驗相同的各種數據服務。例如流式處理、Hive 批量處理、Spark 和即時查詢等,用戶在私有云環(huán)境里面,可以獲得跟公有云一樣的體驗。用戶使用 CDP 在自己搭建部署的云和使用 CDP 在原生云服務商的公有云時,CDP 都會提供統(tǒng)一的用戶界面和相同的使用的方式,避免了用戶重復學習,同時大大節(jié)約了運維集群的時間。
開源商業(yè)模式及 CDP 發(fā)展戰(zhàn)略
開源是軟件技術創(chuàng)新的潮流,幾乎所有最新的技術都是以開源的形式在傳播和推廣。同時開源會成就技術的多樣化,一個百花齊放社區(qū)的文化可以持續(xù)不斷的發(fā)展。Cloudera 也會借助開源強大的創(chuàng)新能力,不斷提升對用戶的服務。
Cloudera作為一家開源公司,會延續(xù) 100% 開源的宗旨,并保證產品的持續(xù)開源開放。Cloudera 的新的授權許可方式整合了 Hortonworks 和 Cloudera 各自在之前使用的授權許可方式,并在合并 Hortonworks 之后做出了一些新的改變:
"在授權許可方面,Cloudera 所有產品均將采用 OSI 批準的許可證,即 Apache 軟件許可證 (ASL) 或 Affero 通用公共許可證 (AGPL)。在此基礎上,Cloudera 貢獻代碼的由 Apache 軟件基金會托管的所有開源項目將繼續(xù)由 ASF 監(jiān)管。同時,Cloudera 的代碼貢獻模式沒有改變,第三方項目將繼續(xù)采用 upstream first 方式。第三方項目代碼庫的公開源僅保持在 upstream。
"Cloudera 將采用市場及全球企業(yè)用戶已接受的類似紅帽的開源模式。自 2019 年 11 月起,產品的二進制文件都將置于付費專區(qū),并對廠商提供了一定程度的保護,因此需訂閱后才能訪問。二進制文件包含 Cloudera 特定的知識產權,將許多分散的開源項目整合到企業(yè)級的功能系統(tǒng)中。
"CDP 會對 Hadoop 開源組件進行精選與整合,結合新創(chuàng)建的開源項目,提供跨云服務、全數據生命周期支持、數據安全和治理等,滿足企業(yè)級用戶的需求,為企業(yè)提供完整的云數據服務。
訂閱模式為客戶創(chuàng)造新價值
Cloudera 對以上新的開源許可策略與其業(yè)務模型進行了有機的結合,在最終制定策略方向之前,與客戶、行業(yè)專家、律師、同行公司和員工等進行了充分討論與咨詢。采用類似紅帽開源模式,是以更友好的開源軟件企業(yè)化商業(yè)模式服務于用戶,也突顯了軟件產品"面向服務"本質。而Cloudera 的軟件產品按訂閱方式提供,則減少了購買軟件的麻煩。
購買訂閱服務與購買私有軟件許可相比,訂閱提供用戶所需的一切,不需要用戶端訪問許可,不需要持續(xù)為升級投入成本,沒有服務支持限制以及隱藏費用。購買訂閱的用戶可以獲得諸多價值,例如:
- "訂閱使用戶可以持續(xù)訪問 Cloudera 的商業(yè)軟件,獲得更新與維護,包括所有安全更新和漏洞修復。
- "訂閱不依賴于特定的版本或架構,讓用戶無需任何代價即可升級系統(tǒng),易于基于云的服務器上輕松部署。
- "購買訂閱可以獲得 Cloudera 的全球服務支持,解決用戶的后顧之憂。服務支持與用戶合作過程中,也打開了用戶與 Cloudera 研發(fā)團隊的通道,在與用戶充分的溝通過程中,研發(fā)團隊也能更好的根據用戶的反饋研發(fā)更加貼近用戶需求的產品。
"Cloudera 擁有 700 多個研發(fā)工程師,其中大概 300 名左右的 committers,同時其系列產品在全球幾千個大型客戶經過廣泛的驗證,用戶的問題可以得到快速解決。因此企業(yè)用戶訂閱 Cloudera 的企業(yè)版產品,不需要建立各自的技術團隊進行平臺底層研發(fā)和日常維護,讓企業(yè)最大限度的節(jié)省平臺成本投入。
"用戶訂閱本質上是購買 Cloudera 所提供的服務,使用戶能夠釋放出維護軟件版本所需的大量寶貴的工程師資源,也不必擔心轉換平臺供應商所帶來的成本投入,令用戶能將更多資源投入在能產生更多收入的應用和產品服務上。
"Cloudera 開發(fā)了諸多開源項目,這些項目已經成為行業(yè)標準,但是沒有一家公司可以成為創(chuàng)新唯一來源。通過投資Spark,Kbernetes和Kafka等開源項目,通過訂閱服務,用戶可以獲得可持續(xù)發(fā)展的長期架構。
通過更開放包容的商業(yè)策略,Cloudera最大限度的發(fā)揮開源社區(qū)創(chuàng)新的原動力,持續(xù)為客戶提供更好的服務。
結語
在應對企業(yè)用戶新需求方面,CDP 通過簡化操作,減少了在整個企業(yè)機構內上線新用例的時間。同時使用機器學習來智能地自動調整工作負載,能更經濟有效地使用云基礎架構。CDP 還可以管理任何環(huán)境中的數據,包括多種公共云、裸機、私有云和混合云環(huán)境。此外,借助共享數據體驗技術(SDX)、CDP 中的安全和治理功能,IT 人員可以放心地在任何地方提供針對數據運行的安全分析。
綜上,Cloudera的集成數據平臺解決方案能夠讓企業(yè)更加靈活的組建符合各自需求的云服務,最終通過使用 CDP 進行統(tǒng)一管理。同時,其數據隱私以及安全管理方面的設計,可以幫助企業(yè)保證日常的安全運營。此外,Cloudera 在堅持開源的基礎上,持續(xù)探索關于開源生態(tài)、商業(yè)模式的更多可能性。
如需了解有關企業(yè)數據云和Cloudera 數據平臺(CDP)可用性的更多詳細信息,請訪問 cn.cloudera.com。
【免責聲明】本文僅代表作者本人觀點,與CTI論壇無關。CTI論壇對文中陳述、觀點判斷保持中立,不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。
相關閱讀:
- ·5G時代,電信運營商數字化轉型刻不容緩2020-04-09 15:23:36
- ·Cloudera推動即時通訊巨頭LINE實現數據驅動的創(chuàng)新2020-04-02 11:10:50
- ·Palo Alto Networks(派拓網絡)發(fā)布COVID-19云威脅環(huán)境報告2020-05-12 13:48:37
- ·華為云政企戰(zhàn)略暨新品發(fā)布會[5月15日]2020-05-12 13:44:02
- ·科天云,章魚云會議全流程解決方案“c”位出道2020-05-12 10:27:53
- ·眾麥通信APP和網頁呼叫通話服務 賦能互聯網醫(yī)療在線問診2020-05-12 10:07:37
- ·化危為機!平安金服創(chuàng)新模式助力“云上服務”2020-05-12 10:03:50
- ·2020年華為全球分析師大會就要來了!2020-05-12 09:27:46
- ·獨行快,眾行遠,在線教育創(chuàng)新季等你來!2020-05-12 09:36:05
- ·告別傳統(tǒng)人工回訪,壹鴿智能語音回訪機器人用AI“聲”援!2020-05-12 09:17:31