报告解读 | 中国成为全球最大数据圈,分布式迎利好——Gartner 存储与数据保护技术 Hype Cycle 解读

时间:2022-08-24

在最新Gartner公布2022年存储和数据保护技术成熟度曲线(Hype Cycle for Storage and Data Protection Technologies, 2022)报告中,Gartner 描述了存储与数据保护领域 21 项最受关注的创新技术,并定义和分析了每项技术对企业的价值、采用情况和预期的未来增长速度。软件定义存储基础设施成为本年度唯一的变革性技术,分布式文件系统、对象存储、容器原生存储优先级评级均为“高”。


 

分布式取代纵向NAS承载关键业务

 

根据2022Gartner存储技术成熟度曲线,为非结构化文件数据构建可扩展且低成本的分布式存储平台是I&O领导者的当务之急。现有非结构化数据的加速增长和基于文件的工作负载的引入,将分布式横向扩展存储架构带到了IT基础设施规划前沿。

 

Gartner认为,分布式存储具有三大机遇。其一,面对非结构化数据指数化增长,I&O领导者越来越多的用分布式横向扩展文件系统产品来取代纵向扩展NAS设备系统,以获得容量和性能线性扩展的益处。其二,企业正在为非结构化数据指数级增长做准备,并寻求更好的数据洞察,以及与云存储集成,以实现长期数据生命周期管理。其三,大数据分析、人工智能(AI)和机器学习(ML)应用成为分布式存储的典型用例。

 

比如,大型赛事会采用8K超高清进行直播,视频画面每一帧都十分美,围绕着视频的采、编、播和管全流程对存储提出更高的要求。其中非线编过程要求存储提供高吞吐、低时延,保证视频画质质量;视频素材价值高又需要视频处理过程7*24小时稳定运行。

又如,自动驾驶最近几年十分热门,其训练全流程包括数据导入、清洗、预处理、训练和仿真分析,各个环节使用不同协议,数据流转和拷贝会显著降低AI训练效率,同时增大数据存储量;训练过程则需要大的吞吐量和低时延来满足GPU训练的需求。

最后,虚拟化/云化市场这些年增长很快,越来越多的核心关键应用上云,数据访问过程中需要更高的IOPS、更低时延,保证关键业务运行无卡顿;云平台业务增长快,需要系统提供弹性空间,系统扩容更加便捷。



技术上,我们看到报告主要描述了分别位于生产成熟期(Plateau of Productivity)、泡沫破裂谷底期(Trough of Disillusionment)和期望膨胀期(Peak of Inflated Expectations)的四项主要技术:超融合、基础设施SDSNVMe-oF 和容器原生存储。


总结


根据 Gartner Hype Cycle 可以看出,多项基于分布式架构和云化基础设施的存储技术已经或即将在未来 5 年左右达到生产成熟阶段。而随着技术的渗透与市场的扩大,厂商是否真正具备自主研发的技术、生产就绪的产品、稳定可靠的方案、灵活便捷的交付形式、快速响应的服务将是企业挑选存储方案的考察重点。


数字经济成为社会经济发展的新引擎,其繁荣发展必然带来数据的爆炸性增长。IDC预测,2025,中国的数据量将增长到48.6ZB,80%是非结构化数据,将成为全球最大的数据圈,这让擅长存储、处理非结构化数据的分布式存储迎来利好。同时数据要素、东数西算、软件发展规划等一系列政策纷纷出台,各行业都在鼓励分布式相关技术的应用与部署,有望在基础设施层推动分布式存储的普及与应用。