引言:上篇文章《云数据中心,从摩尔定律到贝佐斯定律》,我们了解到贝佐斯定律:数据中心单位算力的成本每3年下降50%,自2006年 AWS 成立以来,截至2021年4月已经降价107次,本文我们探讨一下云数据中心成本降低背后的源动力。?
导读:
1、云服务商的市场竞争
2、数据中心算力成本下降
3、数据中心资源利用率提升
1、云服务商的市场竞争
云计算的市场竞争是全方位的,现阶段云服务商主要与客户的自建数据中心进行竞争,同时也需要面对其他云服务商的竞争。竞争为客户带来了更丰富的产品,更具性价比的产品,客户逐渐依赖云服务商的基础设施及服务来构建云原生应用。
自建数据中心主流的模式是Hosting模式,即租赁 IDC 机柜及网络带宽,公开市场采购交换机、服务器和存储,自行维护虚拟化、操作系统、数据库、应用程序及数据。租赁的 IDC 机柜及网络带宽计入日常运营费用,按月或季度结算,交换机、服务器及存储计入固定资产费用,一次性投入按年折旧固定资产,虚拟化、操作系统、数据库、应用程序及数据等费用算研发投入,部分投入可以作为资产化按年摊销。一般来说,公司每年都需要制定明年的固定资产投入预算,此时公司会盘点一下自建数据中心更具优势,还是迁移到云上性价比更高。“迁移上云” 的共识正是在一次次的竞争力对比中形成的,新创业公司没有历史包袱,决策相对简单,而大型企业不仅会考虑新投入资源的成本,还会考虑已经在自建数据中心投入的基础设施研发费用等,能不能抛弃之前研发投入的 “沉没成本” 是决策的关键影响因素。
云服务商之间的竞争,为客户提供了更多的选择及议价权。一方面云服务商基于公开市场竞争进行定价,同样的服务定价不会有较大差异,否则就会失去市场份额;另一方面也会针对客户进行差异化定价,如为新客户提供更多的优惠,为大客户提供更具吸引力的价格。差异化定价虽然能在短期内吸引一些客户,但依靠迁移成本来绑定客户并不可持续,客户在新业务中仍然面临新的决策。
云计算是一个充分竞争的市场。截至2020年底,亚马逊的市场份额一直稳定在32%-34%之间,微软的市场份额快速增长,从10%增长到20%,Other中大批中小云服务商的份额过去4年下降了13%,其中包括 Salesforece、腾讯、甲骨文、NTT、百度、SAP、富士通和 Rackspace 等。
从成本收益的角度来说,公有云已经优于企业自建数据中心,公有云之间的竞争会为企业长期提供更高性价比的服务。而企业在不同业务场景下选择更优的云服务,形成了混合云(Poly Cloud)的模式。
2、数据中心算力成本下降
正如贝佐斯定律所示,“数据中心算力成本每3年下降50%”,那么是什么因素驱动了算力成本的下降呢?
# 摩尔定律预示CPU成本下降曲线
根据摩尔定律所示,“CPU成本每18到24个月就会降低50%”,自1965年以来,CPU的成本下降一直符合摩尔定律,推动了单位算力的成本下降。目前 AWS 支持各种主流芯片,如Intel Xeon系列、AMD MILAN系列、以及 Graviton 系列自研芯片。
在2019年,英特尔多次推迟 10nm 处理器意味着摩尔定律预示的增长已经放缓。
# 自研芯片提升性价比
AWS作为主要的云服务提供商,非常了解用户的工作负载需求,可以针对性解决用户负载的性能瓶颈,提供具有性价比的计算服务。2018年,AWS发布基于 ARM架构的 Graviton 芯片,主要应用于Web及应用服务器;2019年,AWS发布Graviton 2芯片,适用于各种应用场景,如微服务、数据库、大数据、高性能计算等,比 X86 架构的芯片性价比提升40%,生态也更加完整;2022年,AWS发布 Graviton 3 芯片,浮点运算能力提升2倍,尤其适用于机器学习场景。
AWS上已经有超过20种托管的云服务运行在 Graviton2 芯片之上,为客户降低了成本,如 Snowflake 财报中披露,由于用户将运行实例切换 Graviton2 实例执行同样的业务花钱更少了。此外对一些服务AWS还提供“在线换芯”,客户的服务不受影响,几分钟时间从 X86 芯片切换到 Graviton2 芯片。
此外,AWS还针对机器学习场景推出了训练芯片(Inf1)和推理芯片(Trn1),如Alexa Echo 音箱采用 Inf1 芯片 运营成本比 GPU 芯片降低30%。
# Nitro 芯片负责网络、存储、安全及管理
在引入Nitro芯片之前,AWS采用软件虚拟化技术为多租户提供隔离的服务器,但软件的虚拟化会带来30%左右的性能损耗。
AWS通过 Nitro 芯片将网络、存储、安全和管理等计算需求从 CPU 卸载到 Nitro 芯片,Hypervisor 只需要消耗很少的 CPU 计算资源。
Nitro 芯片采用自研通信协议 SRD 进行网络传输,支持高达 800Gbps 的网络带宽,并且不消耗客户 EC2 的资源。SRD 协议针对 TCP 协议的缺陷进行优化,可以最大化利用所有网络链路,如果链路发生故障可以快速恢复,避免热点;并大幅降低尾部延迟和延迟抖动,改善客户端到端的网络延迟。
其他云服务商也提供了类似的芯片,如阿里云 X-Dragon、Azure Catapult等
与自建数据中心相比,云服务提供商依托规模优势,采用自研芯片(SmartNIC)对数据中心进行垂直整合表现出了强大的性价比优势,这些在自建数据中心是买不到的。AWS CTO Werner Vogels 认为“ Nitro 芯片是 AWS 的创新之源”。
预测一下:云数据中心将会进化成与自建数据中心完全不同的物种。
3、数据中心资源利用率提升
根据麦肯锡早期的报告显示,全球数据中心的资源利用率6%左右,而Gartner的估计要乐观一些12%,腾讯云对1000多家客户的抽样调查显示资源利用率在10%左右,可见资源利用率有巨大提升的空间。
# 按量付费的商业模式
云服务多采用按年收取订阅付费,不管用不用都需要付费。而 AWS 选择采取按量付费,从商业定价规则上鼓励按量付费减少浪费。如果用户每天使用时长小于16小时,按量计费会更划算。
# 丰富的计算类型
对数据中心来说,对客户的需求进行管理和预测,避免太多闲置服务器浪费;对客户来说,选择适合业务场景的 EC2 实例,不用的 EC2 实例及时回收,根据业务波峰波谷弹性扩容缩容服务实例。
2006年,AWS 推出第一款 EC2 实例以来,2022年已经有475+种 EC2 实例满足客户在各种场景下对 CPU 和内存比率的需求。
# 无服务器服务
AWS 是无服务器的倡导者。早在2004年就推出了无服务器的消息队列服务 SQS,2014年发布了无服务器计算 Lambda,后来又先后发布无服务器容器 Fargate,无服务器数据库产品 Aurora,2021年底一口气发布5款无服务器产品,包括数据库仓库 Redshift Serverless、大数据分析 EMR Serverless、托管的Kafka服务 MSK Serverless、实时流数据处理 Kinesis On-demand、机器学习推理服务 SageMaker Serverless Inference等。无服务器的计算能力已经从计算、存储和数据库扩展到数据分析、数据库仓库和机器学习等领域。
通过采用无服务器架构客户无关心服务器及相关的运维,根据使用量进行计费,只需要为使用的资源付费,极大降低资源浪费。如果使用 EC2 推理节点,空闲资源导致成本提高,而使用 Amazon Lambda 服务,就不需要再考虑集群节点管理这些事情,服务会根据 Workload 自动预置、扩展和关闭计算容量,只为执行时间和处理的数据量付费,相比之下能节省很多。
# 智能分层的对象存储
2006年,AWS推出 S3 对象存储服务以来,2022年已经支持多种分层的对象存储服务,包括S3 Standard、S3 Intelligent-Tiering、S3 Standard-Infrequent Access、S3 One Zone-Infrequent Access、S3 Glacier Instant Retrieval、S3 Glacier Flexible Retrieval(原 S3 Glacier)和 S3 Glacier Deep Archive,其中最便宜的 S3 Glacier Deep Archive 价格不到 S3 Standard 价格的5%。
而且 AWS 还提供了 S3 智能分层服务,根据对象的访问特征自动将低频访问的数据迁移到成本更低的 S3 Glacier 分层。
# 成本洞察工具
除了为用户提供丰富的产品选择提高数据中心的资源利用率外,AWS 还为用户提供的多种成本洞察工具,辅助用户合理利用资源,降低成本。如Compute Optimizer会为您的工作负载推荐最佳实例种类及规格大小,以降低成本并提高性能,支持EC2、EBS、S3等产品;Trusted Advisor优化基础设施、安全性和性能,以及降低成本、监控服务配额;Cost Explorer可以查看和分析您的成本和使用情况,QuickSight提供成本可视化方案。
总结,AWS 主推按量付费的商业模式,并提供了丰富的计算实例、无服务器计算引擎及各种托管的无服务器产品、智能分层的对象存储等产品,引导用户合理规划资源提高利用率,还为用户提供了多种成本洞察工具,提高成本的透明度。
未来数字化在业务运营中的比重会越来越高,所有企业都是软件企业。对大多数客户来说,相比数据中心的运营成本,业务研发效率的提升更为关键。一些企业的实践已经带来的研发效率的提升,如采用无服务器重构运营流程、采用托管的云服务或第三方SaaS服务代替自建系统等,这个话题我们后续有机会单独聊一聊。
文本是商业化系列文章,对相关话题感兴趣的同学客户可以关注后续更新~
推荐阅读:
《云数据中心,从摩尔定律到贝佐斯定律》
《S3 对象存储:云计算产品影响力 No1》
《Serverless:云计算默认的计算范式》
《公有云太贵了,要自建数据中心?》
如若转载,请注明出处:https://www.hanjifoods.com/17495.html