查看原文
其他

撤离 AWS:3 年省下 27.5 亿元

云头条 2023-03-15
作者:Efim Mirochnik是新加坡搜索引擎优化工具厂商Ahrefs的数据中心运营主管之一。
云非常流行,以至于迁移到云已俨然成为了一股趋势。IaaS云具有诸多优势:灵活性、部署时间短、易于扩展、立即覆盖到全球许多地区等等。
云服务提供商通常提供易于使用的便捷服务。凭借营销、会议、认证及其他方面精挑细选的使用场景,人们很容易认为云是现代企业IT的唯一合理的出路。
但获得这些云服务好处的同时也需要高昂的成本。
成本如此之高,以至于我们担心:如果自己的基础设施百分之百放在云端,我们公司能不能存活。这促使我们基于事实进行了一番实际比较。结果如下。

Ahrefs的自有硬件概况

Ahrefs在新加坡租用了一个托管数据中心,其基础设施相当同质化。因此,我们决定合算花在该数据中心上的所有成本,除以服务器数量,然后将其与AWS云端的类似安装环境的成本进行比较(这里将AWS列为主要的IaaS提供商)。
Ahrefs服务器

我们的硬件比较新。托管合同是从2020年年中开始订的,当时正值新冠疫情封锁高峰期。所有安装的设备都是那时购买的。
我们在这个数据中心的服务器有类似的配置。唯一的区别是使用两代CPU,但核心数量一样多。我们的每台服务器使用多核CPU、2TB RAM和2x 100Gbps。服务器平均有大约16个15TB硬盘。
计算每月的成本时,我们假设所有的硬件将只使用五年。我们决定把任何超过五年的硬件资源都视为“免费”。在此基础上,每月的初始设备成本为原价除以60个月(5*12)。
所有目前的成本(比如租金和电费)都是自2022年10月算起。尽管通货膨胀也会影响我们,但试图计入通胀因素会让成本计算变得极为困难,于是我们暂时忽略这个因素。
我们的托管费用包括两大块:租金和实际消耗的电表电量。自2022年初以来,电价大幅上涨。但我们按照最新的、更高的电费来计算每月电费,而不是按照整段租赁期的平均电费来计算,后者电费会更低。因此,这让AWS更有优势。
此外,我们还为数据中心与我们的入网点(POP)之间的IP Transit和暗光纤支付费用。
下表显示了我们每台服务器的每月支出。服务器硬件占每月总支出的三分之二,而数据中心租金电费(DC)、互联网服务提供商(ISP)IP Transit、暗光纤(DF)和内部网络硬件(Network HW)占剩余的三分之一。
我们自己的内部硬件成本结构:

AWS成本结构

由于我们的托管地点在新加坡,于是我们使用AWS亚太(新加坡)地区的价格进行比较。
AWS的成本结构与托管方案不一样。遗憾的是,AWS并不提供CPU核心数量与我们使用的一样的EC2实例。于是我们找到了拥有一半核心数量和1TB RAM的EC2配置。然后,我们将一台Ahrefs服务器的成本与两个这样的EC2实例的成本进行比较。
此外,我们还考虑了EC2的长期使用。因此,我们比较了3年预留EC2实例的最低价格与5年本地服务器的最低价格。
除了EC2实例外,我们还添加了弹性块存储(EBS)。它不是直接连接存储(DAS)的准确替代品,因为我们在服务器中使用容量大、速度快的NVMe驱动器。为了简单起见,我们选择了更便宜的gp3 EBS(不过速度比我们的慢得多)。其成本包括两部分:存储容量和IOPS费用。
我们将数据块的两个副本放在服务器上,但是我们只订购EBS中用于复制的可用空间,因此gp3存储大小的价格相当于我们的驱动器大小除以2:(1*1TB + 16*15TB)/2≈120TB每台服务器。
我们没有加上更高IOPS的成本,我们还忽略了EBS gp3的种种限制。比如说,gp3最大吞吐量/实例为10GB/s。与此同时,单个PCIe Gen 4 NVMe驱动器的性能为6-7GB /s,而我们有16个这样的驱动器并行工作。因此,这不是完全同类的比较,但这种方法可以显著降低AWS的存储成本,从而使其具有进一步的优势。
与托管方案不同的是,AWS按下载的GB收费,而不是按带宽收费。因此,我们粗略估算了每台服务器的平均下载量,并将其用于计算AWS网络流量费用。
将所有这三个部分结合在一起,我们得出了AWS的如下成本分布。

自有硬件 vs AWS

合并上面的表格后,我们可以看到假想的AWS支出要高得多。
自有硬件与AWS EC2每月支出:
AWS中拥有类似可用SSD空间的替代EC2实例的成本与托管数据中心中11.3台服务器的成本大致相同。因此,这意味着我们的20台服务器机架仅相当于AWS中的大约2台服务器。
20台Ahrefs服务器的成本相当于AWS中的2台服务器:
假设我们在数据中心实际使用的两年半时间内运行850台服务器。一旦我们计算出这些数字,就会发现巨大的差异。
AWS与内部方案在30个月内850台服务器的成本:
可以说,自2020年以来,我们需要向AWS支付高达4亿美元(27.5 亿人民币)的费用,才能保持我们在新加坡的基础设施顺利运行。
有人可能会想:“也许Ahrefs掏得起这笔费用?”
没错,Ahrefs是一家盈利的、可持续发展的公司,所以不妨看看其收入,然后计算一番。
话虽如此,我们是一家私营公司,没有义务公布财务数据。但你们可以在《海峡时报》关于2022年和2023年新加坡增长最快的公司的文章中找到有关Ahrefs收入的一些信息。这些文章提供了Ahrefs在2020年和2021年的收入数据。
我们也可以大致推断出2022年的收入。这是粗略的估计,但足以让我们得出一些结论。
Ahrefs的2020年-2022年收入估计:
我们从上表中可以看到,Ahrefs在过去三年的总收入约为2.57亿美元。但我们也计算出,若用AWS服务来替换这样一个数据中心,成本将达到约4.48亿美元。因此,公司收入甚至不够支付两年半的AWS使用成本。
多么惊人的结果!
这么一来,我们还有什么利润可言?
正如LJ Hart-Smith在20年前为波音公司撰写的报告所述:“如果主要制造商或系统集成商无法通过把所有工作外包出去来赚钱,那么谁能从中受益?当然是分包商。”
有必要记住的是,我们为托管数据中心使用高于平均水平的电力成本,只计算EBS的存储部分,忽略了EBS存储的速度有多慢,这实际上已经给了AWS几个优势。此外,这个数据中心并不是我们唯一的成本中心。我们在其他数据中心、服务器、服务、人员、办公室和营销活动等方面投入资金。
因此,如果云是我们基础设施的主要出路,Ahrefs恐怕难以生存。

其他考虑因素

这篇文章没有考虑到会使成本比较更错综复杂的其他方面,包括人际技能、财务控制、现金流量和根据负载类型进行的容量规划等。

结论

在过去的两年半时间里,Ahrefs通过确保其基础设施不是百分之百在IaaS云端,省下了约4亿美元。这个数字在增加,因为目前我们正在启动另一个使用新硬件的大型托管数据中心。
虽然Ahrefs利用AWS的优势在全球不同地方托管前端,但Ahrefs的绝大多数基础设施仍部署在使用自有硬件的托管环境中。如果Ahrefs的产品百分之百都放在AWS上,公司就不会盈利,甚至不会存在。
如果我们完全使用云,基础设施成本将高出10倍以上。但是由于我们没有这么做,我们可以把省下来的钱花在实际的产品改进和开发上。因此,获得更快更好的结果意味着我们的服务器比云所能提供的快得多(考虑到云局限性)。我们的报告也生成得更快速更全面,因为每个报告所需的时间更短。
在这一点上,我建议对可持续增长感兴趣的首席财务官、首席执行官和企业所有者考虑并定期重新评估云计算的收益与实际成本。虽然云计算是早期初创公司的不二选择,但当公司及基础设施不断发展时,将庞大的基础设施百分之百放在云端可能会使公司陷入困境。
这就出现了两难境地。
一旦你上了云再离开云有点棘手。云计算很方便,但容易被锁定。此外,因更高的成本而放弃云基础设施可能不是工程团队想要的。他们可能认为,与老式的实体数据中心和物理服务器相比,云计算是一种极其简单、极其灵活的环境,这有其道理。
对于一家较成熟的公司来说,从云迁移到自己的基础设施很困难。在迁移过程中保持公司的生存也颇具挑战性。但这种痛苦的举措可能会拯救公司,因为这可以避免将收入中越来越多的部分支付给云服务提供商。
大公司(尤其是FAANG)多年来一直在抢占就业市场。它们一直在雇佣工程师来运营庞大的数据中心和基础设施,留给小公司的人才所剩无几。但随着最近几个月大型科技公司大规模裁员,眼下可能是重新评估云计算方法的机会,不妨考虑从云计算迁回到本地,聘请数据中心界经验丰富的专业人士。

如果你开办一家新公司,可以考虑买一个机架和服务器,把它们放在地下室里。这也许一开始就能提高公司的可持续发展性。

 相关阅读 ·


撤离 AWS:省下 4700 万元

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存