简体中文
English
2022-05-24

从“用不用云”到“如何用好云”,企业上云迈入新阶段

SpotMax入选云成本优化实践好案例

Avatar
李悦婷

市场营销专员

上周,中国信息通信研究院和中国通信标准化协会联合主办的“2022云管和云网大会”在京召开,会上正式发布《云优化治理实践指南第一部分:成本优化》白皮书,汇量科技云成本优化方案 SpotMax 入选云成本优化实践好案例,成为首批入选案例。

作为参与编写单位之一,汇量科技首席工程架构师蔡超参与了该白皮书的撰写。

在全面数字化经济大背景的推动下,云计算作为企业数字化转型的基础,整体市场在2021年有明显的高速增长。与此同时,企业的上云需求也从逐渐深化,关注焦点从“用不用云”过渡到“如何用好云”,思考如何提高用云性价比。

信通院调研显示,75%的企业对当前云使用满意程度较低,而企业云优化治理的需求主要集中在 “用云成本如何优化管理”、“云上业务性能如何调优”、“上云后云平台业务发展可持续性较差”等三方面。其中,成本优化最为迫切,落地实施面临挑战。

 

云成本优化:

企业开源节流的新突破口

云成本构成复杂,是云成本优化实施难的最主要外因。以移动广告行业为例,业务具有非常强的潮汐特征。

在进行云服务采买时,企业往往会陷入服务器稳定与用云性价比取平衡的难题:企业每天峰值流量与均值流量往往相差数倍,这一情况下使用价格昂贵的按需实例配合业务的弹性需求,会导致云成本高企;使用相当数量的静态的预留实例确保满足业务峰值时的算力需求,则将导致非业务峰值期的资源和成本浪费。

(按需实例价格最贵,可随时拉取、即买即用;而预留实例价格为按需实例的5-6折,但需承诺1-3年的月使用量,相对静态,难以适应业务量的波动。)

同时,云成本优化行业仍在起步期,不少企业还会面临缺乏有效的云成本组织管理、缺少工具支撑、缺少指导方法等问题。

如何合理、多样化部署自己的算力资源,在保证业务稳定运行的同时,实现企业用云降本增效?

本次入选云成本优化实践好案例的 SpotMax 源于汇量科技 Mobvista 自身用云实践。

Mobvista 基于自身用云需求特性,对云系统架构进行了升级,并针对三种实例计费类型创建了弹性资源管理的解决方案,不仅能够保证资源稳定可用,还能充分利用最便宜的Spot实例资源,SpotMax 也就此诞生。

经过一年的实践,SpotMax 将 Mobvista 用云成本降低了65%。

如今 SpotMax 已对外产品化,服务客户包括数字联盟、店匠(shoplazza)等,帮助更多企业更好地利用竞价实例、降低用云成本。

 

方法大公开:

SpotMax 为全球算力布局保驾护航

汇量科技旗下程序化广告平台 Mintegral 致力于运用其流量优势及广告资源,帮助全球各个地区的开发者与发布商提升用户规模与变现收益,每天的广告峰值请求量达1000亿次以上,并需对单次广告请求做出毫秒级的精准预估和出价回应。

基于全球化的业务定位,汇量科技的业务系统全部建立在亚马逊云科技及阿里云等公有云上。在优化前,汇量科技移动广告平台的云资源配置为:25%按需实例,75%预留实例,居高不下的云成本问题给公司带来了巨大挑战。

事实上,云计算“按使用付费”与“按需获取”的特性是「成本抠门人」最能利用好的,玩好云端收费模式规则,可以实现成本的极致优化。

以 SpotMax 为例,技术团队优先将系统原来的大型单体系统重构为微服务方法,可以精准地扩展瓶颈所在微服务,以便使用更适合的机型精确地实现系统的伸缩。此外,由于云端具有“按使用付费”的特性,大机型和小机型存在很大的价格差,精准伸缩可带来计算成本的节省。

在重构系统架构后,围绕云计算独有的收费模式,SpotMax 技术团队选择了云上鲜少被大家所广泛使用的收费模型–竞价实例。

竞价实例有着和按需实例一样的灵活性,且价格更为便宜;但竞价实例同时也存在可能被回收或紧缺实例类型无法获取的风险,会影响企业服务的稳定性与系统的伸缩。

为了进一步实现精打细算,技术团队从5个方面入手,构建了自动化系统来进行竞价实例资源的管理和调度:

1. 在集群中合理配置多种实例,防止竞价实例回收,导致集群出现大比例的计算资源损失;

2. 利用大数据及AI技术,持续优化集群,降低集群中断概率;

3. 在资源不足时,自动选择兼容类型或按需实例进行集群扩展;

4. 积极的中断预处理,即:使用当中的竞价实例即将被回收前,SpotMax将在接到云商预警通知后,提前向集群补充实例;

5. 在无法获取竞价实例及可使用的兼容实例时,使用按需实例打底。

经过优化后,与2017年12月相比,Mintegral 在承载不断增长的广告请求数量的同时,其单次广告请求的成本降低了65%。在2021年全年,SpotMax 成功为汇量科技解决实例回收问题72438 次、处理资源获取失败问题3972 次,响应速度快,处理效率高。

“SpotMax 作为中立的云成本优化服务提供方,能为企业在跨云模式下提供有效服务,”集团首席工程架构师蔡超提到,“采用云成本优化工具是当前实现上云降本增效的最优选择,未来我们也希望 SpotMax 能应用到不同行业的更多使用场景之中。”

 

活动预告

6月9日,蔡超将以 DevOps 工程师的身份,参与AWS举办的《云原生 DevOps 的 Kubernetes 技巧》,分享汇量科技在云原生工程实践中的经验,扫码即刻报名:

干货满满,“码”上报名 ↑      

Share