科技资讯媒体ITFEED

首页 电商 互联网 硬件 创投 生活

大促下单峰值增长10倍,仍毫秒级处理,还节省50%资源成本,网易严选做对了什么?

最近,网易严选一系列动作给人留下深刻印象。4周年庆刚结束,期间狂派4亿消费券,一口气上线600多款品质新品,更上了老罗的直播首秀带货。

而在更早的春节期间,网易严选除了迅速联动供应商,加量防疫物资生产,还在第一时间上线防疫用品的免费领取频道,成为这场疫情防疫中最早支援的电商平台,累计帮助用户20余万人。3月,网易严选上线小微企业口罩政府保供通道,每天开放20万只口罩申购,帮助企业复工复产。

而在这背后,刚刚过完4周岁的网易严选,应对痛点和需求,做对了什么?

流量稳定应对问题。促销是获客、吸引流量的有效手段。但促销频率提升,尤其是大型促销带来的流量加大,对系统整体稳定性、扩缩容速度要求更高。因此,稳定应对流量大军,是电商企业的一门必修课。

拿网易严选来说,一年有好几场大促,例如4.11周年庆、双11大促、黑五大促等都是重要时刻。为了保障这些活动时系统的稳定性,网易严选提前借助轻舟微服务,引入轻舟容器云,让所有业务服务有健康检查、宕机拉起等高可用能力。在大促等大流量场景下,即使部分业务异常,也可以及时监测并快速拉起,提升整体稳定性。而在此前,业务是基于虚拟机方式来部署与运维的,缺乏动态扩缩容、调度、部署能力。

同时,借助容器化分布式消息中间件,扩容从以前需要用物理机方式手动操作半小时,到现在只需要修改配置就能实现,总体时间加速到只需要几分钟,随之而来的,就是运维成本及复杂度的大大降低。

以2019年双11来说,那天,网易严选的下单峰值同比增长10倍,仍然是毫秒级处理。活动的第一个小时,下单总量同比增长215%,而借助轻舟微服务基于Kubernetes构建的弹性伸缩能力,网易严选顺利扛住流量大军,保障服务质量。

不只顺利完成大促任务,这对资源、成本的优化利用也是显而易见的。大促前,网易严选可以快速对资源上下线;大促后,也可以快速回收资源。在性能不变的情况下,这样就极大提升资源利用率,相比物理机部署资源,使用率提高20%,节省近50%的资源成本。

更新迭代问题。电商业务变化快,需求丰富,版本迭代也在加速,比如几天上线一个新产品、几周一个升级版,在行业来说也不是新鲜事。这些所带来的后果,就是对研发交付的要求也在急剧提升。在这一点上,网易严选采用容器化部署方式,构建高效、持续的软件研发流水线,业务交付效率提升5倍,适应运营活动中高速迭代的需求。

同时,通过对服务进行拆分,并通过无侵入的轻舟服务网格,拉齐不同语言栈的服务治理能力,真正实现业务与基础设施的高度解耦,使得网易严选可以在异构技术栈下低成本、大幅度地提升业务迭代效率。

故障定位问题。专场秒杀、抢购等活动增加,对保障措施的要求也在提升。活动期间如果系统出现问题,又不能快速定位和解决,活动效果就大打折扣。

除了新产品、大促,网易严选的各类精选专场、捡漏、限时购、会员福利,也一直在圈粉,其实,这背后也做了不少工作,建立故障定位和解决机制就是其中一项。举例来说,轻舟分布式链路追踪平台10分钟就可以快速定位哪个服务存在问题,故障定位效率提升2倍以上。同时,基于云原生方向的轻舟服务网格、API网关组件,也能通过限流、熔断等,即使个别页面出现问题,也不影响APP整体正常使用。依靠轻舟中间件的运维,简单故障可以自愈,保持业务连续性和可用性。

作为现象级的品牌电商,网易严选在成长过程中,实现技术逐步升级与创新,并高效整合供应链,业务持续快速增长。也是从19年开始,网易严选选择全面拥抱云原生,依托网易轻舟微服务在容器化、DevOps和微服务领域多年的积累,平滑完成云化升级,全面提升交付能力、运维诊断能力、服务治理能力及压测和故障演练能力,让业务更敏捷、更高效、更稳定。

发布时间:2020-5-7 14:07:54,标签:网易严选