流量削峰

需求

当系统发布后，系统在一定时间内总会有一个流量高峰，尤其是秒杀系统，在秒杀开始的那一秒是一条很直很直的线，这是因为秒杀请求在时间上高度集中于某一特定的时间点。一个特别高的流量峰值对资源的消耗是瞬时的。

为什么削峰

服务器处理资源能力是恒定的，用或不用都是一样的，所以出现峰值会导致处理不过来，峰值过后又会闲下来。我们要保证服务质量，一般会按照峰值时计算，比如最大在线人数等指标。

削峰的目的：

一、可以让服务端处理变得更加平稳。

二、可以节省服务器的资源成本。

削峰的本质是更多地延缓用户请求的发出，以便减少和过滤掉一些无效请求。

排队

消息队列方案

用消息队列来缓冲瞬时流量，把同步的直接调用转换成异步的间接推送，中间通过一个队列在一端承接瞬时的流量洪峰，在另一端平滑地将消息推送出去。

但是，如果流量峰值持续一段时间达到了消息队列的处理上限，例如本机的消息积压达到了存储空间的上限，消息队列同样也会被压垮，这样虽然保护了下游的系统，但是和直接把请求丢弃也没多大的区别。

线程池加锁等待

内存排队算法

先进先出、先进后出等常用的内存排队算法的实现方式

请求序列化到文件

把请求序列化到文件中，然后再顺序地读文件（例如基于 MySQL binlog 的同步机制）来恢复请求等方式。

答题

主要是为了增加购买的复杂度，从而达到两个目的。

第一个目的是防止部分买家使用秒杀器在参加秒杀时作弊。

第二个目的其实就是延缓请求，起到对请求流量进行削峰的作用，从而让系统能够更好地支持瞬时的流量高峰。这个重要的功能就是把峰值的下单请求拉长，从以前的 1s 之内延长到 2s~10s。这样一来，请求峰值基于时间分片了。这个时间的分片对服务端处理并发非常重要，会大大减轻压力。而且，由于请求具有先后顺序，靠后的请求到来时自然也就没有库存了，因此根本到不了最后的下单步骤，所以真正的并发写就非常有限了。这种设计思路目前用得非常普遍，如当年支付宝的“咻一咻”、微信的“摇一摇”都是类似的方式。

分层过滤

对请求进行分层过滤，从而过滤掉一些无效的请求。

分层过滤其实就是采用“漏斗”式设计来处理请求的。

假如请求分别经过 CDN、前台读系统（如商品详情系统）、后台系统（如交易系统）和数据库这几层，那么：

大部分数据和流量在用户浏览器或者 CDN 上获取，这一层可以拦截大部分数据的读取；

经过第二层（即前台系统）时数据（包括强一致性的数据）尽量得走 Cache，过滤一些无效的请求；

再到第三层后台系统，主要做数据的二次检验，对系统做好保护和限流，这样数据量和请求就进一步减少；

最后在数据层完成数据的强一致性校验。

这样就像漏斗一样，尽量把数据量和请求量一层一层地过滤和减少了。

分层过滤的核心思想是：在不同的层次尽可能地过滤掉无效请求，让“漏斗”最末端的才是有效请求。

分层校验的基本原则是：

1.将动态请求的读数据缓存（Cache）在 Web 端，过滤掉无效的数据读；

2.对读数据不做强一致性校验，减少因为一致性校验产生瓶颈的问题；

3.对写数据进行基于时间的合理分片，过滤掉过期的失效请求；

4.对写请求做限流保护，将超出系统承载能力的请求过滤掉；

5.对写数据进行强一致性校验，只保留最后有效的数据。

客户端层面做一些请求的随机丢弃，这些被丢弃的请求就直接返回失败，或者系统繁忙，让用户重试。过滤掉一部分流量向服务端发送。

Nginx不仅可以用来做负载均衡和流量的分发，其实他也是可以做流量的过滤的，这里面可以配置一些黑白名单、可以通过IP进行限流、也可以做一些业务校验都是可以的。

在读系统中，尽量减少由于一致性校验带来的系统瓶颈，但是尽量将不影响性能的检查条件提前，如用户是否具有秒杀资格、商品状态是否正常、用户答题是否正确、秒杀是否已经结束、是否非法请求、营销等价物是否充足等;

在写数据系统中，主要对写的数据（如“库存”）做一致性检查;使用sentinel做限流熔断系统保护。

最后在数据库层保证数据的最终准确性（如“库存”不能减为负数）。

系统设计

#系统设计 #高并发 #流量削峰

流量削峰

http://hanqichuan.com/2023/10/18/系统设计/流量削峰/

作者

韩启川

发布于

2023年10月18日

许可协议

购物车存储上一篇

高并发下扣减库存下一篇