Hystrix · 浮光笔记

在微服务架构中，服务与服务之间通过远程调用的方式进行通信，一旦某个被调用的服务发生了故障，其依赖服务也会发生故障，此时就会发生故障的蔓延，最终导致灾难性雪崩效应。Hystrix实现了断路器模式，当某个服务发生故障时，通过断路器的监控，给调用方返回一个错误响应，而不是长时间的等待，这样就不会使得调用方由于长时间得不到响应而占用线程，从而防止故障的蔓延。Hystrix具备服务降级、服务熔断、线程隔离、请求缓存、请求合并及服务监控等强大功能。

Hystrix介绍

什么是灾难性的雪崩效应

什么是灾难性的雪崩效应?我们通过结构图来说明，如下正常情况下各个节点相互配置，完成用户请求的处理工作当某种请求增多，造成"服务T"故障的情况时，会延伸的造成"服务U"不可用，及继续扩展，如下最终造成下面这种所有服务不可用的情况这就是我们讲的灾难性雪崩，造成雪崩的原因可以归纳为以下三个:

服务提供者不可用(硬件故障，程序Bug，缓存击穿，用户大量请求)
重试加大流量(用户重试，代码逻辑重试)
服务调用者不可用(同步等待造成的资源耗尽)

最终的结果就是一个服务不可用，导致一系列服务的不可用，而往往这种后果是无法预料的。

如何解决灾难性雪崩效应

我们可以通过以下5种方式来解决雪崩效应

降级：超时降级、资源不足时(线程或信号量)降级，降级后可以配合降级接口返回托底数据。实现一个 fallback 方法, 当请求后端服务出现异常的时候, 可以使用 fallback 方法返回的值.
缓存：Hystrix 为了降低访问服务的频率，支持将一个请求与返回结果做缓存处理。如果再次请求的 URL 没有变化，那么 Hystrix 不会请求服务，而是直接从缓存中将结果返回。这样可以大大降低访问服务的压力。
请求合并：在微服务架构中，我们将一个项目拆分成很多个独立的模块，这些独立的模块通过远程调用来互相配合工作，但是，在高并发情况下，通信次数的增加会导致总的通信时间增加，同时，线程池的资源也是有限的，高并发环境会导致有大量的线程处于等待状态，进而导致响应延迟，为了解决这些问题，我们需要来了解 Hystrix 的请求合并。
熔断：当失败率(如因网络故障/超时造成的失败率高)达到阀值自动触发降级，熔断器触发的快速失败会进行快速恢复。
隔离（线程池隔离和信号量隔离）限制调用分布式服务的资源使用，某一个调用的服务出现问题不会影响其他服务调用。

降级

场景介绍

先来看下正常服务调用的情况当consumer调用provider服务出现问题的情况下: 此时我们对consumer的服务调用做降级处理

实现案例

创建一个基于Ribbon的Consumer服务，并添加对应的依赖

配置文件

修改启动类

在启动类中添加开启熔断

业务层修改

业务层代码中的方法是通过Ribbon来获取负载均衡的服务器地址的，通过RestTemplate来调用服务，在方法的头部添加@HystrixCommand注解，通过fallbackMethod属性指定当调用Provider方法异常的时候fallback方法请求返回托底数据

缓存

Hystrix 为了降低访问服务的频率，支持将一个请求与返回结果做缓存处理。如果再次请求的 URL 没有变化，那么 Hystrix 不会请求服务，而是直接从缓存中将结果返回。这样可以大大降低访问服务的压力。

Hystrix 自带缓存。有两个缺点：

是一个本地缓存。在集群情况下缓存是不能同步的。
不支持第三方缓存容器。Redis，memcache 不支持的。

所以我们使用Spring的cache。

启动Redis服务

使用Redis作为缓存服务器

添加相关的依赖

因为需要用到SpringDataRedis的支持，需要添加对应的依赖

修改属性文件

需要在属性文件中添加Redis的配置信息

修改启动类

需要在启动类中开启缓存的使用

业务处理

使用到了缓存，所以会对POJO对象做持久化处理，所以需要实现序列化接口，否则会抛异常

请求合并

没有合并请求的场景

没有合并的场景中，对于provider的调用会非常的频繁，容易造成处理不过来的情况

合并请求的场景

什么情况下使用请求合并

在微服务架构中，我们将一个项目拆分成很多个独立的模块，这些独立的模块通过远程调用来互相配合工作，但是，在高并发情况下，通信次数的增加会导致总的通信时间增加，同时，线程池的资源也是有限的，高并发环境会导致有大量的线程处于等待状态，进而导致响应延迟，为了解决这些问题，我们需要来了解 Hystrix 的请求合并。

请求合并的缺点

设置请求合并之后，本来一个请求可能 5ms 就搞定了，但是现在必须再等 10ms 看看还有没有其他的请求一起的，这样一个请求的耗时就从 5ms 增加到 15ms 了，不过，如果我们要发起的命令本身就是一个高延迟的命令，那么这个时候就可以使用请求合并了，因为这个时候时间窗的时间消耗就显得微不足道了，另外高并发也是请求合并的一个非常重要的场景。