当前位置: 代码迷 >> 综合 >> 服务容错-SpingCloud Sentinel 功能规则学习二
  详细解决方案

服务容错-SpingCloud Sentinel 功能规则学习二

热度:82   发布时间:2023-11-22 23:34:35

目录

  • 一.Sentinel的概念和功能
      • 1.基本概念
      • 2.重要功能
  • 二.Sentinel规则
      • 1.流控规则
        • 1.1. 简单配置
        • 1.2.配置流控模式
          • 1.2.1 直接流控模式
          • 1.2.2 关联流控模式
          • 1.2.3 链路流控模式
            • 1.2.3.1 编写一个service,在里面添加一个方法message
            • 1.2.3.2 在Controller中声明两个方法,分别调用service中的方法message
            • 1.2.3.3 禁止收敛URL的入口 context
            • 1.2.3.4. 控制台配置限流规则
            • 1.2.3.5 测试
        • 1.3.配置流控效果
      • 2.降级规则
        • 2.1.平均响应时间
        • 2.2.异常比例
        • 2.3.异常数
      • 3.热点规则
        • 3.1代码编写
        • 3.2.配置热点规则
      • 4.授权规则
        • 4.1自定义来源处理规则
        • 4.2 授权规则配置
      • 5.系统规则
      • 6.自定义异常返回
      • 7.@SentinelResource的使用
        • 7.1定义限流和降级后的处理方法
          • 7.1.1方式一直接将限流和降级方法定义在方法中
          • 7.1.2方式二: 将限流和降级方法外置到单独的类中

一.Sentinel的概念和功能

1.基本概念

  • 资源

资源就是Sentinel要保护的东西
资源是 Sentinel 的关键概念。它可以是 Java 应用程序中的任何内容,可以是一个服务,也可以是一个方法,甚至可以是一段代码。

  • 规则

规则就是用来定义如何进行保护资源的
作用在资源之上, 定义以什么样的方式保护资源,主要包括流量控制规则、熔断降级规则以及系统保护规则。

2.重要功能

在这里插入图片描述
Sentinel的主要功能就是容错,主要体现为下面这三个:

  • 流量控制

流量控制在网络传输中是一个常用的概念,它用于调整网络包的数据。任意时间到来的请求往往是
随机不可控的,而系统的处理能力是有限的。我们需要根据系统的处理能力对流量进行控制。
Sentinel 作为一个调配器,可以根据需要把随机的请求调整成合适的形状。

  • 熔断降级

当检测到调用链路中某个资源出现不稳定的表现,例如请求响应时间长或异常比例升高的时候,则
对这个资源的调用进行限制,让请求快速失败,避免影响到其它的资源而导致级联故障。

Sentinel 对这个问题采取了两种手段:

  1. 通过并发线程数进行限制

Sentinel 通过限制资源并发线程的数量,来减少不稳定资源对其它资源的影响。当某个资源出现不稳定的情况下,例如响应时间变长,对资源的直接影响就是会造成线程数的逐步堆积。当线程数在特定资源上堆积到一定的数量之后,对该资源的新请求就会被拒绝。堆积的线程完成任务后才开始继续接收请求。

  1. 通过响应时间对资源进行降级

除了对并发线程数进行控制以外,Sentinel 还可以通过响应时间来快速降级不稳定的资源。当依赖的资源出现响应时间过长后,所有对该资源的访问都会被直接拒绝,直到过了指定的时间窗口之后才重新恢复。

Sentinel 和 Hystrix 的区别

两者的原则是一致的, 都是当一个资源出现问题时, 让其快速失败, 不要波及到其它服务
但是在限制的手段上, 确采取了完全不一样的方法:
Hystrix 采用的是线程池隔离的方式, 优点是做到了资源之间的隔离, 缺点是增加了线程切换的成本。
Sentinel 采用的是通过并发线程的数量和响应时间来对资源做限制。

  • 系统负载保护

Sentinel 同时提供系统维度的自适应保护能力。当系统负载较高的时候,如果还持续让请求进入可能会导致系统崩溃,无法响应。在集群环境下,会把本应这台机器承载的流量转发到其它的机器上去。如果这个时候其它的机器也处在一个边缘状态的时候,Sentinel 提供了对应的保护机制,让系统的入口流量和系统的负载达到一个平衡,保证系统在能力范围之内处理最多的请求。

总之一句话: 我们需要做的事情,就是在Sentinel的资源上配置各种各样的规则,来实现各种容错的功
能。

二.Sentinel规则

1.流控规则

流量控制,其原理是监控应用流量的QPS(每秒查询率) 或并发线程数等指标,当达到指定的阈值时对流量进行控制,以避免被瞬时的流量高峰冲垮,从而保障应用的高可用性。

点击簇点链路,我们就可以看到访问过的接口地址,然后点击对应的流控按钮,进入流控规则配置页面。
在这里插入图片描述
在这里插入图片描述

资源名:唯一名称,默认是请求路径,可自定义
针对来源:指定对哪个微服务进行限流,默认指default,意思是不区分来源,全部限制
阈值类型/单机阈值:

  • QPS(每秒请求数量): 当调用该接口的QPS达到阈值的时候,进行限流
  • 线程数:当调用该接口的线程数达到阈值的时候,进行限流

是否集群:暂不需要集群

1.1. 简单配置

简单配置,设置阈值类型为QPS,单机阈值为4。即每秒请求量大于4的时候开始限流。

在这里插入图片描述

新增后可在流控规则中查看
在这里插入图片描述
快速刷新访问,当QPS大于4时服务就不能正常响应,而是返回Blocked by Sentinel (flow limiting)结果。
在这里插入图片描述

1.2.配置流控模式

编辑上面的流控规则,发现有高级选项

在这里插入图片描述

sentinel共有三种流控模式,分别是:

  • 直接默认):接口达到限流条件时,开启限流
  • 关联:当关联的资源达到限流条件时,开启限流 [适合做应用让步]
  • 链路:当从某个接口过来的资源达到限流条件时,开启限流
1.2.1 直接流控模式

直接流控模式是最简单的模式,当指定的接口达到限流条件时开启限流。

1.2.2 关联流控模式

关联流控模式指的是,当指定接口关联的接口达到限流条件时,开启对指定接口开启限流。

设置关联资源路径为 /version QPS>2的时候 /registry/machine 就会被限流,禁止访问。
在这里插入图片描述

通过JMeter模拟 /version的QPS>2 配置的是 0.2秒一个请求 QPS为5 >2
在这里插入图片描述

在这里插入图片描述

因 /version的QPS 为5>2,所以 /registry/machine被限流
在这里插入图片描述

1.2.3 链路流控模式

链路流控模式指的是,当从某个接口过来的资源达到限流条件时,开启限流。它的功能有点类似于针对来源配置项,区别在于:针对来源是针对上级微服务,而链路流控是针对上级接口,也就是说它的粒度更细

1.2.3.1 编写一个service,在里面添加一个方法message

@SentinelResource(“message”)

@Service
public class OrderServiceImpl {
    @SentinelResource("message")public void message() {
    System.out.println("message");}
}
1.2.3.2 在Controller中声明两个方法,分别调用service中的方法message
@RestController
@Slf4j
public class OrderController {
    @Autowiredprivate OrderServiceImpl orderServiceImpl;@RequestMapping("/order/message1")public String message1() {
    orderServiceImpl.message();return "message1";}@RequestMapping("/order/message2")public String message2() {
    orderServiceImpl.message();return "message2";}
}
1.2.3.3 禁止收敛URL的入口 context

从1.6.3 版本开始,Sentinel Web filter默认收敛所有URL的入口context,因此链路限流不生效。
1.7.0 版本开始(对应SCA的2.1.1.RELEASE),官方在CommonFilter 引入了WEB_CONTEXT_UNIFY 参数,用于控制是否收敛context。将其配置为 false 即可根据不同的URL 进行链路限流。
SCA 2.1.1.RELEASE之后的版本,可以通过配置spring.cloud.sentinel.web-context-unify=false即可关闭收敛。

当前使用的版本是SpringCloud Alibaba 2.1.0.RELEASE,无法实现链路限流。
目前官方还未发布SCA 2.1.2.RELEASE,所以我们只能使用2.1.1.RELEASE,需要写代码的形式实

  1. 暂时将SpringCloud Alibaba的版本调整为2.1.1.RELEASE
<spring-cloud-alibaba.version>2.1.1.RELEASE</spring-cloud-alibaba.version>
  1. 配置文件中关闭sentinel的CommonFilter实例化
spring:cloud:sentinel:filter:enabled: false
  1. 添加一个配置类,自己构建CommonFilter实例
import com.alibaba.csp.sentinel.adapter.servlet.CommonFilter;
import org.springframework.boot.web.servlet.FilterRegistrationBean;
import org.springframework.context.annotation.Bean;
import org.springframework.context.annotation.Configuration;@Configuration
public class FilterContextConfig {
    @Beanpublic FilterRegistrationBean sentinelFilterRegistration() {
    FilterRegistrationBean registration = new FilterRegistrationBean();registration.setFilter(new CommonFilter());registration.addUrlPatterns("/*");// 入口资源关闭聚合registration.addInitParameter(CommonFilter.WEB_CONTEXT_UNIFY, "false");registration.setName("sentinelFilter");registration.setOrder(1);return registration;}
}
1.2.3.4. 控制台配置限流规则

message 为 @SentinelResource(“message”)
在这里插入图片描述

1.2.3.5 测试

分别通过 /order/message1 和 /order/message2 访问, 发现2没问题, 1的被限流了

1.3.配置流控效果

  • 快速失败(默认): 直接失败,抛出异常,不做任何额外的处理,是最简单的效果
  • Warm Up:它从开始阈值到最大QPS阈值会有一个缓冲阶段,一开始的阈值是最大QPS阈值的
    1/3,然后慢慢增长,直到最大阈值,适用于将突然增大的流量转换为缓步增长的场景。
  • 排队等待:让请求以均匀的速度通过,单机阈值为每秒通过数量,其余的排队等待; 它还会让设
    置一个超时时间,当请求超过超时间时间还未处理,则会被丢弃。

2.降级规则

降级规则就是设置当满足什么条件的时候,对服务进行降级。Sentinel提供了三个衡量条件:

2.1.平均响应时间

  • 平均响应时间 :当资源的平均响应时间超过阈值(以 ms 为单位)之后,资源进入准降级状态。
    如果接下来 1s 内持续进入 5 个请求,它们的 RT都持续超过这个阈值,那么在接下的时间窗口(以 s 为单位)之内,就会对这个方法进行服务降级。

在这里插入图片描述

注意 Sentinel 默认统计的 RT 上限是 4900 ms,超出此阈值的都会算作 4900 ms,若需要
变更此上限可以通过启动配置项 -Dcsp.sentinel.statistic.max.rt=xxx 来配置。

2.2.异常比例

  • 异常比例:当资源的每秒异常总数占通过量的比值超过阈值之后,资源进入降级状态,即在接下的
    时间窗口(以 s 为单位)之内,对这个方法的调用都会自动地返回。异常比率的阈值范围是 [0.0,
    1.0]。

首先模拟一个异常

int i = 0;
@RequestMapping("/order/message2")
public String message2() {
    i++;//异常比例为0.333if (i % 3 == 0){
    throw new RuntimeException();}return "message2";
}

设置异常比例为0.25
在这里插入图片描述

这个时候我们连续访问message2接口 满足异常比例时,就会进入降流

异常比例越小,异常越少。 0.33 >0.25 异常高于配置

2.3.异常数

当资源近 1 分钟的异常数目超过阈值之后会进行服务降级。注意由于统计时间窗口是分
钟级别的,若时间窗口小于 60s,则结束熔断状态后仍可能再进入熔断状态。
在这里插入图片描述

3.热点规则

热点参数流控规则是一种更细粒度的流控规则, 它允许将规则具体到参数上。

3.1代码编写

@SentinelResource(“message3”)

@RequestMapping("/order/message3")
@SentinelResource("message3")//注意这里必须使用这个注解标识,热点规则不生效
public String message3(String name, Integer age) {
    return name + age;
}

3.2.配置热点规则

在这里插入图片描述

分别用两个参数访问,会发现只对第一个参数限流了, 参数索引 0代表第一个参数

在这里插入图片描述
热点规则增强使用

参数例外项允许对一个参数的具体值进行流控
编辑刚才定义的规则,增加参数例外项

当参数索引 0 传的值为qy时,QPS为100000时进行降流
在这里插入图片描述

4.授权规则

很多时候,我们需要根据调用来源来判断该次请求是否允许放行,这时候可以使用 Sentinel 的来源
访问控制的功能。来源访问控制根据资源的请求来源(origin)限制资源是否通过:

  • 若配置白名单,则只有请求来源位于白名单内时才可通过;
  • 若配置黑名单,则请求来源位于黑名单时不通过,其余的请求通过
    在这里插入图片描述

Sentinel提供了 RequestOriginParser 接口来处理来源。
只要Sentinel保护的接口资源被访问,Sentinel就会调用 RequestOriginParser 的实现类去解析
访问来源。

4.1自定义来源处理规则

@Component
public class RequestOriginParserDefinition implements RequestOriginParser{
    @Overridepublic String parseOrigin(HttpServletRequest request) {
    String serviceName = request.getParameter("serviceName");return serviceName;}
}

4.2 授权规则配置

这个配置的意思是只有serviceName=server-A 才能访问(白名单)
在这里插入图片描述
访问 http://localhost:8091/order/message1?serviceName=server-A 观察结果

5.系统规则

系统保护规则是从应用级别的入口流量进行控制,从单台机器的总体 Load、RT、入口 QPS 、CPU
使用率和线程数五个维度监控应用数据,让系统尽可能跑在最大吞吐量的同时保证系统整体的稳定性。

系统保护规则是应用整体维度的,而不是资源维度的,并且仅对入口流量 (进入应用的流量) 生效。

  • Load(仅对 Linux/Unix-like 机器生效):当系统 load1 超过阈值,且系统当前的并发线程数超过
    系统容量时才会触发系统保护。系统容量由系统的 maxQps * minRt 计算得出。设定参考值一般
    是 CPU cores * 2.5。
  • RT:当单台机器上所有入口流量的平均 RT 达到阈值即触发系统保护,单位是毫秒。
  • 线程数:当单台机器上所有入口流量的并发线程数达到阈值即触发系统保护。
  • 入口 QPS:当单台机器上所有入口流量的 QPS 达到阈值即触发系统保护。
  • CPU使用率:当单台机器上所有入口流量的 CPU使用率达到阈值即触发系统保护。

6.自定义异常返回

import com.alibaba.csp.sentinel.adapter.servlet.callback.UrlBlockHandler;
import com.alibaba.csp.sentinel.slots.block.BlockException;
import com.alibaba.csp.sentinel.slots.block.degrade.DegradeException;
import com.alibaba.csp.sentinel.slots.block.flow.FlowException;
import com.alibaba.fastjson.JSON;
import lombok.AllArgsConstructor;
import lombok.Data;
import lombok.NoArgsConstructor;
import org.springframework.stereotype.Component;import javax.servlet.http.HttpServletRequest;
import javax.servlet.http.HttpServletResponse;
import java.io.IOException;//自定义异常返回页面
@Component
public class ExceptionHandlerPage implements UrlBlockHandler {
    @Overridepublic void blocked(HttpServletRequest request, HttpServletResponse response, BlockException e) throws IOException {
    response.setContentType("application/json;charset=utf-8");ResponseData responseData = null;//BlockException 异常接口,包含Sentinel的五个异常// FlowException 限流异常// DegradeException 降级异常// ParamFlowException 参数限流异常// AuthorityException 授权异常// SystemBlockException 系统负载异常if (e instanceof FlowException) {
    responseData = new ResponseData(-1, "接口被限流了...");} else if (e instanceof DegradeException) {
    responseData = new ResponseData(-2, "接口被降级了...");}response.getWriter().write(JSON.toJSONString(responseData));}
}@Data
@AllArgsConstructor//全参构造
@NoArgsConstructor
//无参构造
class ResponseData {
    private int code;private String message;
}

7.@SentinelResource的使用

在定义了资源点之后,我们可以通过Dashboard来设置限流和降级策略来对资源点进行保护。同时还能
通过@SentinelResource来指定出现异常时的处理策略。

@SentinelResource 用于定义资源,并提供可选的异常处理和 fallback 配置项。其主要参数如下:

value 资源名称
entryType entry类型,标记流量的方向,取值IN/OUT,默认是OUT
blockHandler 处理BlockException的函数名称,函数要求:
1. 必须是 public
2.返回类型 参数与原方法一致
3. 默认需和原方法在同一个类中。若希望使用其他类的函数,可配置blockHandlerClass ,并指定blockHandlerClass里面的方法。
blockHandlerClass 存放blockHandler的类,对应的处理函数必须static修饰
fallback 用于在抛出异常的时候提供fallback处理逻辑。fallback函数可以针对所有类型的异常(除了 exceptionsToIgnore 里面排除掉的异常类型)进行处理。函数要求:
1. 返回类型与原方法一致
2. 参数类型需要和原方法相匹配
3. 默认需和原方法在同一个类中。若希望使用其他类的函数,可配置 fallbackClass ,并指定fallbackClass里面的方法。
fallbackClass 存放fallback的类。对应的处理函数必须static修饰。
defaultFallback 用于通用的 fallback 逻辑。默认fallback函数可以针对所有类型的异常进行处理。若同时配置了 fallback 和 defaultFallback,以fallback为准。函数要求:
1. 返回类型与原方法一致
2. 方法参数列表为空,或者有一个 Throwable 类型的参数。
3. 默认需要和原方法在同一个类中。若希望使用其他类的函数,可配置fallbackClass ,并指定 fallbackClass 里面的方法。
exceptionsToIgnore 指定排除掉哪些异常。排除的异常不会计入异常统计,也不会进入fallback逻辑,而是原样抛出。
exceptionsToTrace 需要trace的异常

7.1定义限流和降级后的处理方法

7.1.1方式一直接将限流和降级方法定义在方法中
@Service
@Slf4j
public class OrderServiceImpl {
    int i = 0;@SentinelResource(value = "message",blockHandler = "blockHandler",//指定发生BlockException时进入的方法fallback = "fallback"//指定发生Throwable时进入的方法方式二: 将限流和降级方法外置到单独的类中)public String message() {
    i++;if (i % 3 == 0) {
    throw new RuntimeException();}return "message";}//BlockException时进入的方法public String blockHandler(BlockException ex) {
    log.error("{}", ex);return "接口被限流或者降级了...";}//Throwable时进入的方法public String fallback(Throwable throwable) {
    log.error("{}", throwable);return "接口发生异常了...";}
}
7.1.2方式二: 将限流和降级方法外置到单独的类中
@Service
@Slf4j
public class OrderServiceImpl {
    int i = 0;@SentinelResource(value = "message",blockHandlerClass = OrderServiceImplBlockHandlerClass.class,blockHandler = "blockHandler",fallbackClass = OrderServiceImpl3FallbackClass.class,fallback = "fallback")public String message() {
    i++;if (i % 3 == 0) {
    throw new RuntimeException();}return "message4";}
}
@Slf4j
public class OrderServiceImplBlockHandlerClass {
    //注意这里必须使用static修饰方法public static String blockHandler(BlockException ex) {
    log.error("{}", ex);return "接口被限流或者降级了...";}
}
@Slf4j
public class OrderServiceImplFallbackClass {
    //注意这里必须使用static修饰方法public static String fallback(Throwable throwable) {
    log.error("{}", throwable);return "接口发生异常了...";}
}
  相关解决方案