微服务技术栈导学

微服务实现流程:

所有要学的技术:

分层次教学:

具体分层:

实用篇---第一天

一、认识微服务

单体架构

将业务所有功能集中在一个项目中开发,打成一个包部署

优点:架构简单、部署成本低

缺点:耦合度高

分布式架构

根据业务功能对系统进行查分,每个业务模块作为独立项目开发,称为一个服务

优点:降低服务耦合、有利于服务升级拓展

服务治理

分布式架构需要考虑的问题:

服务拆分粒度如何?

服务集群地址如何维护?

服务之间如何实现远程调用?

服务健康状态如何感知?

微服务

微服务是一种经过良好架构设计的分布式架构方案,微服务架构特征如下:

单一职责:微服务拆分粒度更小,每一个服务都对应唯一的业务能力,做到单一职责,避免重复业务开发

面向服务:微服务对外暴露业务接口

自治:团队独立、技术独立、数据独立、部署独立

隔离性强:服务调用做好隔离、容错、降级,避免出现级联问题

微服务技术对比

微服务这种方案需要技术框架来落地,全球的互联网公司都在积极尝试自己的微服务落地技术。在国内最知名的就是SpringCloud和阿里巴巴的Dubbo

企业场景

SpringCloud

SpingCloud是国内目前使用最广泛的微服务框架

SpringCloud集成了各种微服务功能组件,并基于SpringBoot实现饿了这些组件的自动装配,从而提供了良好的开箱即用的体验

SpringBoot和SpringCloud版本兼容如下:

二、服务拆分及远程调用

服务拆分

1.不同微服务,不要重复开发相同的业务

2.微服务数据独立,不要访问其他微服务的数据库

3.微服务可以将自己的业务暴露为接口,供其他微服务调用

远程调用

要想实现跨服务的远程调用,其实就是发送一次http请求

1.注册RestTemplate

2.调用api

三、Eureka

提供者与消费者

服务提供者:一次业务中,被其他微服务调用的服务(提供接口给其他服务)

服务消费者:一次业务中,调用其他微服务的服务(调用其他微服务提供的接口)

服务A调用服务B,服务B调用服务C,那么服务B是什么角色呢?

既是服务提供者,有时候服务消费者

Eureka原理分析

消费者该如何获取服务提供者的具体信息呢?

服务提供者启动时向eureka注册自己的信息

eureka保存这些信息

消费者根据服务名向eureka拉取提供者信息

如果有多个服务提供者,消费者该如何选择?

服务消费者利用负载均衡算法,从服务列表中挑选一个

消费者如何感知服务提供者健康状态?

服务提供者会每隔30s向EurekaServer发送心跳请求,报告健康状态

eureka会更新记录服务列表信息,心跳不正常会被踢除

消费者就可以拉取到最新的信息

搭建eureka服务

任务:

搭建EurekaServer:

注册user-service

服务注册两步:

1.引入eureka-client依赖

2.在application.yml中配置eureka地址

为了能够更方便的模拟多个服务请求,可以编辑配置

-D代表参数

server.port就是配置端口

此时可以看到USERSERVICE有两个

服务拉取

服务拉取是基于服务名称获取服务列表,然后对服务列表做负载均衡

四、 Ribbon

负载均衡原理

负载均衡策略

Ribbon的负载均衡规则是一个叫做IRule的接口来定义的,每一个子接口都是一种规则

策略详解:

通过定义IRule实现可以修改负载均衡规则:

方式①:在order-service中的OrderApplication类中,定义一个新的IRule

注意:这是全局配置

    @Beanpublic IRule randomRule(){return new RandomRule();}

方式②:在order-service中的application.yml文件中,添加新的配置也可以修改规则

注意:这是局部配置

userservice:ribbon:NFLoadBalancerRuleClassName: com.netflix.loadbalancer.RandomRule

饥饿加载

Ribbon默认采用懒加载,即第一次访问时才会创建LoadBalanceClient,请求时间会很长。

而饥饿加载则会在项目启动时创建,降低第一次访问的耗时,通过下面的配置开启饥饿加载:

ribbon:eager-load:enabled: trueclients: userservice

总结:

五、Nacos

认识并安装Nacos

Nacos是阿里巴巴的产品,现在是SpringCloud中的一个组件,相比Eureka功能更加丰富,在国内受欢迎程度更高。

在nacos解压目录的bin目录下进入命令窗口,输入

进入nacos页面,初始用户名和密码都是nacos

nacos快速入门

服务注册到nacos:

nacos服务分级存储模型

①一级是服务,例如userservice

②二级是集群,例如杭州或上海

③三级是实例,例如杭州机房的某台部署了userservice的服务器

服务跨集群调用问题:

服务调用尽可能选择本地集群的服务,跨集群调用延迟较高

本地集群不可访问时,再去访问其他集群

服务集群属性配置:

修改application.yml文件,添加spring.cloud.nacos.discovery

NacosRule 负载均衡

根据集群负载均衡:

NacosRule负载均衡策略:

①优先选择同集群服务实例列表

②本地集群找不到提供者,才会去其它集群寻找,并且会报警告

③确定了可用实例列表后,再采用随机负载均衡挑选实例

根据权重负载均衡

在实际部署中会出现这样的场景:

服务器设备性能有差异,部分实例所在机器性能较好,另一些较差,我们希望性能好的机器承担更多的用户请求

Nacos提供了权重配置来控制访问频率,权重越大则访问频率越高

环境隔离---namespace

Nacos中服务存储和数据存储的最外层都是一个名为namespace的东西,用来做最外层隔离

新建命名空间:

创建好命名空间以后,添加namespace配置

Nacos环境隔离:

①namespace用来做环境隔离

②每个namespace都有唯一的id

③不同的namespace下的服务不可见

nacos注册中心细节分析

临时实例和非临时实例:

服务器注册到Nacos时,可以选择注册为临时或非临时实例,通过下面的配置来设置:

Nacos与eureka的共同点:

①都支持服务注册和服务拉取

②都支持服务提供者心跳方式做健康检测

Nacos和Eureka的区别:

①Nacos支持服务端主动检测提供者状态:临时实例采用心跳模式,非临时实例采用主动监测模式

②临时实例心跳不正常会被踢除,非临时实例则不会被剔除

③Nacos支持服务列表变更的消息推送模式,服务列表更新更及时

④Nacos集群默认采用AP方式,当集群中存在非临时实例时,采用CP模式,Eureka采用AP方式

实用篇---第二天

一、Nacos配置管理

Nacos实现配置管理

配置的统一管理:

Data ID命名:服务名称-profile.后缀名

Group:分组,默认即可

配置格式:目前支持yaml和properties

配置内容:填写将来可能会改变的配置

微服务配置拉取

进行微服务配置拉取可以实现:

步骤:

注意:如果你的userservice配置在dev命名空间下,请标明

spring:application:name: userserviceprofiles:active: devcloud:nacos:server-addr: localhost:8848config:file-extension: yaml #文件后缀名namespace: 0482f978-fc0d-4030-948c-5a91488ff1d5

总结:

将配置交给Nacos管理的步骤

①在Nacos中添加配置文件

②在微服务中引入nacos的config依赖

③在为服务中添加bootstrap.yml,配置nacos地址、当前环境、服务名称、文件后缀名。这些决定了程序启动时去nacos读取哪个文件

配置热更新

Nacos中的配置文件变更后,微服务无需重启就可以感知,不过需要通过下面两种配置实现:

方式一:在@Value注入的变量所在类上添加注解@RefreshScope

方式二:使用@ConfigurationProperties注解

@Data
@ConfigurationProperties(prefix="pattern")
@Component
public class PatternProperties {private String dateformat;
}

在Controller中不再需要@Value注解,直接自动注入PatternProperties类即可

@Slf4j
@RestController
@RequestMapping("/user")
public class UserController {@Autowiredprivate PatternProperties properties;@GetMapping("now")public String now(){return LocalDateTime.now().format(DateTimeFormatter.ofPattern(properties.getDateformat()));}
}

总结:

多环境配置共享

微服务启动时会从nacos读取多个配置文件:

[spring.application.name]-[spring.profiles.active].yaml,例如:userservice-dev.yaml

[spring.application.name].yaml,例如:userservice.yaml

无论profile如何变化,[spring.application.name].yaml这个文件一定会加载,因此多环境共享配置可以写入这个文件

多种配置的优先级:

服务名-profile.yaml > 服务名称.yaml > 本地配置

nacos集群搭建

搭建集群基本步骤:

搭建数据库,初始化数据库表结构

下载nacos安装包

配置nacos

启动nacos集群

nginx反向代理

mysql脚本:

/******************************************/
/*   数据库全名 = nacos_config   */
/*   表名称 = config_info   */
/******************************************/
CREATE TABLE `config_info` (`id` bigint(20) NOT NULL AUTO_INCREMENT COMMENT 'id',`data_id` varchar(255) NOT NULL COMMENT 'data_id',`group_id` varchar(255) DEFAULT NULL,`content` longtext NOT NULL COMMENT 'content',`md5` varchar(32) DEFAULT NULL COMMENT 'md5',`gmt_create` datetime NOT NULL DEFAULT '2010-05-05 00:00:00' COMMENT '创建时间',`gmt_modified` datetime NOT NULL DEFAULT '2010-05-05 00:00:00' COMMENT '修改时间',`src_user` text COMMENT 'source user',`src_ip` varchar(20) DEFAULT NULL COMMENT 'source ip',`app_name` varchar(128) DEFAULT NULL,`tenant_id` varchar(128) DEFAULT '' COMMENT '租户字段',`c_desc` varchar(256) DEFAULT NULL,`c_use` varchar(64) DEFAULT NULL,`effect` varchar(64) DEFAULT NULL,`type` varchar(64) DEFAULT NULL,`c_schema` text,PRIMARY KEY (`id`),UNIQUE KEY `uk_configinfo_datagrouptenant` (`data_id`,`group_id`,`tenant_id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COLLATE=utf8_bin COMMENT='config_info';/******************************************/
/*   数据库全名 = nacos_config   */
/*   表名称 = config_info_aggr   */
/******************************************/
CREATE TABLE `config_info_aggr` (`id` bigint(20) NOT NULL AUTO_INCREMENT COMMENT 'id',`data_id` varchar(255) NOT NULL COMMENT 'data_id',`group_id` varchar(255) NOT NULL COMMENT 'group_id',`datum_id` varchar(255) NOT NULL COMMENT 'datum_id',`content` longtext NOT NULL COMMENT '内容',`gmt_modified` datetime NOT NULL COMMENT '修改时间',`app_name` varchar(128) DEFAULT NULL,`tenant_id` varchar(128) DEFAULT '' COMMENT '租户字段',PRIMARY KEY (`id`),UNIQUE KEY `uk_configinfoaggr_datagrouptenantdatum` (`data_id`,`group_id`,`tenant_id`,`datum_id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COLLATE=utf8_bin COMMENT='增加租户字段';/******************************************/
/*   数据库全名 = nacos_config   */
/*   表名称 = config_info_beta   */
/******************************************/
CREATE TABLE `config_info_beta` (`id` bigint(20) NOT NULL AUTO_INCREMENT COMMENT 'id',`data_id` varchar(255) NOT NULL COMMENT 'data_id',`group_id` varchar(128) NOT NULL COMMENT 'group_id',`app_name` varchar(128) DEFAULT NULL COMMENT 'app_name',`content` longtext NOT NULL COMMENT 'content',`beta_ips` varchar(1024) DEFAULT NULL COMMENT 'betaIps',`md5` varchar(32) DEFAULT NULL COMMENT 'md5',`gmt_create` datetime NOT NULL DEFAULT '2010-05-05 00:00:00' COMMENT '创建时间',`gmt_modified` datetime NOT NULL DEFAULT '2010-05-05 00:00:00' COMMENT '修改时间',`src_user` text COMMENT 'source user',`src_ip` varchar(20) DEFAULT NULL COMMENT 'source ip',`tenant_id` varchar(128) DEFAULT '' COMMENT '租户字段',PRIMARY KEY (`id`),UNIQUE KEY `uk_configinfobeta_datagrouptenant` (`data_id`,`group_id`,`tenant_id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COLLATE=utf8_bin COMMENT='config_info_beta';/******************************************/
/*   数据库全名 = nacos_config   */
/*   表名称 = config_info_tag   */
/******************************************/
CREATE TABLE `config_info_tag` (`id` bigint(20) NOT NULL AUTO_INCREMENT COMMENT 'id',`data_id` varchar(255) NOT NULL COMMENT 'data_id',`group_id` varchar(128) NOT NULL COMMENT 'group_id',`tenant_id` varchar(128) DEFAULT '' COMMENT 'tenant_id',`tag_id` varchar(128) NOT NULL COMMENT 'tag_id',`app_name` varchar(128) DEFAULT NULL COMMENT 'app_name',`content` longtext NOT NULL COMMENT 'content',`md5` varchar(32) DEFAULT NULL COMMENT 'md5',`gmt_create` datetime NOT NULL DEFAULT '2010-05-05 00:00:00' COMMENT '创建时间',`gmt_modified` datetime NOT NULL DEFAULT '2010-05-05 00:00:00' COMMENT '修改时间',`src_user` text COMMENT 'source user',`src_ip` varchar(20) DEFAULT NULL COMMENT 'source ip',PRIMARY KEY (`id`),UNIQUE KEY `uk_configinfotag_datagrouptenanttag` (`data_id`,`group_id`,`tenant_id`,`tag_id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COLLATE=utf8_bin COMMENT='config_info_tag';/******************************************/
/*   数据库全名 = nacos_config   */
/*   表名称 = config_tags_relation   */
/******************************************/
CREATE TABLE `config_tags_relation` (`id` bigint(20) NOT NULL COMMENT 'id',`tag_name` varchar(128) NOT NULL COMMENT 'tag_name',`tag_type` varchar(64) DEFAULT NULL COMMENT 'tag_type',`data_id` varchar(255) NOT NULL COMMENT 'data_id',`group_id` varchar(128) NOT NULL COMMENT 'group_id',`tenant_id` varchar(128) DEFAULT '' COMMENT 'tenant_id',`nid` bigint(20) NOT NULL AUTO_INCREMENT,PRIMARY KEY (`nid`),UNIQUE KEY `uk_configtagrelation_configidtag` (`id`,`tag_name`,`tag_type`),KEY `idx_tenant_id` (`tenant_id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COLLATE=utf8_bin COMMENT='config_tag_relation';/******************************************/
/*   数据库全名 = nacos_config   */
/*   表名称 = group_capacity   */
/******************************************/
CREATE TABLE `group_capacity` (`id` bigint(20) unsigned NOT NULL AUTO_INCREMENT COMMENT '主键ID',`group_id` varchar(128) NOT NULL DEFAULT '' COMMENT 'Group ID,空字符表示整个集群',`quota` int(10) unsigned NOT NULL DEFAULT '0' COMMENT '配额,0表示使用默认值',`usage` int(10) unsigned NOT NULL DEFAULT '0' COMMENT '使用量',`max_size` int(10) unsigned NOT NULL DEFAULT '0' COMMENT '单个配置大小上限,单位为字节,0表示使用默认值',`max_aggr_count` int(10) unsigned NOT NULL DEFAULT '0' COMMENT '聚合子配置最大个数,,0表示使用默认值',`max_aggr_size` int(10) unsigned NOT NULL DEFAULT '0' COMMENT '单个聚合数据的子配置大小上限,单位为字节,0表示使用默认值',`max_history_count` int(10) unsigned NOT NULL DEFAULT '0' COMMENT '最大变更历史数量',`gmt_create` datetime NOT NULL DEFAULT '2010-05-05 00:00:00' COMMENT '创建时间',`gmt_modified` datetime NOT NULL DEFAULT '2010-05-05 00:00:00' COMMENT '修改时间',PRIMARY KEY (`id`),UNIQUE KEY `uk_group_id` (`group_id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COLLATE=utf8_bin COMMENT='集群、各Group容量信息表';/******************************************/
/*   数据库全名 = nacos_config   */
/*   表名称 = his_config_info   */
/******************************************/
CREATE TABLE `his_config_info` (`id` bigint(64) unsigned NOT NULL,`nid` bigint(20) unsigned NOT NULL AUTO_INCREMENT,`data_id` varchar(255) NOT NULL,`group_id` varchar(128) NOT NULL,`app_name` varchar(128) DEFAULT NULL COMMENT 'app_name',`content` longtext NOT NULL,`md5` varchar(32) DEFAULT NULL,`gmt_create` datetime NOT NULL DEFAULT '2010-05-05 00:00:00',`gmt_modified` datetime NOT NULL DEFAULT '2010-05-05 00:00:00',`src_user` text,`src_ip` varchar(20) DEFAULT NULL,`op_type` char(10) DEFAULT NULL,`tenant_id` varchar(128) DEFAULT '' COMMENT '租户字段',PRIMARY KEY (`nid`),KEY `idx_gmt_create` (`gmt_create`),KEY `idx_gmt_modified` (`gmt_modified`),KEY `idx_did` (`data_id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COLLATE=utf8_bin COMMENT='多租户改造';/******************************************/
/*   数据库全名 = nacos_config   */
/*   表名称 = tenant_capacity   */
/******************************************/
CREATE TABLE `tenant_capacity` (`id` bigint(20) unsigned NOT NULL AUTO_INCREMENT COMMENT '主键ID',`tenant_id` varchar(128) NOT NULL DEFAULT '' COMMENT 'Tenant ID',`quota` int(10) unsigned NOT NULL DEFAULT '0' COMMENT '配额,0表示使用默认值',`usage` int(10) unsigned NOT NULL DEFAULT '0' COMMENT '使用量',`max_size` int(10) unsigned NOT NULL DEFAULT '0' COMMENT '单个配置大小上限,单位为字节,0表示使用默认值',`max_aggr_count` int(10) unsigned NOT NULL DEFAULT '0' COMMENT '聚合子配置最大个数',`max_aggr_size` int(10) unsigned NOT NULL DEFAULT '0' COMMENT '单个聚合数据的子配置大小上限,单位为字节,0表示使用默认值',`max_history_count` int(10) unsigned NOT NULL DEFAULT '0' COMMENT '最大变更历史数量',`gmt_create` datetime NOT NULL DEFAULT '2010-05-05 00:00:00' COMMENT '创建时间',`gmt_modified` datetime NOT NULL DEFAULT '2010-05-05 00:00:00' COMMENT '修改时间',PRIMARY KEY (`id`),UNIQUE KEY `uk_tenant_id` (`tenant_id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COLLATE=utf8_bin COMMENT='租户容量信息表';CREATE TABLE `tenant_info` (`id` bigint(20) NOT NULL AUTO_INCREMENT COMMENT 'id',`kp` varchar(128) NOT NULL COMMENT 'kp',`tenant_id` varchar(128) default '' COMMENT 'tenant_id',`tenant_name` varchar(128) default '' COMMENT 'tenant_name',`tenant_desc` varchar(256) DEFAULT NULL COMMENT 'tenant_desc',`create_source` varchar(32) DEFAULT NULL COMMENT 'create_source',`gmt_create` bigint(20) NOT NULL COMMENT '创建时间',`gmt_modified` bigint(20) NOT NULL COMMENT '修改时间',PRIMARY KEY (`id`),UNIQUE KEY `uk_tenant_info_kptenantid` (`kp`,`tenant_id`),KEY `idx_tenant_id` (`tenant_id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COLLATE=utf8_bin COMMENT='tenant_info';CREATE TABLE users (username varchar(50) NOT NULL PRIMARY KEY,password varchar(500) NOT NULL,enabled boolean NOT NULL
);CREATE TABLE roles (username varchar(50) NOT NULL,role varchar(50) NOT NULL,constraint uk_username_role UNIQUE (username,role)
);CREATE TABLE permissions (role varchar(50) NOT NULL,resource varchar(512) NOT NULL,action varchar(8) NOT NULL,constraint uk_role_permission UNIQUE (role,resource,action)
);INSERT INTO users (username, password, enabled) VALUES ('nacos', '$2a$10$EuWPZHzz32dJN7jexM34MOeYirDdFAZm2kuWj7VEOJhhZkDrxfvUu', TRUE);INSERT INTO roles (username, role) VALUES ('nacos', 'ROLE_ADMIN');

进入nacos的conf目录,修改配置文件cluster.conf.example,重名名为cluster.conf

配置application.properties

打开注释,告诉nacos我们使用的是mysql集群

需要打开的注释:

spring.datasource.platform=mysqldb.num=1DB:db.url.0=jdbc:mysql://127.0.0.1:3306/nacos?characterEncoding=utf8&connectTimeout=1000&socketTimeout=3000&autoReconnect=true&useUnicode=true&useSSL=false&serverTimezone=UTC
db.user.0=nacos
db.password.0=nacos

将配置好的文件复制三份:

将每份文件的server.port修改为之前配好的三个端口之一

比如:server.port=8845

启动:

找到bin目录,打开命令行窗口,输入命令:startup.cmd

修改config/nginx.conf文件,将下面的配置黏贴到http内部:

    upstream nacos-cluster{server 127.0.0.1:8845;server 127.0.0.1:8846;server 127.0.0.1:8847;}server{listen  80;server_name  localhost;location   /nacos {proxy_pass  http://nacos-cluster;}}

在nginx安装目录下打开命令符提示窗口,输入:

start nginx.exe

配置application.yaml或者bootstrap.yaml

spring: cloud:nacos:server-addr: localhost:80

二、Feign远程调用

初识http客户端Feign

restTemplate方式调用存在的问题

Feign是一个声明式的http客户端,其作用就是帮助我们优雅地实现http请求的发送,解决上面的问题

使用Feign的步骤:

注:如果Maven导入openfeign失败,可以加上版本号

        <dependency><groupId>org.springframework.cloud</groupId><artifactId>spring-cloud-starter-openfeign</artifactId><version>2.1.1.RELEASE</version></dependency>

实现远程调用:

@RestController
@RequestMapping("order")
public class OrderController {@Autowiredprivate OrderService orderService;@Autowiredprivate UserClient userClient;@GetMapping("{orderId}")public Order queryOrderByUserId(@PathVariable("orderId") Long orderId) {// 根据id查询订单并返回Order order=orderService.queryOrderById(orderId);User user = userClient.findById(order.getUserId());order.setUser(user);return order;}
}

总结:

Feign的使用步骤

①引入依赖

②添加@EnableFeignClients注解

③编写FeignClient接口

④使用FeignClient中定义的方法代替RestTemplate

自定义Feign的配置

配置Feign日志有两种方式:

Feign的日志配置总结:

1.方式一是配置文件,feign.client.config.xxx.loggerLevel

①如果xxx是default则代表全局

②如果xxx是服务名称,例如userservice,则代表某服务

2.方式二是java代码配置Logger.Level这个Bean

①如果在@EnableFeignClients注解声明则代表全局

②如果在@FeignClient注解中声明则代表某服务

Feign性能优化

Feign底层的客户端实现:

URLConnection:默认实现,不支持连接池

Apache HttpClient:支持连接池

OKHttp:支持连接池

因此优化Feign的性能主要包括:

①使用连接池代替默认的URLConnection

②日志级别,最好用basic或none

Feign添加HttpClient的支持:

Feign的优化总结:

1.日志级别尽量用basic

2.使用HttpClient或OKHttp代替URLConnection

①引入feign-httpClient依赖

②配置文件开启httpClient功能,设置连接池参数

Feign的最佳实践

方式一(继承):给消费者的FeignClient和提供者的controller定义统一的父接口作为标准

方式二(抽取):将FeignClient抽取为独立模块,并且把接口有关的pojo、默认的Feign配置都放到这个模块中,提供给所有消费者使用

Feign的最佳实践总结:

①让controller和FeignClient继承同一个接口

②将FeignClient、POJO、Feign的默认配置都定义到一个项目中,供所有消费者使用

Feign最佳实践的实现

步骤:

1.首先创建一个module,命名为feign-api,然后引入feign的starter依赖

2.将order-service中编写的UserClient、User、DefaultFeignConfiguration都复制到feign-api项目中

3.在order-service中引入feign-api的依赖

4.修改order-service中所有与上诉三个组件有关的import部分,改成导入feign-api中的包

如上图,当定义的FeignClient不在SpringBootApplication的扫描包范围时,这些FeignClient无法使用。有两种方式解决:

总结:

三、统一网关Gateway

网关作用介绍

为什么需要网关?

网关的技术实现:

在SpringCloud中网关的实现有两种:

gateway

zuul

Zuul是基于Servlet的实现,属于阻塞式编程。而SpringCloudGateway则是基于Spring5中提供的WebFlux,属于响应式编程的实现,具备更好的性能

搭建网关服务

步骤:

1.创建新的module,引入SpringCloudGateway的依赖和nacos的服务发现依赖:

    <dependencies><!--nacos服务注册发现依赖--><dependency><groupId>com.alibaba.cloud</groupId><artifactId>spring-cloud-starter-alibaba-nacos-discovery</artifactId></dependency><!--网关gateway依赖--><dependency><groupId>org.springframework.cloud</groupId><artifactId>spring-cloud-starter-gateway</artifactId></dependency></dependencies>

2.编写路由配置及nacos地址

server:port: 10010 #网关端口
spring:application:name: gatewaycloud:nacos:server-addr: localhost:8848 #nacos地址gateway:routes: #网关路由配置- id: user-service #路由id,自定义,只要唯一即可uri: lb://userservice #路由的目标地址lb(loadBalance)就是负载均衡,后面跟服务名称predicates: #路由断言,也就是判断请求是否符合路由规则的条件- Path=/user/** #这个是按照路径匹配,只要以/user/开头就符合规则- id: order-serviceuri: lb://orderservicepredicates:- Path=/order/**

网关工作流程图:

总结:

网关搭建步骤:

1.创建项目,引入nacos服务发现和gateway依赖

2.配置application.yml,包括服务基本信息、nacos地址、路由

路由配置包括:

1.路由id:路由的唯一标识

2.路由目标(uri):路由的目标地址,http代表固定地址,lb代表根据服务名负载均衡

3.路由断言(predicates):判断路由的规则

4.路由过滤器(filters):对请求或响应做处理

路由断言工厂 Route Predicate Factory

网关路由可以配置的内容包括:

路由id:路由唯一标识

uri:路由目的地,支持lb和http两种

predicates:路由断言,判断请求是否符合要求,符合则转发到路由目的地

filters:路由过滤器,处理请求或响应

我们在配置文件中写的断言规则只是字符串,这些字符串会被Predicate Factory读取并处理,转变为路由判断条件

例如Path=/user/** 是按照路径匹配,这个规则是有org.springframework.cloud.gateway.handler.predicate.PathRoutePredicateFactory

像这样的断言工厂spring还有十几个:

以After为例,配置了未来的时间,则访问失败:

- After=2031-04-13T15:14:47.433+08:00[Asia/Shanghai]

路由过滤器 GatewayFilter

GatewayFilter是网关中提供的一种过滤器,可以对进入网关的请求和微服务返回的响应做处理

Spring提供了31种不同的路由过滤器工厂,例如:

案例:给所有进入userservicce的请求添加一个请求头:Truth=Itcast is freaking awesome!

实现方式:在gateway中修改application.yml文件,给userservice的路由添加过滤器:

          filters:- AddRequestHeader=Truth,Itcast is freaking awesome!

验证方式:修改UserController,接收请求头Truth

    @GetMapping("/{id}")public User queryById(@PathVariable("id") Long id,@RequestHeader(value = "Truth",required = false)String truth) {System.out.println("truth:"+truth);return userService.queryById(id);}

打印成功:

默认过滤器:

如果要对所有的路由都生效,则可以将过滤器工厂写到default下

总结:

过滤器的作用是什么?

①对路由的请求或响应做加工处理,比如添加请求头

②配置在路由下的过滤器只对当前路由的请求生效

defaultFilters的作用是什么?

①对所有路由都生效的过滤器

全局过滤器 GlobalFilter

全局过滤器的作用也是处理一切进入网关的请求和微服务响应,与GatewayFilter的作用一样

区别在于GatewayFilter通过配置定义,处理逻辑是固定的。而GlobalFilter的逻辑需要自己写代码实现

定义方式是实现GlobalFilter接口:

定义全局过滤器,拦截并判断用户身份:

需求:定义全局过滤器,拦截请求、判断请求的参数是否满足下面条件:

参数中是否有authorization

authorization参数值是否有admin

如果同时满足则放行,否则拦截

@Component
@Order(-1) //指定过滤器的顺序
public class AuthorizeFilter implements GlobalFilter {@Overridepublic Mono<Void> filter(ServerWebExchange exchange, GatewayFilterChain chain){//1.获取请求参数ServerHttpRequest request = exchange.getRequest();MultiValueMap<String, String> params = request.getQueryParams();//2.获取参数中的authorization参数String auth=params.getFirst("authorization");//3.判断参数值是否等于adminif("admin".equals(auth)){//4.是,放行return chain.filter(exchange);}//5.否,拦截//5.1 设置状态码exchange.getResponse().setStatusCode(HttpStatus.UNAUTHORIZED); //401代表未登录//5.2 拦截请求return exchange.getResponse().setComplete();}
}

总结:

全局过滤器的作用是什么?

对所有路由都生效的过滤器,并且可以自定义处理逻辑

实现全局过滤器的步骤是什么?

①实现GlobalFilter接口

②添加@Order注解或实现Ordered接口

③编写处理逻辑

过滤器执行顺序

请求进入网关会碰到三类过滤器:当前路由的过滤器、DefaultFilter、GlobalFilter

请求路由后,会将当前路由过滤器和DefaultFilter、GlobalFilter合并到一个过滤器链(集合)中,排序后依次执行每个过滤器

默认过滤器和路由过滤器很相似,他们都是GatewayFilter

而对于全局过滤器,虽然他是GlobalFilter,但是通过适配器模式,可以将他转为GatewayFilter

每一个过滤器必须指定一个int类型的order值,order值越小,优先级越高,执行顺序越靠前

GlobalFilter通过实现Ordered接口,或者添加@Order注解来指定order值,由我们自己指定

路由过滤器和defaultFilter的order由Spring指定,默认是按照声明顺序从1递增

当过滤器的order值一样时,会按照defaultFilter>路由过滤器>GlobalFilter的顺序执行

总结:

网关的cors跨域配置

跨域:域名不一致就是跨域

主要包括:

跨域问题:浏览器禁止请求的发起者与服务端发生跨域ajax请求,请求被浏览器拦截的问题

解决方案:CORS

网关处理跨域采用的同样是CORS方案,并且只需要简单的配置即可实现:

实用篇---第三天

一、初识Docker

什么是Docker

项目部署的问题:

Docker是如何解决依赖的兼容问题呢?

linux操作系统结构:

Ubuntu和CentOS都是基于Linux内核,只是系统应用不同,提供的函数库有差异,所以程序不能跨系统运行

Docker如何解决不同系统环境的问题?

==>Docker打包好的程序可以运行在任何linux系统上

总结:

Docker如何解决大型项目依赖关系复杂、不同组件依赖的兼容性问题?

Docker允许开发中将应用、依赖、函数库、配置一起打包,形成可移植镜像

Docker应用运行在容器中,使用沙箱机制,相互隔离

Docker如何解决开发、测试、生产环境有差异的问题?

Docker镜像中包含完整运行环境,包括系统函数库、仅依赖系统的linux内核,因此可以在任意的linux操作系统上运行

Docker是一个快速交付应用、运行应用的技术

Docker与虚拟机的差别

Docker与虚拟机性能的差别:

Docker和虚拟机的差异:

docker是一个系统进程;虚拟机是在操作系统中的操作系统

docker体积小、启动速度快、性能好;虚拟机体积大、启动速度慢、性能一般

Docker架构

镜像(Image):Docker将应用程序及其所需要的依赖、函数库、环境、配置等文件打包在一起,称为镜像

容器(Container):镜像中的应用程序运行后形成的进程就是容器,只是Docker会给容器做隔离,对外不可见

DockerHub:DockerHub是一个Docker镜像的托管平台,这样的平台称为Docker Registry

docker架构:

总结:

安装Docker

Docker分为CE和EE两大版本,CE是社区版免费,EE是企业版收费

Docker CE支持64为版本CentOS 7,并且要求内核版本不低于3.10,CentOS 7满足最低内核要求,所以我们在CentOS 7 上安装Docker

如果之前安装过旧版本的Docker,可以使用下面的命令卸载:

开始正式安装Docker

第一步:虚拟机联网,安装yum工具

第二步:更新本地镜像源

上面的命令要分开敲,如下:

第三步:安装docker-ce(社区免费版)

至此,docker安装完毕

启动docker

由于Docker应用需要用到这种端口,逐一去修改防火墙设置非常麻烦,因此建议大家直接关闭防火墙。

启动docker前,一定要关闭防火墙!!!

启动docker:

命令:systemctl start docker

启动后,可以用docker -v来查看docker的版本,如果能够查到,则启动docker成功

配置镜像:

docker官方镜像仓库网速较差,我们需要设置国内镜像

具体命令分步可以看我的代码:

二、Docker的基本操作

镜像操作

镜像名称一般分为两部分:

[repository]:[tag]

tag是版本号,在没有指定tag时,默认是latest,代表最新版本的镜像

镜像操作命令:

dock

案例一:从DockerHub中拉去一个nginx镜像并查看

拉取镜像成功后,可以通过docker images查看

案例二:利用docker save将nginx镜像导出磁盘,然后再通过load加载回来

步骤一:利用dockr xx --help命令查看docker save和docker load的语法

步骤二:使用docker tag 创建新镜像mynginx 1.0

步骤三:使用docker save导出镜像到磁盘

通过load加载回来:

总结:

镜像命令练习

我的练习代码如下:

[root@Soft soft]# docker pull redis:alpine3.17

[root@Soft soft]# docker save -o redis.tar redis:alpine3.17

[root@Soft soft]# docker rmi redis:alpine3.17

[root@Soft soft]# docker load -i redis.tar

最终操作结果:

容器相关命令

向浏览器

容器命令案例1

创建并运行一个nginx容器

去docker hub查看nginx的容器运行命令

docker run --name containerName -p 80:80 -d nginx

命令解读:

docker run:创建并运行一个容器

--name:给容器起一个名字,比如叫做mn

-p:将宿主端口与容器端口映射,冒号左侧是宿主机端口,右侧是容器端口

注意:宿主机的端口只要没被占用,可以任意指定;但是容器内的端口一般取决于运行的程序本身,一般是固定的,比如nginx一般监听的都是80端口

-d:后台运行容器

nginx:镜像名称,例如nginx,不写tag代表最新nginx

容器创建成功后,会返回一个字符串。这是容器的全局唯一标识,代表容器创建成功

查看容器运行状态:

浏览器访问:

注明,可以用ifconfig查看虚拟机的ip地址

向浏览器输入虚拟机的ip地址,查看到下面的页面则说明nginx部署成功:

查看日志:-f选项可以持续跟踪日志,而无需每次手动查询日志

[root@Soft soft]# docker logs -f mn

总结:

容器命令案例2

进入nginx容器,修改HTML文件内容,添加“传智教育欢迎您”

步骤一:进入容器。

进入我们刚刚创建的nginx容器的命令为:

docker exec -it mn bash

命令解读:

docker exec:进入容器命令,执行一个命令

-it:给当前进入的容器创建一个标准输入、输出终端,允许我们与容器交互

mn:要进入的容器的名称

bash:进入容器后执行的命令,bash是一个linux终端交互命令

进入nginx容器内部,其实就是一个阉割版的linux,可以使用linux的命令

步骤二:进入nginx的HTML所在目录 /usr/share/nginx/html

步骤三:修改index.html的内容

退出容器的命令:exit

docker ps默认只能查看运行中的容器,可以加-a参数查看所有容器

当容器处于运行状态时,不能直接通过docker rm containerName删除,需要先停止容器运行才行。为了方便,可以直接使用-f参数,强制删除运行时的容器

总结:

查看容器状态:

docker ps

添加-a参数查看所有状态的容器

删除容器:

docker rm

不能删除运行中的容器,除非添加-f参数

进入容器:

命令是docker exec -it [容器名] [要执行的命令]

exec命令可以进入容器修改文件,但是在容器内修改文件是不推荐的

容器命令练习

创建并运行一个redis容器,并且支持数据持久化

进入redis容器,并执行redis-cli客户端命令,存入num=555

数据卷命令

容器与数据耦合的问题:

数据卷(volume)是一个虚拟目录,指向宿主机文件系统中的某个目录

操作数据卷:

数据卷操作的基本语法如下:

docker volume [COMMAND]

docker volume 命令是数据卷操作,但根据命令后跟随的command来确定下一步的操作:

create        创建一个volume

inspect        显示一个或多个volume的信息

ls                列出所有的volume

prune        删除未使用的volume

rm                删除一个或多个指定的volume

官方释义:

案例:创建一个数据卷,并查看数据卷在宿主机的目录位置

①创建数据卷

②查看所有数据

③查看数据卷详细信息卷

删除未使用的数据卷:

移除特定的数据卷

总结:

数据卷的作用:

将容器与数据分离,解耦合,方便操作容器内的数据,保证数据安全

数据卷操作:

docker volume create

docker volume ls

docker volume inspect

docker volume rm

docker volume prune

挂载数据卷

我们在创建容器时,可以通过-v参数来挂载一个数据卷到某个容器目录

案例:创建一个nginx容器,修改容器内的html目录内的index.html内容

需求说明:上个案例中,我们进入nginx容器内部,已经知道nginx的html目录所在位置是 /usr/share/nginx/html,我们需要把这个目录挂载到html这个数据卷上,方便操作其中的内容

提示:运行容器时使用-v参数挂载数据卷

步骤:

①创建容器并挂载数据卷到容器内的HTML目录

②进入html数据卷所在位置,并修改HTML内容

运行结果:

如果做数据卷挂载,数据卷不存在,docker会自动创建需要的数据卷

总结:

数据卷挂载方式:

-v volumeName:/targetContainerPath

如果容器运行时volume不存在,会被自动创建出来

数据卷挂载案例

创建并运行一个MySQL容器,将宿主机目录直接挂载到容器上

目录挂载与数据卷挂载语法相似:

-v [宿主机目录]:[容器内目录]

-v [宿主机文件]:[容器内文件]

步骤1:

步骤2/3:

步骤4:

两种数据卷挂载方式的对比:

总结:

三、Dockerfile自定义镜像

镜像结构

镜像是将应用程序及其需要的系统函数库、环境、配置、依赖打包而成

总结:

镜像是分层结构,每一层称为一个Layer

BaseImage层:包含基本的系统函数库、环境变量、文件系统

Entrypoint:入口,是镜像中应用启动的命令

其他:在BaseImage基础上添加依赖、安装程序、完成整个应用的安装和配置

Dockerfile

Dockerfile是一个文本文件,其中包含一个个的指令(Instruction),用指令来说明要执行什么操作来构建镜像。每一个指令都会形成一层Layer

简单的Dockerfile为例:

# 指定基础镜像
FROM ubuntu:16.04
# 配置环境变量,JDK的安装目录
ENV JAVA_DIR=/usr/local# 拷贝jdk和java项目的包
COPY ./jdk8.tar.gz $JAVA_DIR/
COPY ./docker-demo.jar /tmp/app.jar# 安装JDK
RUN cd $JAVA_DIR \&& tar -xf ./jdk8.tar.gz \&& mv ./jdk1.8.0_144 ./java8# 配置环境变量
ENV JAVA_HOME=$JAVA_DIR/java8
ENV PATH=$PATH:$JAVA_HOME/bin# 暴露端口
EXPOSE 8090
# 入口,java项目的启动命令
ENTRYPOINT java -jar /tmp/app.jar

案例1:

基于Ubuntu镜像构建一个新镜像,运行一个java项目

步骤1:新建一个空文件夹docker-demo

步骤2:拷贝课前资料的docker-demo.jar文件到docker-demo这个目录

步骤3:拷贝课前资料的jdk8.tar.gz文件到docker-demo这个目录

步骤4:拷贝课前资料提供的Dockerfile到docker-demo这个目录

步骤5:进入docker-demo

步骤6:运行命令

docker build -t javaweb:1.0 .

记得命令末尾 空格+一个点,这个点代表Dockerfile所在的目录(构建的时候要告诉docker Dockerfile在哪)

检查并运行此镜像:

访问页面,出现下面的页面即大功告成:

案例2:

基于java:8-alpine镜像,将一个Java项目构建为镜像

实现思路:

①新建一个空的目录,然后目录中新建一个文件,命名为Dockerfile

②拷贝课前资料提供的docker-demo.jar到这个目录中

③编写Dockerfile文件:

a)基于java:8-alpine作为基础镜像

b)将app.jar拷贝到镜像中

c)暴露端口

d)编写入口ENTRYPOINT

④使用docker build命令构建镜像

⑤使用docker run创建容器并运行

Dockerfile文件:

# 指定基础镜像
FROM java:8-alpine
# 拷贝
COPY ./docker-demo.jar /tmp/app.jar# 暴露端口
EXPOSE 8090
# 入口,java项目的启动命令
ENTRYPOINT java -jar /tmp/app.jar

注意不要随便更改暴露出来的端口,运行成功

初识DockerCompose

Docker Compose可以基于Compose文件帮我们快速地部署分布式应用,而无需手动一个个创建和运行容器

Compose文件是一个文本文件,通过指令定义集群中的每个容器如何运行

安装docker compose:

第一步:下载

第二步:修改文件权限

+x代表给docker-compose执行权(绿色代表可以执行)

第三步让tionBash自动补全命令

总结:

Docker compose有什么作用?

帮助我们快速部署分布式应用,无需一个个微服务去构建镜像和部署

DockerCompose部署微服务

案例:将之前学习的cloud-demo微服务集群利用DockerCompose部署

①查看docker-compose:

②修改自己的cloud-demo项目,将数据库、nacos地址都命名为docker-compose中的服务名

(用docker compose部署,所有的服务之间都可以用服务名访问)

③使用maven打包工具,将项目中的每个微服务都打包为app.jar

④将打包好的app.jar拷贝到cloud-demo中的每一个对应的子目录中

⑤将cloud-demo上传至虚拟机,利用docker-compose up -d 来部署

因为阿里代码有问题,nacos应该第一时间部署,而后再部署其他微服务,所以需要重启gateway、orderservice、userservice

访问页面成功则配置成功:

Docker镜像仓库

镜像仓库(Docker Registry)有共有和私有两种形式:

公共仓库:例如Docker官方的Docker Hub

私有仓库:用户自己搭建

简化版镜像仓库:

Docker官方的Docker Registry是一个基础版本的Docker镜像仓库,具备仓库管理的完整功能,但是没有图形化界面

搭建方式比较简单,命令如下:

访问http://Yourlp:5000/v2/ catalog 可以查看当前私有镜像服务中包含的镜像

带有图形化界面

使用DockerCompose部署带有图像界面的DockerRegistry,命令如下:

第一步:配置Docker信任地址

我们的私服采用的是http协议,默认不被Docker信任,所以需要做一个配置:

第二步:配置docker-compose

配置好后执行命令:

docker-compose up -d

加载完毕后,可以看到ui界面

在私有镜像仓库推送或拉取镜像:

推送镜像成功可以在私服看到:

总结:

1.推送本地镜像到仓库前都必须重命名(docker tag)镜像,以镜像仓库地址为前缀

2.镜像仓库推送前需要把仓库地址配置到docker服务的daemon.json文件,被docker信任

3.推送使用docker push命令

4.拉取使用docker pull命令

实用篇---第四天

一、初识MQ

同步通讯和异步通讯

同步通信相当于打视频,一次只能和一个人打

异步通信相当于聊天,一次可以和很多个人聊

同步通信的优缺点

缺点:

微服务间基于Feign的调用就属于同步方式,存在一些问题

①代码耦合严重,比如支付服务需要在加业务的时候不断修改

②耗时太长,性能下降

......

总结:

同步调用的优点:

时效性强,可以立即得到结果

同步调用的问题:

耦合度高

性能和吞吐能力下降

有额外的资源消耗

有级联失败问题

异步通信的优缺点

异步调用常见实现是事件驱动模式

优点:

①服务解耦

②性能提升,吞吐量提高

③服务没有强依赖,不担心级联失败问题(故障隔离)

④流量削峰

缺点:

①依赖于Broker的可靠性、安全性、吞吐力量

②架构复杂,业务没有明显的流程线,不好追踪管理

mq常见技术介绍

MQ:Message Queue,中文是消息队列,也就是事件驱动架构中的Broker

二、RabbitMQ入门

RabbitMQ介绍和安装

RabbitMQ是基于Erlang计开发的开源消息中间件

单机部署:

第一步:下载镜像

方式一:在线拉取

docker pull rabbitmq:3-management

方式二:从本地加载

将mq.tar上传到虚拟机中,使用命令加载镜像即可:

docker load -i mq.tar

第二步:执行下面的命令来运行MQ容器

然后就可以进入rabbitMQ了

RabbitMQ的结构和概念:

RabbitMQ中的几个概念:

channel:操作MQ的工具

exchange:路由消息到队列中

queue:缓存消息

virtual host:虚拟主机,是对queue、exchange等资源的逻辑分组

消息模型

HelloWorld案例

官方的HelloWorld是基于最基础的消息队列模型来实现的,只包括三个角色:

publisher:消息发布者,将消息发送到队列queue

queue:消息队列,负责接受并缓存消息

consumer:订阅消息,处理队列中的消息

完成官方Demo中的hello world案例

①导入课前资料的mq-demo工程

②运行publisher服务中的测试类PublisherTest中的测试方法testSendMessage()

③查看RabbitMQ控制台的消息

④启动consumer服务,查看是否能接收消息

总结:

基本消息队列的消息发送流程:

1.建立connection

2.创建channel

3.利用channel声明队列

4.利用channel向队列发送消息

基本消息队列的消息接收流程:

1.建立connection

2.建立channel

3.利用channel声明队列

4.利用consumer的消费行为handleDelivery()

5.利用channel将消费者与队列绑定

三、SpringAMQP

SpringAMQP基本介绍

特征:

侦听器容器,用于异步处理入站消息

用于发送和接收消息的RabbitTemplate

RabbitAdmin用于自动声明队列、交换和绑定

基本消息队列功能实现

消息发送:

1.在父工程中引入spring-amqp的依赖

2.在publisher服务中利用RabbitTemplate发送消息到simple.queue这个队列

3.在consumer服务中编写消费逻辑,绑定simple.queue这个队列

第一步实现:

        <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-amqp</artifactId></dependency>

第二步实现:

①在publisher服务中编写application.yml,添加mq连接信息

spring:rabbitmq:host: 192.168.150.101port: 5672username: itcastpassword: 123321virtual-host: /

②在publisher服务中新建一个测试类,编写测试方法

@SpringBootTest
public class SpringAmqpTest {@Autowiredprivate RabbitTemplate rabbitTemplate;@Testpublic void testSendMessage2SimpleQueue(){String queueName="simple.queue";String message="hello,Spring AMQP!";rabbitTemplate.convertAndSend(queueName,message);}
}

总结:

什么是AMQP?

应用间消息通信的一种协议,与语言和平台无关

SpringAMQP如何发送消息?

①引入amqp的starter依赖

②配置RabbitMQ地址

③利用RabbitTemplate的convertAndSend方法

消息消费:

1.在consumer服务中编写application.yml,添加mq连接信息

spring:rabbitmq:host: 192.168.202.128port: 5672virtual-host: /username: itcastpassword: 123321

2.在consumer服务中新建一个类,编写消费逻辑

@Component
public class SpringRabbitListener {@RabbitListener(queues = "simple.queue")public void listenSimpleQueue(String msg){System.out.println("消费者接收到simple.queue的消息【"+msg+"】");}}

接收消息成功:

总结:

SpringAMQP如何接收消息?

引入amqp的starter依赖

配置RabbitMQ地址

定义类,添加@Component注解

类中声明方法,添加@RabbitListener注解,方法参数接收消息

注意:消息一旦消费就会从队列中删除,RabbitMQ没有消息回溯功能

Work Queue 工作队列

Work Queue,工作队列,挂载两个消费者,可以提高消息处理的速度,避免队列消息堆积

案例:模拟WorkQueue,实现一个队列绑定多个消费者

基本思路如下:

1.在publisher服务中定义测试方法,每秒产生50条消息,发送到simple.queue

2.在consumer服务中定义两个消息监听者,都监听simple.queue队列

3.消费者1每秒处理50条消息,消费者2每秒处理10条消息

生产者:

@SpringBootTest
public class SpringAmqpTest {@Autowiredprivate RabbitTemplate rabbitTemplate;@Testpublic void testSendMessage2SimpleQueue() throws InterruptedException {String queueName = "simple.queue";String message = "hello,message--";for (int i = 0; i < 50; i++) {rabbitTemplate.convertAndSend(queueName, message+i);Thread.sleep(20);}}
}

消费者:

@Component
public class SpringRabbitListener {@RabbitListener(queues = "simple.queue")public void listenWorkQueue(String msg) throws InterruptedException {System.out.println("消费者1接收到simple.queue的消息【"+msg+"】"+ LocalTime.now());Thread.sleep(20);}@RabbitListener(queues = "simple.queue")public void listenWorkQueue2(String msg) throws InterruptedException {System.err.println("消费者2接收到simple.queue的消息【"+msg+"】"+LocalTime.now());Thread.sleep(200);}}

因为消费预取限制,导致消息预取分配给两个cnsumer各一半。消费者1只接收奇数消息队列,消费者2只接收偶数消息队列,而消费者2的处理消息能力远低于消费者1,会拉低整体处理消息的能力

取消消费预取限制:

修改application.yml文件,设置preFetch这个值,可以控制预取消息的上限:

spring:rabbitmq:host: 192.168.202.128port: 5672virtual-host: /username: itcastpassword: 123321listener:simple:prefetch: 1 #每次只能获取一条消息,处理完成才能获取下一个消息

总结:

Work模型的使用:

多个消费者绑定到一个队列,同一条消息只会被一个消费者处理

通过设置prefetch来控制消费者预取的消息数量

发布订阅模型介绍

发布(publish)订阅(subscribe)模式与之前案例的区别就是允许将同一消息发送给多个消费者。实现方式是加入了exchange(交换机)

常见的exchange类型包括:

Fanout:广播

Direct:路由

Topic:话题

注意:exchange负责消息路由,而不是存储,路由失败则消息丢失

Fanout Exchange

Fanout Exchange会将接收到的消息路由到每一个跟其绑定的queue

案例:利用SpringAMQP演示FanoutExchange的使用

实现思路:

1.在consumer服务中,利用代码声明队列、交换机,并将两者绑定

2.在consumer服务中,编写两个消费者方法,分别监听fanout.queue1和fanout.queue2

3.在publisher中编写测试方法,向itcast.fanout发送消息

步骤一:

首先,SpringAMQP提供了声明交换机、队列、绑定关系的API,例如:

其次,在consumer服务创建一个类,添加@Configuration注解,并声明FanoutExchange、Queue和绑定关系对象Binding。

代码如下:

@Configuration
public class FanoutConfig {//itcast.fanout@Beanpublic FanoutExchange fanoutExchange(){return new FanoutExchange("itcast.fanout");}//fanout.queue1@Beanpublic Queue fanoutQueue1(){return new Queue("itcast.queue1");}//fanout.queue2@Beanpublic Queue fanoutQueue2(){return new Queue("itcast.queue2");}@Beanpublic Binding fanoutBinding1(Queue fanoutQueue1,FanoutExchange fanoutExchange){return BindingBuilder.bind(fanoutQueue1).to(fanoutExchange);}@Beanpublic Binding fanoutBinding2(Queue fanoutQueue2,FanoutExchange fanoutExchange){return BindingBuilder.bind(fanoutQueue2).to(fanoutExchange);}}

步骤二:

@Component
public class SpringRabbitListener {@RabbitListener(queues = "itcast.queue1")public void listenWorkQueue(String msg) throws InterruptedException {System.out.println("消费者1接收到Fanout的消息【"+msg+"】"+ LocalTime.now());}@RabbitListener(queues = "itcast.queue2")public void listenWorkQueue2(String msg) throws InterruptedException {System.err.println("消费者2接收到Fanout的消息【"+msg+"】"+LocalTime.now());}}

步骤三:

@SpringBootTest
public class SpringAmqpTest {@Autowiredprivate RabbitTemplate rabbitTemplate;@Testpublic void testSendFanoutExchange(){//交换机名称String exchangeName="itcast.fanout";//消息String message="hello,everybody~";//发送rabbitTemplate.convertAndSend(exchangeName,"",message);}
}

运行成功,nice

总结:

交换机的作用是什么?

接收publisher发送的消息

将消息按照规则路由到与之绑定的队列

不能缓存消息,路由失败,消息失败

FanoutExchange会将消息路由到每个绑定的队列

声明队列、交换机、绑定关系的Bean是什么?

Queue

FanoutExchange

Binding

DirectExchange

DirectExchange会将接收到的消息根据规则路由到指定的Queue,因此成为路由模式(routes)

案例:利用SpringAMQP演示DirectExchange的使用

实现思路如下:

1.利用@RabbitListener声明Exchange、Queue、RoutingKey

2.在consumer服务中,编写两个消费者方法,分别监听direct.queue1和direcct.queue2

3.在publisher中编写测试方法,向itcast.direct发送消息

步骤一、二:

@Component
public class SpringRabbitListener {@RabbitListener(bindings=@QueueBinding(value=@Queue(name="direct.queue1"),exchange=@Exchange(name="itcast.direct",type= ExchangeTypes.DIRECT),key={"red","blue"}))public void listenDirectQueue1(String msg){System.err.println("消费者接收到direct.queue1的消息【"+msg+"】"+LocalTime.now());}@RabbitListener(bindings = @QueueBinding(value=@Queue(name="direct.queue2"),exchange = @Exchange(name="itcast.direct",type="direct"),key={"red","yellow"}))public void listenDirectQueue2(String msg){System.err.println("消费者接收到direct.queue2的消息【"+msg+"】"+LocalTime.now());}}

步骤三:

    @Testpublic void testSendDirectExchange(){String exchangeName="itcast.direct";String message="hello,blue";rabbitTemplate.convertAndSend(exchangeName,"blue",message);}

总结:

描述下Direct交换机与Fanout交换机的差异?

Fanout交换机将消息路由给每一个与之绑定的队列

Direct交换机根据RoutingKey判断路由给哪个队列

如果多个队列具有相同的RoutingKey,则与Fanout功能类似

基于@RabbitListener注解声明队列和交换机有哪些常见注解?

@Queue

@Exchange

TopicExchange

TopicExchange与DirectExchange类似,区别在于routingKey必须是多个单词的列表,且以点.做分割

Queue与Exchange指定BindingKey时可以使用通配符:

#:代指0个或多个单词

*:代指一个单词

案例:利用SpringAMQP演示TopicExchange的使用

实现思路如下:

1.利用@RabbitListener声明Exchange、Queue、RoutingKey

2.在consumer服务中编写两个消费者方法,分别监听topic.queue1和topic.queue2

3.在publisher中编写测试方法,向itcast.topic发送消息

步骤一、二:

@RabbitListener(bindings = @QueueBinding(value=@Queue("topic.queue1"),exchange = @Exchange(name="itcast.topic",type="topic"),key = "china.#"))public void listenTopicQueue1(String msg){System.err.println("消费者接收到topic.queue1的消息【"+msg+"】");}@RabbitListener(bindings = @QueueBinding(value=@Queue("topic.queue2"),exchange = @Exchange(name="itcast.topic",type="topic"),key = "#.news"))public void listenTopicQueue2(String msg){System.err.println("消费者接收到topic.queue2的消息【"+msg+"】");}

步骤三:

    @Testpublic void testSendTopicExchange(){String exchangeName="itcast.topic";String message="学it,来黑马";rabbitTemplate.convertAndSend(exchangeName,"china.news",message);}

消息转换器

案例:测试发送Object类型消息

说明:在SpringAMQP的发送方法中,接收消息的类型是Object,也就是说我们可以发送任意类型的消息,SpringAMQP会帮我们序列化为字节后发送

    @Bean Queue objectQueue(){return new Queue("object.queue");}
    public void testSendObjectQueue(){Map<String,Object> msg=new HashMap<>();msg.put("name","柳岩");msg.put("age",21);rabbitTemplate.convertAndSend("object.queue",msg);}

队列中收到的消息:

===>Spring对消息对象的处理是由org.springframework.amqp.support.converter.Messaegonverter来处理的。而默认实现是SimpleMessageConverter,基于JDK的ObjectOutputStream来完成序列化

如果要修改只需要定义一个MessageConverter类型的Bean即可。推荐用JSON方式序列号。步骤如下:

消息发送:

①在publisher服务引入依赖

        <dependency><groupId>com.fasterxml.jackson.core</groupId><artifactId>jackson-databind</artifactId></dependency>

②在publisher服务声明MessageConverter

    @Beanpublic MessageConverter messageConverter(){return new Jackson2JsonMessageConverter();}

运行结果:

消息接收:

①引入jackson依赖

②在consumer服务中定义MessageConverter

③定义一个消费者,监听object.queue队列并消费消息

    @RabbitListener(queues="object.queue")public void listenObejctQueue(Map<String,Object> msg){System.out.println("收到消息:【"+msg+"】");}

总结:

SpringAMQP中的消息序列化和反序列化是怎么实现的?

利用MessageConverter实现的,默认是JDK的序列化

注意发送方与接收方必须使用相同的MessageConverter

实用篇---第五天

分布式搜索---elasticsearch

一、初识elasticsearch

什么是elasticsearch?

elasticsearch是一款非常强大的开源搜索引擎,可以帮助我们从海量数据中快速找到需要的内容

elasticsearch结合kibana、Logstash、Beats,也就是elastic stack(ELK)。被广泛应用在日志数据分析、实时监控等领域

elasticsearch是elastic stack的核心,负责存储、搜索和分析数据

elasticsearch底层使用了Lucene技术

Lucene是一个Java语言的搜索引擎类库,是Apache公司的顶级项目,由DougCutting于1999年研发

Lucene的优势:

易扩展

高性能(基于倒排索引)

Lucene的缺点:

只限于Java语言开发

学习曲线陡峭

不支持水平扩展

elasticsearch的发展:

2004年Shay Banon基于Lucene开发了Compass

2010年Shay Banon重写了Compass,取名为Elasticsearch

相比于Lucene,elasticsearch具备下列优势:

支持分布式,可水平扩展

提供Restful接口,可悲任何语言调用

总结:

正向索引和倒排索引

传统数据库(如MySQL)采用正向索引

elasticsearch采用倒排索引:

文档(document):每条数据就是一个文档

词条(term):文档按照语义分成的词语

正向索引:基于文档id创建索引。查询词条时必须先找到文档,而后判断是否包含词条

倒排索引:对文档内容分词,对词条创建索引,并记录词条所在文档的信息。查询时先根据词条查询到文档id,而后获取文档

es和mysql概念对比

文档:

elasticsearch是面向文档存储的,可以是数据库中的一条商品数据、一个订单信息

文档数据会被序列化为json格式后存储在elasticsearch中

索引:

索引(index):是相同类型文档的集合

映射(mapping):索引中文档的字段约束信息,类似表的结构约束

概念对比:

架构

MySQL:擅长事务类型操作,可以确保数据的安全和一致性

Elasticsearch:擅长海量数据的搜索、分析和计算

总结:

文档:一条数据就是一个文档,es中是json格式

字段:json文档中的字段

索引:同类型文档的集合

映射:索引中文档的约束,比如字段名称、类型

elasticsearch与数据库的关系:

数据库负责事务类型操作

elasticsearch负责海量数据的搜索、分析和计算

安装es

第一步:创建网络

因为我们还需要部署kibana容器,因此需要让es和kibana容器互联。这里先创建一个网络:

docker network create es-net

第二步:将es.tar加载:

docker load -i es.tar

kibana的tar包也需要这样做

第三步:运行docker命令,部署单点es

只要看到下面的界面,就代表部署es成功:

安装kibana

kibana可以给我们提供一个elasticsearch的可视化界面,便于我们学习

部署:

运行docker命令,部署kibana

--network=es-net:加入一个名为es-net的网络中,与elasticsearch在同一个网络中

-e ELASTICSEARCH_HOSTS=http://es:9200:设置elasticsearch的地址,因为kibana已经与elasticsearch在一个网络,所以可以用容器名直接访问elasticsearch

注意:kibana和elasticsearch的版本必须严格一致,并在同一网络中

看到下面这个界面代表部署kibana成功:

安装ik分词器

es在创建倒排索引时需要对文档分词

在搜索时,需要对用户输入内容分词。但默认的分词规则则对中文处理并不友好。

我们可以在kibana的DevTools中测试:

POST /_analyze
{"analyzer": "standard","text": "黑马程序员学习java也太棒了吧!"
}

语法说明:

POST:请求方式

/_analyze:请求路径,这里省略了http://192.168.150.101:9200,有kibana帮我们补充

请求参数,json风格:

analyzer:分词器类型,这里默认是standard

text:要分词的内容

分词结果:

处理中文分词,一般会使用lk分词器

安装ik:

第一步:查看数据卷目录

安装插件需要知道elasticsearch的plugins目录位置,而我们用了数据卷挂载,因此需要查看elasticsearch的数据卷目录,通过下面命令查看:

第二步:把课前资料中的lk分词器解压缩,重命名为ik

第三步:上传到es容器的插件数据卷中

也就是/var/lib/docker/volumes/es-plugins/_data

第四步:重启容器

docker restart es

第五步:测试

ik分词器包含两种模式:

ik_smart:最少切分

ik_max_word:最细切分

POST /_analyze
{"analyzer": "ik_smart","text": "黑马程序员学习java也太棒了吧!"
}

分词效果:

ik分词器的扩展和停用词典

测试:


POST /_analyze
{"analyzer":"ik_smart","text":"传智播客的课程可白嫖"
}

可以看到ik无法对所有词语完美分词:

扩展词库:

停用词库:

进入文件,可以看见:

entry标签里填入文件名,直接进入对应的文件添加内容即可

重启es:

docker restart es

测试:


POST /_analyze
{"analyzer":"ik_smart","text":"传智播客的课程可白嫖了"
}

总结:

分词器的作用是什么?

创建倒排索引时对文档分词

用户搜索时,对输入的内容分词

ik分词器有几种模式?

ik_smart:只能切分,粗粒度

ik_max_word:最细切分,细粒度

ik分词器如何扩展词条?如何停用词条?

利用config目录的ikAnalyzer.cfg.xml文件添加扩展词典和停用词典

在词典中添加扩展词条或者停用词条

二、索引库操作

mapping映射属性

mapping是对索引库中文档的约束,常见的mapping属性包括:

type:字段数据类型,常见的简单类型有:

字符串:text(可分词的文本)、keyword(精确值,例如:品牌、国家、ip地址)

数值:long、integer、short、byte、double、float

布尔:boolean

日期:date

对象:object

注意,在es中没有数组这个类型,但是允许某一种类型的字段有多个值,所以这些都可以作为数组

index:是否创建索引,默认为true。只有index为true,才会创建倒排索引,如果index设为false,则不参与倒排索引

analyzer:使用哪种分词器

properties:该字段的子字段

总结:

创建索引库

ES中通过Restful请求操作索引库、文档。请求内容用DSL语句表示。

创建索引库和mapping的DSL语法如下:

实操定义DSL语句:

PUT /heima
{"mappings":{"properties":{"info":{"type":"text","analyzer":"ik_smart"},"email":{"type":"keyword","index":false},"name":{"type":"object","properties": {"firstName":{"type":"keyword"},"lastName":{"type":"keyword"}}}}}
}

创建成功:

查看、删除、修改索引库

查看索引库语法:

GET /索引库名

删除索引库语法:

DELETE /索引库名

修改索引库:

索引库和mapping一旦创建无法修改,但是可以添加新的字段,语法如下:

PUT /heima/_mapping
{"properties":{"age":{"type":"integer"}}
}

总结:

索引库操作有哪些?

创建索引库:PUT/索引库名

查询索引库:GET/索引库名

删除索引库:DELETE/索引库名

添加字段:PUT/索引库名/_mapping

三、文档操作

新增、查询、删除文档

新增文档的DSL语法:

插入一个文档:

POST /heima/_doc/1
{"name":{"firstName":"信","lastName":"李"},"info":"人送外号峡谷拆迁队队长","email":"123@qq.com"
}

查看文档:

语法:GET /索引库名/_doc/文档id

示例:

GET /heima/_doc/1

删除文档:

语法:DELETE 索引库名/_doc/文档id

示例:

DELETE /heima/_doc/1

修改文档

方式一:全量修改,会删除旧文档,添加新文档

其实这种方式既可以做新增又可以做修改

方式二:

增量修改,修改制定的字段值

可以修改已经有的字段:

POST /heima/_update/1
{"doc":{"email":"lixin@qq.com"}
}

也可以添加没有的字段:

POST /heima/_update/1
{"doc":{"gender":"男"}
}

此时查看索引结构,可以发现gender字段被创建出来了

总结:

四、RestClient操作索引库

导入demo

ES官方提供了各种语言的客户端,用来操作ES。这些客户端的本质就是组装DSL语句,通过http请求发送给ES。

案例:利用JavaRestClient实现创建、删除索引库,判断索引库是否存在

hotel数据结构分析

mapping要考虑的问题:

字段名、数据类型、是否参与搜索、是否分词、如果分词,分词器是什么?

定义hotel:

PUT /hotel
{"mappings":{"properties":{"id":{"type":"keyword"},"name":{"type":"text","analyzer":"ik_max_word","copy_to":"all"},"address":{"type":"keyword","index":false},"price":{"type":"integer"},"score":{"type":"integer"},"brand":{"type":"keyword","copy_to":"all"},"city":{"type":"keyword"},"star_name":{"type":"keyword"},"business":{"type":"keyword","copy_to": "all"},"location":{"type":"geo_point"},"pic":{"type":"keyword","index":false},"all":{"type":"text","analyzer":"ik_max_word"}}
}

初始化RestClient

1.引入es的RestHighLevelClient依赖

        <dependency><groupId>org.elasticsearch.client</groupId><artifactId>elasticsearch-rest-high-level-client</artifactId><version>7.12.1</version></dependency>

2.因为SpringBoot默认的ES版本是7.6.2,所以我们需要覆盖默认的ES版本

        <elasticsearch.version>7.12.1</elasticsearch.version>

3.初始化RestHighLevelClient

public class HotelIndexTest {private RestHighLevelClient client;@BeforeEachvoid setUp(){this.client=new RestHighLevelClient(RestClient.builder(HttpHost.create("http://192.168.202.128:9200")));}@AfterEachvoid testDown() throws IOException {this.client.close();}
}

创建索引库

删除和判断数据库

删除索引库:

@Testvoid testDeleteHotelIndex() throws IOException {DeleteIndexRequest request = new DeleteIndexRequest("hotel");client.indices().delete(request,RequestOptions.DEFAULT);}

判断索引库是否存在

    @Testvoid testExistHotelIndex() throws IOException {GetIndexRequest request = new GetIndexRequest("hotel");boolean exists = client.indices().exists(request, RequestOptions.DEFAULT);System.err.println(exists?"索引库已经存在!":"索引库不存在!");}

总结:

索引库操作的基本步骤:

①初始化RestHighLevelClient

②创建XxxIndexRequest。Xxx是Create、Get、Delete

③准备DSL(Create时需要)

④发送请求。调用RestHighLevelClient的indices().xxx()方法

xxx是create、exists、delete

五、RestClient操作文档

新增文档

第一步:初始化JavaRestClient

新建一个测试类,实现文档相关操作,并且完成JavaestClient的初始化

第二步:添加酒店数据到索引库

先查询酒店数据,然后给这条数据创建倒排索引,即可完成添加

public class HotelDocumentTest {private RestHighLevelClient client;@BeforeEachvoid setUp(){this.client=new RestHighLevelClient(RestClient.builder(HttpHost.create("192.168.202.128:9200")));}@AfterEachvoid testDown() throws IOException {this.client.close();}
}

给测试类添加@SpringBootTest注解,可以自动注入

    @Autowiredprivate IHotelService hotelService;@Testvoid testAddDocument() throws IOException {//根据id查询酒店数据Hotel hotel = hotelService.getById(61083L);HotelDoc hotelDoc = new HotelDoc(hotel);//1.准备Request对象IndexRequest request = new IndexRequest("hotel").id(hotelDoc.getId().toString());//2.准备Json文档request.source(JSON.toJSONString(hotelDoc), XContentType.JSON);//3.发送请求client.index(request, RequestOptions.DEFAULT);}

注:因为我们准备的实体类和索引库的实体类有差异,所以需要为索引库数据专门准备一个转变的实体类

@Data
@NoArgsConstructor
public class HotelDoc {private Long id;private String name;private String address;private Integer price;private Integer score;private String brand;private String city;private String starName;private String business;private String location;private String pic;public HotelDoc(Hotel hotel) {this.id = hotel.getId();this.name = hotel.getName();this.address = hotel.getAddress();this.price = hotel.getPrice();this.score = hotel.getScore();this.brand = hotel.getBrand();this.city = hotel.getCity();this.starName = hotel.getStarName();this.business = hotel.getBusiness();this.location = hotel.getLatitude() + ", " + hotel.getLongitude();this.pic = hotel.getPic();}
}

在索引库中查询

GET /hotel/_doc/61083

查询文档

    @Testvoid testGetDocumentById() throws IOException {//1.准备RequestGetRequest request = new GetRequest("hotel", "61083");//2.发送请求,得到响应GetResponse response = client.get(request, RequestOptions.DEFAULT);//3.解析响应结果String json = response.getSourceAsString();HotelDoc hotelDoc = JSON.parseObject(json, HotelDoc.class);System.out.println(hotelDoc);}

运行结果:

更新文档

修改文档数据有两种方式:

方式一:全量更新。再次写入id一样的文档,就会删除旧文档,添加新文档

方式二:局部更新。只更新部分字段

我们演示方式二:

    @Testvoid testUpdateDocument() throws IOException {//1.准备RequestUpdateRequest request = new UpdateRequest("hotel", "61083");//2.准备请求参数request.doc("price","952","starName","四钻");//3.发送请求client.update(request,RequestOptions.DEFAULT);}

可以看到price和starName修改成功:

删除文档

    @Testvoid testDeleteDocument() throws IOException {DeleteRequest request = new DeleteRequest("hotel", "61083");client.delete(request,RequestOptions.DEFAULT);}

总结:

文档操作的基本步骤:

初始化RestHighLevelClient

初始化XxxRequest。Xxx是Index、Get、Update、Delete

准备参数(Index和Update时需要)

发送请求。调用RestHighLevelClient的xxx()方法

xxx是index、get、update、delete

批量导入文档

需求:批量查询酒店数据,然后批量导入索引库中

思路:

1.利用mybatis-plus查询酒店数据

2.将查询到的酒店数据(Hotel)转换为文档类型数据(HotelDoc)

3.利用JavaRestClient中的Bulk批处理,实现批量新增文档

    @Testvoid testBulkRequest() throws IOException {//批量查询酒店数据List<Hotel> hotels = hotelService.list();//1.创建RequestBulkRequest request = new BulkRequest();for(Hotel hotel:hotels){HotelDoc hotelDoc = new HotelDoc(hotel);//2.准备参数,添加多个新增的Requestrequest.add(new IndexRequest("hotel").id(hotelDoc.getId().toString()).source(JSON.toJSONString(hotelDoc),XContentType.JSON));}//3.发送请求client.bulk(request,RequestOptions.DEFAULT);}

可以用DSL语句:GET /hotel/_search        对批量导入功能进行验证

六、分布式搜索引擎

DSL查询文档

Elasticsearch提供了基于JSON的DSL来定义查询。常见的查询类型包括:

查询所有:查询出所有数据,一般测试用。例如:match_all

全文检索(full text)查询:利用分词器对用户输入内容分词,然后去倒排索引库中匹配。例如:

match_query

multi_match_query

精确查询:根据精确词条值查找数据,一般是查找keyword、数值、日期、boolean等类型字段

ids

range

term

地理(geo)查询:根据经纬度查询。例如:

geo_distance

geo_bounding_box

复合(compound)查询:复合查询可以将上述各种条件组合起来,合并查询条件。例如:

bool

function_score

GET /hotel/_search
{"query":{"match_all":{}}
}

查询DSL的基本语法是什么?

GET  /索引库名/_search

{

“query”:{

“查询类型”:{

“FIELD”:“TEXT”

}

}

}

全文检索查询

全文检索查询,会对用户输入内容分词,常用于搜索框搜索:

match查询:全文检索查询的一种,会对用户输入内容分词,然后去倒排索引库检索。

语法:

比如查询如家外滩,首先会对“如家外滩”分词,匹配度越高,得分越高,越靠前

GET /hotel/_search
{"query":{"match":{"all":"外滩如家"}}
}

multi_match:与match查询类似,只不过允许同时查询多个字段

GET /hotel/_search
{"query": {"multi_match": {"query": "外滩如家","fields": ["brand","name","business"]}}
}

总结:

match和multi_match的区别是什么?

match:根据一个字段查询

multi_match:根据多个字段查询,参与查询的字段越多,性能就越差

精确查询

精确查询一般是查找keyword、数值、日期、boolean等类型字段。所以不会对搜索条件分词。常见的有:

term:根据词条精确值查询

range:根据值的范围查询

term查询:

GET /hotel/_search
{"query":{"term":{"city":{"value":"上海"}}}
}

range查询:

GET /hotel/_search
{"query": {"range":{"price":{"gte":100,"lte":300}}}
}

地理查询

geo_bounding_box:查询geo_point值落在某个矩形范围的所有文档

geo_distance:查询到指定中心点小于某个距离值的所有文档

GET /hotel/_search
{"query":{"geo_distance":{"distance":"15km","location":"31.21,121.5"}}
}

相关性打分算法

复合(compound)查询:复合查询可以将其他简单查询组合起来,实现更复杂的搜索逻辑:

例如:

function score:算分函数查询,可以控制文档相关性算分,控制文档排名。例如百度竞价

相关性算分:

当我们利用match查询时,文档结果会根据与搜索词条的关联度打分(_score),返回结果时按照分值降序排列

总结:

Function Score Query

案例:给“如家”这个品牌的酒店排名靠前一点

==>翻译来说,function score需要的三要素:

1.哪些文档需要算分加权?

品牌为如家的酒店

2.算分函数是什么?

weight

3.加权模式是什么?

求和

GET /hotel/_search
{"query":{"function_score":{"query":{"match":{"all":"外滩"}},"functions":[{"filter":{"term":{"brand":"如家"}},"weight":10}],"boost_mode":"sum"}}
}

function score query定义的三要素是什么?

过滤条件:哪些文档要加分

算分函数:如何计算function score

加权方式:function score与query score如何运算

Boolean Query

布尔查询是一个或多个查询子句的组合。子查询的组合方式有:

must:必须匹配每个子查询,类似“与”

should:选择性匹配子查询,类似“或”

must_not:必须不匹配,不参与算分,类似于“非”

filter:必须匹配,不参与算分

案例:利用bool查询实现功能

需求:搜索名字包含“如家”,价格不高于400,在坐标31.21,121.5周围10km范围内的酒店

GET /hotel/_search
{"query":{"bool":{"must": [{"match": {"name":"如家"}}],"must_not":[{"range":{"price":{"gt":400}}}],"filter":[{"geo_distance":{"distance":"10km","location":{"lat": 31.21,"lon":121.5}}}]}}
}

二、搜索结果处理

排序

elasticsearch支持对搜索结果排序,默认是根据相关度算分(_score)来排序。可以排序的字段类型由:keyword类型、数值类型、地理坐标类型、日期类型等

案例:对酒店数据按照用户评价降序排序,评价相同的按照价格升序排序

GET /hotel/_search
{"query":{"match_all":{}},"sort":[{"score":"desc"    },{"price":"asc"}]
}

案例:实现对酒店数据按照你的位置坐标的距离升序排序

GET /hotel/_search
{"query":{"match_all":{}},"sort":[{"_geo_distance": {"location": {"lat": 31.034661,"lon": 121.612282},"order": "asc","unit":"km"}   }]
}

分页

elasticsearch默认情况下只返回top10的数据。而如果要查询更多的数据,就需要修改分页参数

elasticsearch中通过from、size参数来控制要返回的分页结果:


GET /hotel/_search
{"query":{"match_all": {}},"sort":[{"price":"asc"}],"from":2,"size":10}

深度分页问题:

ES是分布式的,所以会面临深度分页问题。例如按price排序后,获取from=990,size=10的数据:

针对深度分页,ES提供了两种解决方案:

search after:分页时需要排序,原理是从上一次的排序值开始,查询下一页数据。官方推荐。

scroll:原理是将排序数据形成快照,保存在内存。官方已经不推荐使用。

总结:

高亮

高亮就是在搜索结果中把搜索关键字突出显示

原理:

将搜索结果中的关键字用标签标记出来

在页面中给标签添加css样式

注意:高亮查询,默认情况下ES搜索字段必须和高亮字段一致

GET /hotel/_search
{"query":{"match":{"all":"如家"}},"highlight": {"fields":{"name":{"require_field_match":"false" }}}
}

总结:

三、RestClient查询文档

快速入门

    @Testvoid testMatchAll() throws IOException {SearchRequest request = new SearchRequest("hotel");request.source().query(QueryBuilders.matchAllQuery());SearchResponse search = client.search(request, RequestOptions.DEFAULT);System.out.println(search);}

解析拿到的结果:

总代码:

    @Testvoid testMatchAll() throws IOException {SearchRequest request = new SearchRequest("hotel");request.source().query(QueryBuilders.matchAllQuery());SearchResponse response = client.search(request, RequestOptions.DEFAULT);SearchHits searchHits = response.getHits();long total = searchHits.getTotalHits().value;System.out.println("共搜索到"+total+"条数据");SearchHit[] hits = searchHits.getHits();for(SearchHit hit:searchHits){String json = hit.getSourceAsString();HotelDoc hotelDoc = JSON.parseObject(json, HotelDoc.class);System.out.println(hotelDoc);}}

总结:

总结:

查询的基本步骤是:

1.创建SearchRequest对象

2.准备Request.source(),也就是DSL

①QueryBuilders来构建查询条件

②传入Request.source()的query()方法

3.发送请求,得到结果

4.解析结果(参考JSON结果,从外到内,逐层解析)

match、term、range、bool查询

match语句只需修改QueryBuilders的方法

        request.source().query(QueryBuilders.matchQuery("all","如家"));

term、range、bool查询:

    @Testvoid testBool() throws IOException {SearchRequest request = new SearchRequest("hotel");BoolQueryBuilder boolQuery = QueryBuilders.boolQuery();boolQuery.must(QueryBuilders.termQuery("city","上海"));boolQuery.filter(QueryBuilders.rangeQuery("price").gte(50).lte(250));request.source().query(boolQuery);SearchResponse response = client.search(request, RequestOptions.DEFAULT);handleResponse(response);}

排序和分页

    @Testvoid testPageAndSort() throws IOException {//定义页码、每页大小int page=1,size=5;SearchRequest request = new SearchRequest("hotel");request.source().query(QueryBuilders.matchAllQuery());//排序 sortrequest.source().sort("price", SortOrder.ASC);//分页 from、sizerequest.source().from((page-1)*size).size(size);SearchResponse response = client.search(request, RequestOptions.DEFAULT);handleResponse(response);}

高亮

    @Testvoid testHighLight() throws IOException {SearchRequest request = new SearchRequest("hotel");//准备queryrequest.source().query(QueryBuilders.matchQuery("name","如家"));//高亮request.source().highlighter(new HighlightBuilder().field("name").requireFieldMatch(false));SearchResponse response = client.search(request, RequestOptions.DEFAULT);handleResponse(response);}

    private void handleResponse(SearchResponse response){SearchHits searchHits = response.getHits();long total = searchHits.getTotalHits().value;System.out.println("共搜索到"+total+"条数据");SearchHit[] hits = searchHits.getHits();for(SearchHit hit:hits){//获取文档sourceString json = hit.getSourceAsString();//反序列化HotelDoc hotelDoc = JSON.parseObject(json, HotelDoc.class);//获取高亮结果Map<String, HighlightField> highlightFields = hit.getHighlightFields();//根据字段名获取高亮结果if(!CollectionUtils.isEmpty(highlightFields)) {HighlightField highlightField = highlightFields.get("name");//获取高亮值String name = highlightField.getFragments()[0].string();//覆盖非高亮结果hotelDoc.setName(name);}System.out.println(hotelDoc);}}

总结:

所有搜索DSL的构建,记住一个API:

SearchRequest的source()方法

高亮结果解析是参考JSON结果,逐层解析

四、黑马旅游案例

酒店搜索和分页

案例1:实现黑马旅游的酒店搜索功能,完成关键字搜索和分页

先实现其中的关键字搜索功能,实现步骤如下:

1.实现实体类、接收前端请求

@Data
public class RequestParams {private String key;private Integer page;private Integer size;private String sortBy;
}

2.定义controller接口,接受页面请求,调用IHostServicce的search方法

请求方式:Post

请求路径:/hotel/list

请求参数:对象,类型为RequestParam

返回值:PageResult,包含两个属性:

①Long total:总条数

②List<HotelDoc> hotels:酒店数据

@Data
@NoArgsConstructor
@AllArgsConstructor
public class PageResult {private Long total;private List<HotelDoc> hotels;}
public interface IHotelService extends IService<Hotel> {PageResult search(RequestParams params);
}
@MapperScan("cn.itcast.hotel.mapper")
@SpringBootApplication
public class HotelDemoApplication {public static void main(String[] args) {SpringApplication.run(HotelDemoApplication.class, args);}@Beanpublic RestHighLevelClient client(){return new RestHighLevelClient(RestClient.builder(HttpHost.create("http://192.168.202.128:9200")));}
}
@Service
public class HotelService extends ServiceImpl<HotelMapper, Hotel> implements IHotelService {@AutowiredRestHighLevelClient client;@Overridepublic PageResult search(RequestParams params) {try {SearchRequest request = new SearchRequest("hotel");String key=params.getKey();if(key==null || "".equals(key))request.source().query(QueryBuilders.matchAllQuery());elserequest.source().query(QueryBuilders.matchQuery("all",key));int page=params.getPage();int size=params.getSize();request.source().from((page-1)*size).size(size);SearchResponse response = client.search(request, RequestOptions.DEFAULT);return handleResponse(response);} catch (IOException e) {throw new RuntimeException(e);}}private PageResult handleResponse(SearchResponse response){SearchHits searchHits = response.getHits();long total = searchHits.getTotalHits().value;SearchHit[] hits = searchHits.getHits();List<HotelDoc> hotels=new ArrayList<>();for(SearchHit hit:hits){String json = hit.getSourceAsString();HotelDoc hotelDoc = JSON.parseObject(json, HotelDoc.class);hotels.add(hotelDoc);}return new PageResult(total,hotels);}
}

3.定义IHotelService中的search方法,利用match查询实现根据关键字搜索酒店的信息

添加品牌、城市、星级、价格等过滤功能

步骤:

1.修改RequestParams类,添加brand、city、starName、minPrice、maxPrice等参数

@Data
public class RequestParams {private String key;private Integer page;private Integer size;private String sortBy;private String city;private String brand;private String starName;private Integer minPrice;private Integer maxPrice;
}

2.修改search方法的实现,在关键字搜索时,如果brand等参数存在,对其做过滤

过滤条件包括:

city精确匹配

brand精确匹配

starName精确匹配

price范围过滤

注意事项:

多个条件之间是AND关系,组合多条件用BooleanQuery

参数存在才需要过滤,做好非空判断

初始代码:

    @Overridepublic PageResult search(RequestParams params) {try {SearchRequest request = new SearchRequest("hotel");// 构建BooleanQueryBoolQueryBuilder boolQuery = QueryBuilders.boolQuery();//关键字搜索String key=params.getKey();if(key==null || "".equals(key))boolQuery.must(QueryBuilders.matchAllQuery());elseboolQuery.must(QueryBuilders.matchQuery("all",key));//条件过滤//城市条件if(params.getCity()!=null && !"".equals(params.getCity())){boolQuery.filter(QueryBuilders.termQuery("city",params.getCity()));}//品牌条件if(params.getBrand()!=null && !params.getBrand().equals("")){boolQuery.filter(QueryBuilders.termQuery("brand",params.getBrand()));}//星级条件if(params.getStarName()!=null && !params.getStarName().equals("")){boolQuery.filter(QueryBuilders.termQuery("starName",params.getStarName()));}if(params.getMaxPrice()!=null && params.getMinPrice()!=null){boolQuery.filter(QueryBuilders.rangeQuery("price").gte(params.getMinPrice()).lte(params.getMaxPrice()));}request.source().query(boolQuery);int page=params.getPage();int size=params.getSize();request.source().from((page-1)*size).size(size);SearchResponse response = client.search(request, RequestOptions.DEFAULT);return handleResponse(response);} catch (IOException e) {throw new RuntimeException(e);}}

可以按快捷键 ctrl+alt+m,快速重构代码,抽取冗余部分

    @Overridepublic PageResult search(RequestParams params) {try {SearchRequest request = new SearchRequest("hotel");buildBasicQuery(params,request);int page=params.getPage();int size=params.getSize();request.source().from((page-1)*size).size(size);SearchResponse response = client.search(request, RequestOptions.DEFAULT);return handleResponse(response);} catch (IOException e) {throw new RuntimeException(e);}}private void buildBasicQuery(RequestParams params,SearchRequest request) {// 构建BooleanQueryBoolQueryBuilder boolQuery = QueryBuilders.boolQuery();//关键字搜索String key= params.getKey();if(key==null || "".equals(key))boolQuery.must(QueryBuilders.matchAllQuery());elseboolQuery.must(QueryBuilders.matchQuery("all",key));//条件过滤//城市条件if(params.getCity()!=null && !"".equals(params.getCity())){boolQuery.filter(QueryBuilders.termQuery("city", params.getCity()));}//品牌条件if(params.getBrand()!=null && !params.getBrand().equals("")){boolQuery.filter(QueryBuilders.termQuery("brand", params.getBrand()));}//星级条件if(params.getStarName()!=null && !params.getStarName().equals("")){boolQuery.filter(QueryBuilders.termQuery("starName", params.getStarName()));}if(params.getMaxPrice()!=null && params.getMinPrice()!=null){boolQuery.filter(QueryBuilders.rangeQuery("price").gte(params.getMinPrice()).lte(params.getMaxPrice()));}request.source().query(boolQuery);}

附近的酒店

前端页面点击定位后,会将你所在的位置发送给后台:

步骤:

1.修改RequestParams参数,接收location字段

2.修改search方法业务逻辑,如果location有值,添加根据geo_distance排序的功能

            //排序String location = params.getLocation();if(location != null && location.equals("")){request.source().sort(SortBuilders.geoDistanceSort("location",new GeoPoint(location)).order(SortOrder.ASC).unit(DistanceUnit.KILOMETERS));}

处理定位结果:

1.给HotelDoc添加distance字段

    private Object distance;

2.在handleResponse方法中添加如下代码(给hotelDoc注入distance字段):

        for(SearchHit hit:hits){String json = hit.getSourceAsString();HotelDoc hotelDoc = JSON.parseObject(json, HotelDoc.class);Object[] sortValues = hit.getSortValues();if(sortValues.length>0){Object sortValue = sortValues[0];hotelDoc.setDistance(sortValue);}hotels.add(hotelDoc);

广告置顶

让指定的酒店在搜索结果中排名置顶

我们给需要置顶的酒店文档添加一个标记,然后利用function score给带有标记的文档增加权重

步骤二:


POST /hotel/_update/60935
{"doc":{"isAD":true}
}POST /hotel/_update/309208
{"doc":{"isAD":true}
}

第三步:

        //算分控制FunctionScoreQueryBuilder functionScoreQuery = QueryBuilders.functionScoreQuery(boolQuery, new FunctionScoreQueryBuilder.FilterFunctionBuilder[]{new FunctionScoreQueryBuilder.FilterFunctionBuilder(QueryBuilders.termQuery("isAD", true),ScoreFunctionBuilders.weightFactorFunction(10))});request.source().query(functionScoreQuery);

广告标识效果:

实用篇---第七天

一、数据聚合

聚合的分类

聚合(aggregations)可以实现对文档数据的统计、分析、运算。聚合常见的有三类:

桶聚合:用来对文档做分组

TermAggregation:按照文档字段值分组

Date Histogram:按照日期阶梯分组,例如一周为一组,或者一月为一组

度量(Metric)聚合:用来计算一些值,比如:最大值、最小值、平均值等

Avg:求平均值

Max:求最大值

Min:求最小值

Stats:同时求max、min、avg、sum等

管道(pipeline)聚合:其他聚合的结果为聚合做基础

总结:

DSL实现Bucket聚合

桶聚合代码:

GET /hotel/_search
{"size":0,"aggs":{"brandAgg":{"terms":{"field": "brand","size":20}}}
}

运行结果:

默认情况下,Bucket聚合会统计Bucket内的文档数量,记为_count,并且按照_count降序排序

我们可以修改结果排序方式:

GET /hotel/_search
{"size":0,"aggs":{"brandAgg":{"terms":{"field": "brand","size":20,"order":{"_count": "asc"}}}}
}

默认情况下,Bucket聚合是对索引库的所有文档做聚合,我们可以限定要聚合的文档范围,只要添加query条件即可

GET /hotel/_search
{"query":{"range":{"price":{"lte":200}}},"size":0,"aggs":{"brandAgg":{"terms":{"field": "brand","size":10}}}
}

总结:

aggs代表聚合,与query同级,此时query的作用是?

限定聚合的文档范围

聚合必须的三要素:

聚合名称

聚合类型

聚合字段

聚合可配置的属性有:

size:指定聚合结果数量

order:指定聚合结果排序方式

field:指定聚合字段

DSL实现Metrics聚合

例如,我们要求获取每个品牌的用户评分的min、max、avg等值

我们可以利用stats聚合:

代码示例:

GET /hotel/_search
{"size":0,"aggs":{"brandAggs":{"terms":{"field": "brand","size":20},"aggs":{"scoreAgg":{"stats":{"field":"score"}}}}}
}

需求:按照分类好的avg降序排序

GET /hotel/_search
{"size":0,"aggs":{"brandAggs":{"terms":{"field": "brand","size":20,"order":{"scoreAgg.avg": "desc"}},"aggs":{"scoreAgg":{"stats":{"field":"score"}}}}}
}

RestAPI实现聚合

发起请求:

    @Testvoid testAggregation() throws IOException {SearchRequest request = new SearchRequest("hotel");request.source().size(0);request.source().aggregation(AggregationBuilders.terms("brandAgg").field("brand").size(20));SearchResponse response = client.search(request, RequestOptions.DEFAULT);System.out.println(response);}

处理响应:

@Testvoid testAggregation() throws IOException {SearchRequest request = new SearchRequest("hotel");request.source().size(0);request.source().aggregation(AggregationBuilders.terms("brandAgg").field("brand").size(20));SearchResponse response = client.search(request, RequestOptions.DEFAULT);Aggregations aggregations = response.getAggregations();Terms brandTerms = aggregations.get("brandAgg");List<? extends Terms.Bucket> buckets = brandTerms.getBuckets();for(Terms.Bucket bucket:buckets){String key = bucket.getKeyAsString();System.out.println(key);}}

多条件聚合

案例:在IUserService中定义方法,实现对品牌、城市、星级的聚合

    @Overridepublic Map<String, List<String>> filters() {try {SearchRequest request = new SearchRequest("hotel");request.source().size(0);String[] arr = {"brandAgg", "cityAgg", "starAgg"};String[] fields = {"brand", "city", "starName.keyword"};for (int i = 0; i < arr.length; i++) {request.source().aggregation(AggregationBuilders.terms(arr[i]).field(fields[i]).size(100));}SearchResponse response = client.search(request, RequestOptions.DEFAULT);Aggregations aggregations = response.getAggregations();Map<String, List<String>> res = new HashMap<>();for (int i = 0; i < arr.length; i++) {List<String> brandList = new ArrayList<>();Terms arrTerms = aggregations.get(arr[i]);List<? extends Terms.Bucket> buckets = arrTerms.getBuckets();for (Terms.Bucket bucket : buckets) {brandList.add(bucket.getKeyAsString());}res.put(fields[i], brandList);}return res;}catch (Exception e){throw new RuntimeException();}}

带过滤条件的聚合

第一步:

    @PostMapping("/filters")public Map<String, List<String>> getFilters(@RequestBody RequestParams params){return hotelService.filters(params);}

第二、三步:

            buildBasicQuery(params,request);

二、自动补全

安装拼音分词器

①解压

②上传至虚拟机的elasticsearch的plugin目录

③重启elasticsearch

④测试

POST /_analyze
{"text":["如家酒店还不错"],"analyzer": "pinyin"
}

自定义分词器

elasticsearch中分词器(analyzer)的组成包含三部分:

character filters:在tokenizer之前对文本进行处理。例如删除字符,替换字符

tokenizer:将文本按照一定的规则切割成词条(term)。例如keyword,就是不分词,还有ik_smart

tokenizer filter:将tokenizer输出的词条做进一步的处理。例如大小写转换、同义词处理、拼音处理等

PUT /test
{"settings":{"analysis": {"analyzer":{"my_analyzer":{"tokenizer":"ik_max_word","filter":"py"}},"filter":{"py":{"type":"pinyin","keep_full_pinyin":false,"keep_joined_full_pinyin":true,"keep_original":true,"limit_first_letter_length":16,"remove_duplicated_term":true,"none_chinese_pinyin_tokenizer":false}}}},"mappings":{"properties":{"name":{"type":"text","analyzer": "my_analyzer"}}}
}

测试一:

测试代码及结果:

POST /test/_analyze
{"text":["如家酒店还不错"],"analyzer": "my_analyzer"
}

测试二:

POST /test/_doc/1
{"id":1,"name":"狮子"
}POST /test/_doc/2
{"id":2,"name":"虱子"
}GET /test/_search
{"query":{"match":{"name":"shizi"}}
}

拼音分词器适合在创建倒排索引的时候使用,但不能在搜索的时候使用

==>因此字段在创建倒排索引时应该用my_analyzer分词器;字段在搜索时应该使用ik_smart分词器

PUT /test
{"settings":{"analysis": {"analyzer":{"my_analyzer":{"tokenizer":"ik_max_word","filter":"py"}},"filter":{"py":{"type":"pinyin","keep_full_pinyin":false,"keep_joined_full_pinyin":true,"keep_original":true,"limit_first_letter_length":16,"remove_duplicated_term":true,"none_chinese_pinyin_tokenizer":false}}}},"mappings":{"properties":{"name":{"type":"text","analyzer": "my_analyzer","search_analyzer": "ik_smart"}}}
}

DSL实现自动补全查询

elasticsearch提供了completion suggester查询来实现自动补全功能。这个查询会匹配以用户输入内容开头的词条并返回。为了提高补全查询的效率,对于文档中的类型有一些约束

参与补全查询的字段必须是completion类型

字段的内容一般是用来补全的多个词条形成的数组

代码:

# 自动补全的索引库
PUT /auto-test
{"mappings":{"properties": {"title":{"type":"completion"}}}
}# 示例数据
POST /auto-test/_doc
{"title":["Sonny","WH-1000XM3"]
}
POST /auto-test/_doc
{"title":["SK-II","PITERA"]
}
POST /auto-test/_doc
{"title":["Nintendo","switch"]
}

测试:

GET /auto-test/_search
{"suggest":{"titleSuggest":{"text":"s","completion":{"field":"title","skip_duplicates":true, "size":10}}}
}

酒店数据自动补全

案例:实现hotel索引库的自动补全、拼音搜索功能

实现思路:

1.修改hotel索引库结构,设置自定义拼音分词器

2.修改索引库的name、all字段,使用自定义分词器

3.索引库添加一个新字段suggestion,类型为completion类型,使用自定义的分词器

4.给HotelDoc类添加suggestion字段,内容包含brand、business

5.重新导入数据到hotel库

一、查看酒店的数据结构

# 查看酒店数据结构
GET /hotel/_mapping

二、创建hotel索引库

PUT /hotel
{"settings":{"analysis": {"analyzer": {"text_analyzer":{"tokenizer":"ik_max_word","filter":"py"},"completion_analyzer":{"tokenizer":"keyword","filter":"py"}},"filter": {"py":{"type":"pinyin","keep_full_pinyin":false,"keep_joined_full_pinyin":true,"keep_original":true,"limit_first_letter_length":16,"remove_duplicated_term":true,"none_chinese_pinyin_tokenizer":false}}}},"mappings":{"properties":{"id":{"type":"keyword"},"name":{"type":"text","analyzer":"text_analyzer","search_analyzer": "ik_smart", "copy_to":"all"},"address":{"type":"keyword","index":false},"price":{"type":"integer"},"score":{"type":"integer"},"brand":{"type":"keyword","copy_to":"all"},"city":{"type":"keyword"},"star_name":{"type":"keyword"},"business":{"type":"keyword","copy_to": "all"},"location":{"type":"geo_point"},"pic":{"type":"keyword","index":false},"all":{"type":"text","analyzer":"text_analyzer","search_analyzer": "ik_smart"},"suggestion":{"type":"completion","analyzer": "completion_analyzer"}}}
}

三、修改HotelDoc实体类并批处理导入数据

@Data
@NoArgsConstructor
public class HotelDoc {private Long id;private String name;private String address;private Integer price;private Integer score;private String brand;private String city;private String starName;private String business;private String location;private String pic;private Object distance;private Boolean isAD;private List<String> suggestion;public HotelDoc(Hotel hotel) {this.id = hotel.getId();this.name = hotel.getName();this.address = hotel.getAddress();this.price = hotel.getPrice();this.score = hotel.getScore();this.brand = hotel.getBrand();this.city = hotel.getCity();this.starName = hotel.getStarName();this.business = hotel.getBusiness();this.location = hotel.getLatitude() + ", " + hotel.getLongitude();this.pic = hotel.getPic();this.suggestion= Arrays.asList(this.brand,this.business);}
}

四、优化自动补全结果

因为查出来的结果如果商圈business有多个,会用、分隔,所以为了自动补全更为智能,可以做优化

        if(this.business.contains("、")||this.business.contains("/")){String[] arr ;if(this.business.contains("、"))arr= this.business.split("、");elsearr=this.business.split("/");this.suggestion=new ArrayList<>();this.suggestion.add(this.brand);Collections.addAll(this.suggestion,arr);}elsethis.suggestion= Arrays.asList(this.brand,this.business);

重新导入数据,优化成功:

RestAPI实现自动补全查询

    @Testvoid testSuggest() throws IOException {SearchRequest request = new SearchRequest("hotel");request.source().suggest(new SuggestBuilder().addSuggestion("suggestions", SuggestBuilders.completionSuggestion("suggestion").prefix("h").skipDuplicates(true).size(10)));SearchResponse response = client.search(request, RequestOptions.DEFAULT);//解析结果Suggest suggest = response.getSuggest();//根据补全查询名称,获取补全结果CompletionSuggestion suggestions = suggest.getSuggestion("suggestions");//获取optionsList<CompletionSuggestion.Entry.Option> options = suggestions.getOptions();//遍历for(CompletionSuggestion.Entry.Option option:options){String s = option.getText().toString();System.out.println(s);}}

实现搜索框自动补全

第一步:在Controller中添加如下方法

    @GetMapping("/suggestion")public List<String> getSuggestions(@RequestParam("key") String prefix){return hotelService.getSuggestion(prefix);}

第二步:在IHotelService接口中添加对应的方法并实现

    @Overridepublic List<String> getSuggestion(String prefix) {List<String> list=new ArrayList<>();try {SearchRequest request = new SearchRequest("hotel");request.source().suggest(new SuggestBuilder().addSuggestion("suggestions",SuggestBuilders.completionSuggestion("suggestion").prefix(prefix).skipDuplicates(true).size(10)));SearchResponse response = client.search(request, RequestOptions.DEFAULT);Suggest suggest = response.getSuggest();CompletionSuggestion suggestions = suggest.getSuggestion("suggestions");List<CompletionSuggestion.Entry.Option> options = suggestions.getOptions();for (CompletionSuggestion.Entry.Option option : options) {list.add(option.getText().toString());}return list;}catch(IOException e){throw new RuntimeException(e);}}

测试效果:

三、数据同步

同步方案分析

elasticsearch中的酒店数据来自于mysql数据库,因此mysql数据发生改变时,elasticsearch也必须跟着改变,这个就是elasticsearch与mysql之间的数据同步

方案一:同步调用

方案二:异步通知

方案三:监听binlog

总结:

方式一:同步调用

优点:实现简单、粗暴

缺点:业务耦合度高

方式二:异步通知

优点:低耦合,实现难度一般

缺点:依赖mq的可靠性

方式三:监听binlog

优点:完全解除服务间耦合

缺点:开启binlog增加数据库负担,实现复杂度高

利用MQ实现mysql与elasticsearch数据同步

案例:利用课前资料提供的hotel-admin项目作为酒店管理的微服务。当酒店数据发生增、删、改时,要求对elasticsearch中数据也要完成相同操作

步骤:

导入课前资料提供的hotel-admin项目,启动并测试酒店数据的CRUD

声明exchange、queue、RoutingKey

在hotel-admin中的增、删、改业务中完成消息发送

在hotel-demo中完成消息监听,并更新elasticsearch中数据

启动并测试数据同步功能

声明队列和交换机

第一步:导入依赖

        <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-amqp</artifactId></dependency>

第二步:配置rabbitmq

  rabbitmq:host: 192.168.150.101port: 5672username: itcastpassword: 123321virtual-host: /

第三步:定义常量

public class MqConstants {/** 交换机* */public final static String HOTEL_EXCHANGE="hotel.topic";/** 监听新增和修改的队列* */public final static String HOTEL_INSERT_QUEUE="hotel.insert.queue";/** 监听删除的队列* */public final static String HOTEL_DELETE_QUEUE="hotel.delete.queue";/** 新增或修改的RoutingKey* */public final static String HOTEL_INSERT_KEY="hotel.insert";/** 删除的RoutingKey* */public final static String HOTEL_DELETE_KEY="hotel.delete";}

第四步:创建消息队列并绑定到交换机上

@Configuration
public class MqConfig {@Beanpublic TopicExchange topicExchange(){return new TopicExchange(MqConstants.HOTEL_EXCHANGE,true,false);}@Beanpublic Queue insertQueue(){return new Queue(MqConstants.HOTEL_INSERT_QUEUE,true);}@Beanpublic Binding insertQueueBinding(){return BindingBuilder.bind(insertQueue()).to(topicExchange()).with(MqConstants.HOTEL_INSERT_KEY);}@Beanpublic Queue deleteQueue(){return new Queue(MqConstants.HOTEL_DELETE_QUEUE,true);}@Beanpublic Binding deleteQueueBinding(){return BindingBuilder.bind(deleteQueue()).to(topicExchange()).with(MqConstants.HOTEL_DELETE_KEY);}
}

发送mq消息

第一步:配置常量(即上一节的MqConstants)

第二步:修改controller的代码

@RestController
@RequestMapping("hotel")
public class HotelController {@Autowiredprivate IHotelService hotelService;@Autowiredprivate RabbitTemplate rabbitTemplate;@GetMapping("/{id}")public Hotel queryById(@PathVariable("id") Long id){return hotelService.getById(id);}@GetMapping("/list")public PageResult hotelList(@RequestParam(value = "page", defaultValue = "1") Integer page,@RequestParam(value = "size", defaultValue = "1") Integer size){Page<Hotel> result = hotelService.page(new Page<>(page, size));return new PageResult(result.getTotal(), result.getRecords());}@PostMappingpublic void saveHotel(@RequestBody Hotel hotel){hotelService.save(hotel);rabbitTemplate.convertAndSend(MqConstants.HOTEL_EXCHANGE,MqConstants.HOTEL_INSERT_KEY,hotel.getId());}@PutMapping()public void updateById(@RequestBody Hotel hotel){if (hotel.getId() == null) {throw new InvalidParameterException("id不能为空");}hotelService.updateById(hotel);rabbitTemplate.convertAndSend(MqConstants.HOTEL_EXCHANGE,MqConstants.HOTEL_INSERT_KEY,hotel.getId());}@DeleteMapping("/{id}")public void deleteById(@PathVariable("id") Long id) {hotelService.removeById(id);rabbitTemplate.convertAndSend(MqConstants.HOTEL_EXCHANGE,MqConstants.HOTEL_DELETE_KEY,id);}
}

监听mq消息

第一步:消费者监听队列

@Component
public class HotelListener {@Autowiredprivate IHotelService hotelService;/** 监听酒店新增或修改的业务* */@RabbitListener(queues = MqConstants.HOTEL_INSERT_QUEUE)public void listenHotelInsertOrUpdate(Long id){hotelService.insertById(id);}/** 监听酒店删除的业务* */@RabbitListener(queues = MqConstants.HOTEL_DELETE_QUEUE)public void listenHotelDelete(Long id){hotelService.deleteById(id);}}

第二步:在HotelService中编写对应的方法

    @Overridepublic void deleteById(Long id) {try {//准备RequestDeleteRequest request = new DeleteRequest("hotel", id.toString());//发送请求client.delete(request, RequestOptions.DEFAULT);}catch(IOException e){throw new RuntimeException();}}@Overridepublic void insertById(Long id) {try {//根据id查询酒店数据Hotel hotel = getById(id);//转换为文档类型HotelDoc hotelDoc = new HotelDoc(hotel);//准备request对象IndexRequest request = new IndexRequest("hotel").id(hotel.getId().toString());//准备json文档request.source(JSON.toJSONString(hotelDoc), XContentType.JSON);//发送请求client.index(request, RequestOptions.DEFAULT);}catch (IOException e){throw new RuntimeException();}}

四、elasticsearch集群

ES集群结构

单机的elasticsearch做数据存储,必然面临两个问题:海量数据存储问题、单点故障问题

搭建ES集群

我们计划利用3个docker容器模拟3个es的节点。

①es运行需要修改一些linux系统权限,修改/etc/sysctl.conf文件

vi /etc/sysctl.conf

②添加下面的内容

vm.max_map_count=262144

③通过sysctl -p使上面的配置生效

sysctl -p

运行docker-compose.yml

docker-compose up -d

docker-compose.yml完整内容:

version: '2.2'
services:es01:image: elasticsearch:7.12.1container_name: es01environment:- node.name=es01- cluster.name=es-docker-cluster- discovery.seed_hosts=es02,es03- cluster.initial_master_nodes=es01,es02,es03- "ES_JAVA_OPTS=-Xms512m -Xmx512m"volumes:- data01:/usr/share/elasticsearch/dataports:- 9200:9200networks:- elastices02:image: elasticsearch:7.12.1container_name: es02environment:- node.name=es02- cluster.name=es-docker-cluster- discovery.seed_hosts=es01,es03- cluster.initial_master_nodes=es01,es02,es03- "ES_JAVA_OPTS=-Xms512m -Xmx512m"volumes:- data02:/usr/share/elasticsearch/dataports:- 9201:9200networks:- elastices03:image: elasticsearch:7.12.1container_name: es03environment:- node.name=es03- cluster.name=es-docker-cluster- discovery.seed_hosts=es01,es02- cluster.initial_master_nodes=es01,es02,es03

集群状态监控:

kibana可以监控es集群,不过新版本需要依赖es的x-pack功能,配置比较复杂

这里推荐使用cerebro来监控es集群状态

找到bin目录,双击cerebro.bat即可运行

进入cerebro管理界面,可以任意输入一个你想管理的地址,比如http://192.168.150.101:9200

绿色的条代表集群很健康:

分片备份(more-->create index)

实线的方框是主分片,虚线的方框是备份分配

集群职责及脑裂

elasticsearch中集群节点有不同的职责划分:

elasticsearch的每个节点角色都有自己不同的职责,因此建议集群部署时,每个节点都有独立的角色

es集群的脑裂:默认情况下,每个结点都是master eligible节点,因此一旦master节点宕机,其他候选节点会选举一个成为主节点。当主节点与其他节点网络故障时,可能发生脑裂问题。

为了避免脑裂,需要要求选票(eligible节点数量+1)/ 2,才能当选为主,因此eligible节点数量最好是奇数。对应配置项是discovery.zen.minimum_master_nodes,在es7.0以后,已经成为默认配置,因此一般不会发生脑裂问题

总结:

分布式新增和查询流程

当新增文档时,应该保存到不同分片,保证数据均衡,那么coordinating node如何确定数据该存储到那个分片呢?

在9200端口插入三条数据:

可以发现,任意三个端口之一都能查到这三条数据:

通过explain命令查看数据到底存储在哪个分片:

{"explain":true,"query":{"match_all":{}}
}

查询结果:

        "hits": [{"_shard": "[itcast][1]","_node": "vf7qm8YERz2UgcLwCpSX9A","_index": "itcast","_type": "_doc","_id": "2","_score": 1.0,"_source": {"title": "试着插入一条 id = 2"},"_explanation": {"value": 1.0,"description": "*:*","details": []}},{"_shard": "[itcast][1]","_node": "vf7qm8YERz2UgcLwCpSX9A","_index": "itcast","_type": "_doc","_id": "3","_score": 1.0,"_source": {"title": "试着插入一条 id = 3"},"_explanation": {"value": 1.0,"description": "*:*","details": []}},{"_shard": "[itcast][2]","_node": "C6sNM5bbT2arRKIrOos8iA","_index": "itcast","_type": "_doc","_id": "1","_score": 1.0,"_source": {"title": "试着插入一条 id = 1"},"_explanation": {"value": 1.0,"description": "*:*","details": []}}]    

可以看到虽然是向9200存数据,但是数据会存到不同分片上。

原理如下:

新增文档流程:

总结:

分布式新增如何确定分片?

coordinating node 根据id做hash运算,得到结果对shard数量取余,余数就是对应的分片

分布式查询:

分散阶段:coordinating node将查询请求分发给不同分片

收集阶段:将查询结果汇总到coordinating node,整理并返回给用户

故障转移

集群的master节点会监控集群中的节点状态,如果发现有节点宕机,会立即将宕机节点的分片数据迁移到其他节点,确保数据安全,这个叫做故障转移

演示:

停掉主节点

[root@Soft soft]# docker-compose stop es02

此时集群状态不健康:

短暂等待后可以发现故障节点的数据成功迁移到健康的节点了:

再次查询,数据没有丢失:

重新开启es02

[root@Soft soft]# docker-compose start es02

数据又会从健康分片上转移到es02

总结:


至此,springcloud的基础篇完结,恭喜大家通关~❀

黑马程序员---微服务笔记【实用篇】相关推荐

  1. #华为云·寻找黑马程序员#微服务-你真的懂 Yaml 吗?

    在Java 的世界里,配置的事情都交给了 Properties,要追溯起来这个模块还是从古老的JDK1.0 就开始了的. "天哪,这可是20年前的东西了,我居然还在用 Properties. ...

  2. 黑马程序员Maven学习笔记

    前言 这里是黑马程序员Maven学习笔记分享,这是视频链接. 我还有其它前端内容的笔记,有需要可以查看. 文章目录 前言 基础 Maven简介 Maven是什么 Maven的作用 Maven的下载 M ...

  3. 黑马程序员C++学习笔记<第一阶段_基础篇>

    配套视频网址: 黑马程序员:http://yun.itheima.com/course/520.html?bili B站:https://www.bilibili.com/video/BV1et411 ...

  4. 黑马程序员Javaweb学习笔记01

    该博客主要记录在学习黑马程序员Javaweb过程的一些笔记,方便复习以及加强记忆 文章目录 一 . BS架构,HTTP协议 http请求数据格式和相应数据格式 二 . web服务器 2.1 tomca ...

  5. 黑马程序员 飞机大战 笔记 上

    飞机大战 前言 近来,受到朋友嘱托,做一款简单的小游戏,本小白很久没有碰过这方面的东西了,想知新还需温故,便书写此篇博客,本人只是利用博客记录自己的学习经历,水平较低. 很久之前,曾在b站观看黑马程序 ...

  6. 黑马程序员C++学习笔记(第三阶段核心:STL)--- 更新中

    目录 迭代器 序列式容器 vector -- 可随机访问 list -- 不支持随机访问 deque -- 动态 关联式容器 -- 红黑树 map multimap set multiset -- 废 ...

  7. 黑马程序员Javaweb学习笔记02【request和response】

    该博客主要记录在学习黑马程序员Javaweb过程的一些笔记,方便复习以及加强记忆

  8. 黑马程序员SSM-MyBatisPlus学习笔记

    目录 一.MyBatisPlus简介 1.1 SpringBoot整合MyBatisPlus入门程序 1.2 MyBatisPlus概述 二.标准数据层开发 2.1 标准数据层CRUD功能 2.2 分 ...

  9. 黑马程序员Java Swing笔记分享(AWT篇)

    Swing 类库结构(这边建议边学边看这个图片就可以建立一定的思维导图) Swing 组件都采用 MVC(Model-View-Controller,即模型-视图-控制器)的设计,实现 GUI 组件的 ...

最新文章

  1. OpenCV-Python:K值聚类
  2. Google X的机器人开始打工!进咖啡馆擦桌子:擦的很慢,但我们一直在做
  3. nyist---组队赛(三)
  4. golang文件操作:打开关闭文件,带缓冲区的读文件
  5. Python 进程与线程小随笔
  6. SpringBoot中AOP实现落地——Filter(过滤器)、Intercepter(拦截器)、Aspect(Spring AOP)
  7. 元素之和最接近 0 的区间(部分和)
  8. 启用了文件索引,干脆连文件都找不到了
  9. 为什么烂软件大行其道而好软件无人问津?
  10. 【代码优化】方法签名及参数检查
  11. redis打开外网访问端口
  12. C#中使用SHFileOperation调用Windows的复制文件对话框
  13. 关于我的 “二进制部署 kubernetes 集群” 的体验
  14. 第三届上海市大学生网络安全大赛 流量分析
  15. 如何使浏览器打开时,默认的文档模式就是标准模式
  16. Token的组成部分
  17. 今天是一位朋友的生日,送给她最美丽的祝福.
  18. c++语言解一元二次方程,C++ 求解一元二次方程
  19. 元数据管理系统解决方案及产品调研-数仓系列(一)
  20. 经常困倦、乏力、失眠,其实是慢性疲劳综合征

热门文章

  1. 抱薪者说 | 我这有个好东西,您掌掌眼?
  2. triple-gan_什么是AAA(Triple-A)电子游戏?
  3. Golang交叉编译Sqlite3踩坑记录
  4. java毕业设计springboot框架 java宠物商城系统毕业设计开题报告功能参考
  5. python统计文本文件的字数
  6. 网站推广-搜索引擎推广方法
  7. Windows下面安装和配置MySQL(5.6.20) 绿色版本
  8. 洪君:查出“张”姓学生中平均成绩大于75分的学生信息查询出每门课程的成绩都大于80的学生
  9. 荣耀智慧屏刷鸿蒙2,一文读懂荣耀智慧屏:除了鸿蒙OS,如何智慧
  10. OC中JSON解析与XML解析