当前位置 : 主页 > 编程语言 > java >

分布式链路追踪-skywalking入门体验

来源:互联网 收集:自由互联 发布时间:2023-02-04
背景 旁友,你的线上服务是不是偶尔来个超时,或者突然抖动一下,造成用户一堆反馈投诉。然后你费了九牛二虎之力,查了一圈圈代码和日志才总算定位到问题原因了。或者公司内部

背景

旁友,你的线上服务是不是偶尔来个超时,或者突然抖动一下,造成用户一堆反馈投诉。然后你费了九牛二虎之力,查了一圈圈代码和日志才总算定位到问题原因了。或者公司内部有链路追踪系统,虽然可以很轻松地通过监控判断问题出现的原因,但是对其中的逻辑完全摸不着头脑。只能上网搜索一番。

旁友,skywalking分布式链路追踪框架了解一下。

有的旁友会有疑惑,我的Spring Boot 就是一个单体应用么,不需要链路追踪?有问题直接翻日志就行了,但是即使是一个 Spring Boot 单体应用,也会和以下服务打交道:

  • 关系数据库,例如说 MySQL、PostgreSQL 等等。
  • 缓存数据库,例如说 Redis、Memcached 等等。
  • 外部三方服务,例如说微信公众号、微信支付、支付宝支付、短信平台等等

可见,仅仅一个 Spring Boot 单体应用,就已经涉及到分布在不同进程中的服务了。此时,就非常有必要用上skywalking。例如说,线上某个 接口访问非常慢,用SkyWalking 可以定位是MySQL 查询比较慢呢,还是调用的第三方服务比较慢。

而在分布式服务中,各个大厂内部系统成百上千的,链路关系更加复杂。比如你在外卖平台上的一个点击请求可能跨了内部几十个Java应用了,在这么长的链路里去排查问题,没有好使的工具怎么行呢。如图是当前分布式系统的现状,图片来源:鹰眼下的淘宝分布式调用跟踪系统介绍

分布式链路追踪-skywalking入门体验_elasticsearch

根据上图,我们设想:

1.系统中有可能每天都在增加新服务或删除旧服务,也可能进行升级,当系统出现错误,我们如何定位问题?

2.当用户请求时,响应缓慢,怎么定位问题?

3.服务可能由不同的编程语言开发,1、2 定位问题的方式,是否适合所有编程语言?

Skywalking框架

1.介绍

SkyWalking 是什么?

官方网址 ​​skywalking.apache.org/​​

skywalking是一个优秀的国产开源框架,2015年由个人吴晟(华为开发者)开源 , 2017年加入​​Apache​​孵化器。短短两年就被Apache收入麾下,实力可见一斑。

分布式系统的应用程序性能监视工具,专为微服务、云原生架构和基于容器(Docker、K8s、Mesos)架构而设计。

提供分布式追踪、服务网格遥测分析、度量聚合和可视化一体化解决方案。

代码无侵入,通信方式采用GRPC,实现方式是java探针,支持告警,JVM监控,支持全局调用统计等等

skywalking的架构参考了谷歌的Dapper框架的论文,Dapper并没有开源,只给了篇论文,感兴趣但又不喜英文文档的旁友可以看看论文的中文翻译​​Dapper,大规模分布式系统的跟踪系统​​

整体架构如下:

分布式链路追踪-skywalking入门体验_elasticsearch_02

  • Tracing Metrics Logging :负责从应用中,收集链路信息,发送给 SkyWalking OAP 服务器。目前支持 SkyWalking、Zikpin、Jaeger 等提供的 Tracing 数据信息。Java应用通常使用SkyWalking Agent 收集数据
  • SkyWalking OAP :skywalking服务端(Transport layer,Receiver cluster,Aggregator cluster)负责接收 Agent 发送的 Tracing 数据信息,然后进行分析,存储到外部存储器( Storage ),最终提供查询功能。
  • Storage option :Tracing 数据存储。目前支持 ES、H2 多种存储器。我们用ES存储即可 。
  • GUI :负责提供可视化控台,查看链路等
  • Alarm:提供告警功能,这里不展示讲

2.Docker方式搭建Skywalking环境

为了快速搭建环境,避免各种系统、配置环境不同造成踩坑的情况。我们用docker直接创建ElasticSearch、Skywalking-OAP、Skywalking-UI以及ES的管理工具Kibana。这样一套运行环境直接就能用了。话不多说,直接开干

整体架构如下:

分布式链路追踪-skywalking入门体验_docker_03

用到的工具版本号如下表:

工具

版本号

ElasticSearch

7.14.2

Kibana

7.14.2

skywalking-oap-server

9.1.0

skywalking-ui

9.1.0

其中skywalking的docker-compos.yml运行脚本可以从官方的Github上获取​​apache/skywalking/docker​​

脚本需要修改,直接参考我的就行,不懂的参数都有具体说明:

version: '3'services: elasticsearch: image: docker.elastic.co/elasticsearch/elasticsearch:7.14.2 container_name: elasticsearch ports: - 9200:9200 - 9300:9300 environment: - "cluster.name=elasticsearch" - "bootstrap.memory_lock=true" - "ES_JAVA_OPTS=-Xms256m -Xmx512m" - "discovery.type=single-node" kibana: image: docker.elastic.co/kibana/kibana:7.14.2 container_name: kibana depends_on: - elasticsearch ports: - 5601:5601 environment: # IP地址为运行电脑的IP地址,Mac上通过 ifconfig en0 命令获取 - "elasticsearch.hosts=http://192.168.1.5:9200" skywalking-oap: image: apache/skywalking-oap-server:9.1.0 container_name: skywalking-oap depends_on: - elasticsearch ports: - "11800:11800" - "12800:12800" healthcheck: test: [ "CMD-SHELL", "/skywalking/bin/swctl ch" ] interval: 30s timeout: 10s retries: 3 start_period: 10s environment: TZ: Asia/Shanghai SW_STORAGE: elasticsearch SW_STORAGE_ES_CLUSTER_NODES: elasticsearch:9200 SW_HEALTH_CHECKER: default SW_TELEMETRY: prometheus skywalking-ui: image: apache/skywalking-ui:9.1.0 container_name: skywalking-ui depends_on: - skywalking-oap links: - skywalking-oap ports: # UI界面程序占用的端口 - "8080:8080" environment: TZ: Asia/Shanghai # IP地址为运行电脑的IP地址,Mac上通过 ifconfig en0 命令获取 SW_OAP_ADDRESS: http://192.168.1.8:12800

2.1 Docker镜像加速

按上述配好docker-compose.yml文件后,命令行到所在目录下执行​​docker-compose up​​可以拉起镜像,第一次运行时会下载镜像,docker默认的镜像仓库在国外,所以下载速度和蜗牛一样慢。为了加速下载,需要配置国内的docker镜像

获取国内docker镜像库地址的方法:

  • 阿里云官方镜像加速,获取加速器地址文档:​​阿里云官方镜像加速​​
  • 网上搜索docker镜像加速,下面是测过有效的公共镜像库
    • 网易云 ​​​hub-mirror.c.163.com​​
    • 百度云 ​​​mirror.baidubce.com​​

    配置方法:

    Docker桌面版​​Preference​​ -> ​​Docker Engine​​ 在Json配置里加上,加好之后重启Docker,然后再重新拉镜像,速度立马快得飞起

    上一篇:【数据结构与算法】Collection接口&迭代器
    下一篇:没有了
    网友评论