当前位置：首页 > news >正文

分布式链路追踪概述

news 2026/4/10 11:42:00

分布式链路追踪概述

文章目录

分布式链路追踪概述
- 1.分布式链路追踪概述
- - 1.1.什么是 Tracing
  - 1.2.为什么需要Distributed Tracing
- 2.Google Dapper
- - 2.1.Dapper的分布式跟踪
  - - 2.1.1.跟踪树和span
    - 2.1.2.Annotation
    - 2.1.3.采样率
- 3.OpenTracing
- - 3.1.发展历史
  - 3.2.数据模型
- 4.java探针技术-javaAgent
- - 4.1.javaAgent概述
  - 4.2.javaAgent入门
  - - 4.2.1.主程序之前运行的Agent
    - 4.2.2.主程序之后运行的Agent
- 5 APM 工具
- - 5.1.SkyWalking概述

1.分布式链路追踪概述

随着系统设计变得日趋复杂，越来越多的组件开始走向分布式化，如微服务、分布式数据库、分布式缓存等，使得后台服务构成了一种复杂的分布式网络。往往前端的一个请求需要经过多个微服务、跨越多个数据中心才能最终获取到结果，如下图
在这里插入图片描述

并且随着业务的不断扩张，服务之间互相调用会越来越复杂，这个庞大的分布式系统调用网络可能会变的如下图所示：

在这里插入图片描述

那随之而来的就是我们将会面临的诸多困扰：

问题定位：当某一个服务节点出现问题导致整个调用失败，无法快速清晰地定位问题服务。
性能分析：服务存在相互依赖调用的关系，当某一个服务接口耗时过长，会导致整个接口调用变的很慢，我们无法明确每一个接口的耗时。
服务拓扑图：随着需求迭代，系统之间调用关系变化频繁，靠人工很难梳理清楚系统之间的调用关系。
服务告警：当服务出现问题，我们无法做到由系统自动通知相关人员。

为了解决这些问题，分布式链路追踪应运而生。它会将一次分布式请求还原成调用链路，将一次分布式请求的调用情况集中展示，比如各个服务节点上的耗时、请求具体到达哪台机器上、每个服务节点的请求状态、生成服务调用拓扑图等等。也就是说我们要设计并开发一些分布式追踪系统来帮助我们解决这些问题

1.1.什么是 Tracing

在这里插入图片描述

Wikipedia 中，对 Tracing 的定义是，在软件工程中，Tracing 指使用特定的日志记录程序的执行信息，与之相近的还有两个概念，它们分别是 Logging 和 Metrics。

Logging：用于记录离散的事件，包含程序执行到某一点或某一阶段的详细信息。
Metrics：可聚合的数据，且通常是固定类型的时序数据，包括 Counter、Gauge、Histogram 等。
Tracing：记录单个请求的处理流程，其中包括服务调用和处理时长等信息。

针对每种分析需求，我们都有非常强大的集中式分析工具。

Logging：ELK，近几年势头最猛的日志分析服务，无须多言。
Metrics：Prometheus，第二个加入 CNCF 的开源项目，非常好用。
Tracing：OpenTracing 和 Jaeger，Jaeger 是 Uber 开源的一个兼容 OpenTracing 标准的分布式追踪服务。目前 Jaeger 也加入了 CNCF。

1.2.为什么需要Distributed Tracing

微服务极大地改变了软件的开发和交付模式，单体应用被拆分为多个微服务，单个服务的复杂度大幅降低，库之间的依赖也转变为服务之间的依赖。由此带来的问题是部署的粒度变得越来越细，众多服务给运维带来巨大压力。

随着服务数量的增多和内部调用链的复杂化，仅凭借日志和性能监控很难做到 “See the Whole Picture”，在进行问题排查或是性能分析的时候，无异于盲人摸象。分布式追踪能够帮助开发者直观分析请求链路，快速定位性能瓶颈，逐渐优化服务间依赖，也有助于开发者从更宏观的角度更好地理解整个分布式系统。

分布式追踪系统的原理：

分布式追踪系统大体分为三个部分，数据采集、数据持久化、数据展示。数据采集是指在代码中埋点，设置请求中要上报的阶段，以及设置当前记录的阶段隶属于哪个上级阶段。数据持久化则是指将上报的数据落盘存储，数据展示则是前端查询与之关联的请求阶段，并在界面上呈现

在这里插入图片描述

上图是一个请求的流程例子，请求从客户端发出，到达负载均衡，再依次进行认证、计费，最后取到目标资源。

在这里插入图片描述

请求过程被采集之后，会以上图的形式呈现，横坐标是时间，圆角矩形是请求的执行的各个阶段。

2.Google Dapper

现今业界分布式链路追踪的理论基础主要来自于 Google 的一篇论文《Dapper, a Large-Scale Distributed Systems Tracing Infrastructure》

论文在线地址：https://storage.googleapis.com/pub-tools-public-publication-data/pdf/36356.pdf，已下载，可从今日课程资料中获取

国内的翻译版：https://bigbully.github.io/Dapper-translation/

在此文中阐述了Google在生产环境下对于分布式链路追踪系统Drapper的设计思路与使用经验。随后各大厂商基于这篇论文都开始自研自家的分布式链路追踪产品。如阿里的Eagle eye(鹰眼)、zipkin，京东的“Hydra”、大众点评的“CAT”、新浪的“Watchman”、唯品会的“Microscope”、窝窝网的“Tracing”都是基于这片文章的设计思路而实现的。所以要学习分布式链路追踪，对于Dapper论文的理解至关重要。

Google对于Drapper设计初衷同样也是因为其内部整个生产环境的部署非常复杂，涉及到了非常多的服务，且这些服务由不同的团队通过不同的语言进行开发，跨越多个不同的数据中心，部署在几千台服务器上，因此由其Drapper开发团队设计和实现了Google生产环境下的分布式跟踪系统。

Drapper提出了设计分布式链路追踪系统的三个目标：

低消耗：在生产环境下，服务的一点点损耗，都有可能不得不将其摘除。所以追踪系统对于服务的影响要尽可能的小。
应用级透明：对于应用的程序员来说，是不需要知道有跟踪系统这回事的。如果一个跟踪系统想生效，还必须要依赖应用的开发者主动配合，那么这个跟踪系统也太脆弱了，往往由于跟踪系统在应用中植入代码的bug或疏忽导致应用系统出了问题，那这样无法满足我们对跟踪系统“无所不在的部署”这个需求，对于当下这种快节奏的开发环境来说尤为重要。
延展性：随着我们业务的系统的变化，我们的跟踪系统需要能够支撑未来服务和集群规模的变化。

2.1.Dapper的分布式跟踪

在这里插入图片描述

图中展示的是一个和5台服务器相关的一个服务，包括：前端A，两个中间层B和C，以及两个后端D和E。当一个用户（这个用例的发起人）发起一个请求时，首先到达前端，然后发送两个RPC到服务器B和C。B会马上做出反应，但是C需要和后端的D和E交互之后再返还给A，由A来响应最初的请求，在这个过程中我们可以使用一个跟踪标识符（message identifiers）和时间戳（timestamped events）来记录服务器上每一次发送和接收动作，这其实是一个简易的分布式跟踪实现。

如果要实现一个最简单的分布式跟踪，现在有两种解决方案，黑盒(black-box)和基于标注(annotation-based)的监控方案

黑盒方案：假定需要跟踪的除了上述信息之外没有额外的信息，这样我们可以使用统计回归技术来推断两者之间的关系

基于标注的方案：依赖于应用程序或中间件明确地标记一个全局ID，从而连接每一条记录和发起者的请求

虽然黑盒方案比标注方案更轻便，但却需要更多的数据，以获得足够的精度，因为他们依赖于统计推论。基于标注的方案最主要的缺点是很明显的，需要代码植入。在我们的生产环境中，因为所有的应用程序都使用相同的线程模型，控制流和RPC系统，我们发现，可以把代码植入限制在一个很小的通用组件库中，从而实现了监测系统的应用对开发人员是有效地透明。

因此Dapper的跟踪架构像是内嵌在RPC调用的树形结构，从形式上看，Dapper跟踪模型使用的树形结构，Span以及Annotation。

2.1.1.跟踪树和span

一个请求到达应用后所调用的所有服务组成的调用链就像一个树结构（如下图），就是我们所说的跟踪树（我们也可以叫做trace，每一个Trace都会生成一个唯一的trace-id）

在这里插入图片描述

在一次Trace中，每个服务的每一次调用，就是一个基本工作单元，就像上图中的每一个树节点，称之为span

每一个span都有一个唯一id作为唯一标识，我们称为span-id，另外每个span中通过一个parentId标明本次调用的发起者（就是发起者的span-id）

下图也说明了span在一个大的跟踪过程中是什么样的，Dapper记录了span名称，以及每个span的ID和父ID，用以构建在一次追踪过程中不同span之间的关系。如果一个span没有父ID被称为root span。所有span都挂在一个特定的跟踪树上，也共用一个跟踪id（trace-id，在图中未示出）。所有这些ID用全局唯一的64位整数标示。

在这里插入图片描述

图中的span记录了两个名为“Helper.Call”的RPC(分别为server端和client端)。span的开始时间和结束时，如果应用程序开发者选择在跟踪中增加他们自己的注释（如图中“foo”的注释）(业务数据)，这些信息也会和其他span信息一样记录下来。

2.1.2.Annotation

Dapper允许应用程序开发人员在Dapper跟踪的过程中添加额外的信息，以监控更高级别的系统行为，或帮助调试问题。我们允许用户（应用程序开发人员）通过一个简单的API定义带时间戳的Annotation，核心的示例代码如下图

在这里插入图片描述

这些Annotation可以添加任意内容。为了保护Dapper的用户意外的过分热衷于日志的记录，每一个跟踪span有一个可配置的总Annotation量的上限，除了简单的文本Annotation，Dapper也支持的key-value映射的 Annotation，提供给开发人员更强的跟踪能力，如持续的计数器，二进制消息记录和在一个进程上跑着的任意的用户数据。

2.1.3.采样率

低损耗是Dapper的一个关键的设计目标，如果这个工具的价值未被证实但又对性能有影响的话，你就可以理解服务运营人员为什么不愿意部署它。况且，我们还希望让开发人员使用Annotation的API，而不用担心额外的开销。另外我们还发现，某些类型的Web服务对植入带来的性能损耗确实非常敏感。因此，除了把Dapper的收集工作对基本组件的性能损耗限制的尽可能小之外，我们还有进一步控制损耗的办法，那就是遇到大量请求时只记录其中的一小部分。

另外下图展示的是一Dapper数据采样的一个流程

在这里插入图片描述

生产环境的集群机器信息所产生的span数据首先写入本地日志文件中。接着Dapper的守护进程和收集组件把这些数据从生产环境的主机中拉出来。并最终写到Dapper的Bigtable数据仓库中，一次跟踪被设计成Bigtable中的一行，每一列相当于一个span。

在生产环境下，对跟踪数据处理中，这个守护进程从来没有超过0.3%的单核cpu使用率，而且只有很少量的内存使用（以及堆碎片的噪音）。我们还限制了Dapper守护进程为内核scheduler最低的优先级，以防在一台高负载的服务器上发生cpu竞争。

Dapper的第一个生产版本在Google内部的所有进程上使用统一的采样率，为1/1024。这个简单的方案是对我们的高吞吐量的线上服务来说是非常有用，因为那些感兴趣的事件(在大吞吐量的情况下)仍然很有可能经常出现，并且通常足以被捕捉到。

然而，在较低的采样率和较低的传输负载下可能会导致错过重要事件，而想用较高的采样率就需要能接受的性能损耗。对于这样的系统的解决方案就是覆盖默认的采样率，这需要手动干预的。

我们在部署可变采样的过程中，参数化配置采样率时，不是使用一个统一的采样方案，而是使用一个采样期望率来标识单位时间内采样的追踪。这样一来，低流量低负载自动提高采样率，而在高流量高负载的情况下会降低采样率，使损耗一直保持在控制之下。实际使用的采样率会随着跟踪本身记录下来，这有利于从Dapper的跟踪数据中准确的分析。

Dapper的救火能力

对于一些“救火”任务，Dapper可以处理其中的一部分。“救火”任务在这里是指在分布式系统上一些风险很高的操作，对于那些高延迟，或者可能更糟糕的在正常负载下都会响应超时的服务，Dapper通常会把这些延迟瓶颈的位置隔离出来。通过与Dapper守护进程的直接通信，那些特定的高延迟的跟踪数据轻易的收集到。当出现灾难性故障时，通常是没有必要去看统计数据以确定根本原因，只查看示例跟踪就足够了(因为前文提到过从Dapper守护进程中几乎可以立即获得跟踪数据)。

3.OpenTracing

OpenTracing 于 2016 年 10 月加入 CNCF 基金会，是继 Kubernetes 和 Prometheus 之后，第三个加入 CNCF 的开源项目。它是一个中立的（厂商无关、平台无关）分布式追踪的 API 规范，提供统一接口，可方便开发者在自己的服务中集成一种或多种分布式追踪的实现。

3.1.发展历史

早在 2005 年，Google 就在内部部署了一套分布式追踪系统 Dapper，并发表了一篇论文《Dapper, a Large-Scale Distributed Systems Tracing Infrastructure》，阐述了该分布式追踪系统的设计和实现，可以视为分布式追踪领域的鼻祖。随后出现了受此启发的开源实现，如 Zipkin、SourceGraph 开源的 Appdash、Red Hat 的 Hawkular APM、Uber 开源的 Jaeger 等。但各家的分布式追踪方案是互不兼容的，这才诞生了 OpenTracing。OpenTracing 是一个 Library，定义了一套通用的数据上报接口，要求各个分布式追踪系统都来实现这套接口。这样一来，应用程序只需要对接 OpenTracing，而无需关心后端采用的到底什么分布式追踪系统，因此开发者可以无缝切换分布式追踪系统，也使得在通用代码库增加对分布式追踪的支持成为可能。
在这里插入图片描述

目前，主流的分布式追踪实现基本都已经支持 OpenTracing。

3.2.数据模型

这部分在 OpenTracing 的规范中写的非常清楚，下面只大概翻译一下其中的关键部分，细节可参考原始文档《The OpenTracing Semantic Specification》。

Causal relationships between Spans in a single Trace
解释了Trace 和 Span的因果关系[Span A]  ←←←(the root span)|+------+------+|             |[Span B]      [Span C] ←←←(Span C is a `ChildOf` Span A)|             |[Span D]      +---+-------+|           |[Span E]    [Span F] >>> [Span G] >>> [Span H]↑↑↑(Span G `FollowsFrom` Span F)

Trace ：调用链，每个调用链由多个 Span 组成（可类比为咱们之前所说的跟踪树）。

Span ：可以理解为某个处理阶段。Span 和 Span 的关系称为 Reference。上图中，总共有标号为 A-H 的 8 个阶段（每一次的调用就是一个处理阶段）。

如果按时间关系呈现调用链如下：

––|–––––––|–––––––|–––––––|–––––––|–––––––|–––––––|–––––––|–> time[Span A···················································][Span B··············································][Span D··········································][Span C········································][Span E·······]        [Span F··] [Span G··] [Span H··]

每个Span包含如下状态：

操作名称
起始时间
结束时间
一组 KV 值，作为阶段的标签（Span Tags）
阶段日志（Span Logs）
阶段上下文（SpanContext），其中包含 Trace ID 和 Span ID
引用关系（References）

Span可以有 ChildOf 和 FollowsFrom 两种引用关系。ChildOf 用于表示父子关系，即在某个阶段中发生了另一个阶段，是最常见的阶段关系，典型的场景如调用 RPC 接口、执行 SQL、写数据。FollowsFrom 表示跟随关系，意为在某个阶段之后发生了另一个阶段，用来描述顺序执行关系。

脱离分布式追踪系统单独讲 OpenTracing 的使用方法的话，意义不大，后文我们会以实际的实现为主来进行讲解。

4.java探针技术-javaAgent

4.1.javaAgent概述

Java Agent这个技术对大多数人来说都比较陌生，但是大家都都多多少少接触过一些，实际上我们平时用过的很多工具都是基于java Agent来实现的，例如：热部署工具JRebel，springboot的热部署插件，各种线上诊断工具（btrace, greys），阿里开源的arthas等等。

其实java Agent在JDK1.5以后，我们可以使用agent技术构建一个独立于应用程序的代理程序（即Agent），用来协助监测、运行甚至替换其他JVM上的程序。使用它可以实现虚拟机级别的AOP功能，并且这种方式一个典型的优势就是无代码侵入。

Agent分为两种，一种是在主程序之前运行的Agent，一种是在主程序之后运行的Agent（前者的升级版，1.6以后提供）。

4.2.javaAgent入门

4.2.1.主程序之前运行的Agent

在实际使用过程中，javaagent是java命令的一个参数。通过java 命令启动我们的应用程序的时候，可通过参数 -javaagent 指定一个 jar 包（也就是我们的代理agent），能够实现在我们应用程序的主程序运行之前来执行我们指定jar包中的特定方法，在该方法中我们能够实现动态增强Class等相关功能，并且该 jar包有2个要求：

这个 jar 包的 META-INF/MANIFEST.MF 文件必须指定 Premain-Class 项，该选项指定的是一个类的全路径
Premain-Class 指定的那个类必须实现 premain() 方法。

从字面上理解，Premain-Class 就是运行在 main 函数之前的的类。当Java 虚拟机启动时，在执行 main 函数之前，JVM 会先运行-javaagent所指定 jar 包内 Premain-Class 这个类的 premain 方法。

我们可以通过在命令行输入java看到相应的参数，其中就有和java agent相关的
在这里插入图片描述

该包提供了一些工具帮助开发人员在 Java 程序运行时，动态修改系统中的 Class 类型。其中，使用该软件包的一个关键组件就是 Javaagent，如果从本质上来讲，Java Agent 是一个遵循一组严格约定的常规 Java 类。上面说到 javaagent命令要求指定的类中必须要有premain()方法，并且对premain方法的签名也有要求，签名必须满足以下两种格式：

public static void premain(String agentArgs, Instrumentation inst)public static void premain(String agentArgs)

JVM 会优先加载带 Instrumentation 签名的方法，加载成功忽略第二种，如果第一种没有，则加载第二种方法

下面我们来编写一个入门demo：

1：首先编写一个agent程序，创建一个agent项目agentdemo，使用maven进行构建，

2：添加pom相关配置

<packaging>jar</packaging>
<properties><java.version>1.8</java.version>
</properties><build><plugins><plugin><groupId>org.apache.maven.plugins</groupId><artifactId>maven-jar-plugin</artifactId><version>3.1.2</version></plugin></plugins>
</build>

3：编写一个类：com.heima.TestPreMainAgent，且必须具备premain方法的实现

/*** Created by 传智播客*黑马程序员.*/
public class TestPreMainAgent {public static void premain(String agentArgs, Instrumentation inst) {System.out.println("premain running");}
}

4：在src/main/resources目录下创建一个目录：META-INF，在该目录下创建一个文件：MANIFEST.MF

Manifest-Version: 1.0
Can-Redefine-Classes: true
Can-Retransform-Classes: true
Premain-Class: com.heima.TestPreMainAgent

注意：最后需要多一行空行

Can-Redefine-Classes ：true表示能重定义此代理所需的类，默认值为 false（可选）

Can-Retransform-Classes ：true 表示能重转换此代理所需的类，默认值为 false （可选）

Premain-Class ：包含 premain 方法的类（类的全路径名）

MANIFEST.MF文件这里如果不手动指定的话，直接打包，默认会在打包的文件中生成一个MANIFEST.MF文件：比如一个springboot工程打包后生成的MANIFEST.MF文件如下

Manifest-Version: 1.0
Build-Jdk-Spec: 1.8
Created-By: Maven Archiver 3.4.0

包含当前的一些版本信息，当前工程的启动类等相关信息。

因此这个地方一定要注意，一般我们通过一些工具去打包的话默认会把我们自己MANIFEST.MF文件被默认配置替换掉了，可能需要自己手动将自己的MANIFEST.MF替换到jar包中

因此我们可以使用maven插件去生成所需要的MANIFEST.MF，从而不需要自己手动编写MANIFEST.MF

<build><finalName>agentdemo</finalName><plugins><plugin><groupId>org.apache.maven.plugins</groupId><artifactId>maven-jar-plugin</artifactId><version>3.1.2</version><configuration><archive><!--自动添加META-INF/MANIFEST.MF --><manifest><addClasspath>true</addClasspath></manifest><manifestEntries><Premain-Class>com.xxx.TestPreMainAgent</Premain-Class><Can-Redefine-Classes>true</Can-Redefine-Classes><Can-Retransform-Classes>true</Can-Retransform-Classes></manifestEntries></archive></configuration></plugin></plugins>
</build>

5：使用maven的package对项目进行打包，然后把打出来的jar包拷贝到D盘data目录下，并且重新改名为：agentdemo.jar，去掉版本号，主要是为了方便。

6：创建一个新的项目：agent-app，作为自己的应用，编写一个类：com.heima.AgentApp

public class AgentApp {public static void main(String[] args) {System.out.println("main running...");}
}

7：现在要添加启动参数让我们的主程序运行之前先执行agentdemo中TestPreMainAgent类的premain方法

如果是在idea中可以配置运行环境如下图所示：

在这里插入图片描述

-javaagent:d:/data/agentdemo.jar

然后运行我们的主程序，在控制台查看输出结果如下：

在这里插入图片描述

8：如果我们不直接在idea中启动我们的应用程序，而是将我们的程序打成jar包启动，那我们首先需要在agent-app的pom文件中添加相关的插件

<packaging>jar</packaging>
<build><plugins><plugin><groupId>org.apache.maven.plugins</groupId><artifactId>maven-jar-plugin</artifactId><version>3.1.2</version><configuration><archive><!--自动添加META-INF/MANIFEST.MF --><manifest><addClasspath>true</addClasspath></manifest><manifestEntries><Main-Class>com.xxx.AgentApp</Main-Class></manifestEntries></archive></configuration></plugin></plugins>
</build>

9：使用maven的package对项目进行打包，然后把打出来的jar包拷贝带D盘下，然后打开cmd，输入命令

java -javaagent:d:/data/agentdemo.jar -jar agent-app-1.0-SNAPSHOT.jar

运行如下
在这里插入图片描述

总结：

这种agent JVM 会先执行 premain 方法，大部分类加载都会通过该方法，注意：是大部分，不是所有。当然，遗漏的主要是系统类，因为很多系统类先于 agent 执行，而用户类的加载肯定是会被拦截的。也就是说，这个方法是在 main 方法启动前拦截大部分类的加载活动，既然可以拦截类的加载，那么就可以去做重写类这样的操作，结合第三方的字节码编译工具，比如ASM，javassist，cglib等等来改写实现类。

4.2.2.主程序之后运行的Agent

上面介绍的是在 JDK 1.5中提供的，开发者只能在main加载之前添加手脚，在 Java SE 6 中提供了一个新的代理操作方法：agentmain，可以在 main 函数开始运行之后再运行。

跟premain函数一样，开发者可以编写一个含有agentmain函数的 Java 类，具备以下之一的方法即可

public static void agentmain (String agentArgs, Instrumentation inst)public static void agentmain (String agentArgs)

同样需要在MANIFEST.MF文件里面设置“Agent-Class”来指定包含 agentmain 函数的类的全路径。

1：在agentdemo中创建一个新的类：com.itheima.TestAgentClass，并编写方法agenmain

import java.lang.instrument.Instrumentation;
public class TestAgentClass {public static void agentmain (String agentArgs, Instrumentation inst){System.out.println("agentmain running");}
}

2：在pom.xml中添加配置如下

<plugin><groupId>org.apache.maven.plugins</groupId><artifactId>maven-jar-plugin</artifactId><version>3.1.0</version><configuration><archive><!--自动添加META-INF/MANIFEST.MF --><manifest><addClasspath>true</addClasspath></manifest><manifestEntries><Premain-Class>com.xxx.TestPreMainAgent</Premain-Class><!--添加这个即可--><Agent-Class>com.xxx.TestAgentClass</Agent-Class><Can-Redefine-Classes>true</Can-Redefine-Classes><Can-Retransform-Classes>true</Can-Retransform-Classes></manifestEntries></archive></configuration>
</plugin>

3：使用maven的package命令对agentdemo项目打包，然后复制打好的包到D盘，重命名为agentdemo.jar（删除之前的即可）

4：找到agent-app中的AgentApp，修改如下：

public class AgentApp {public static void main(String[] args) throws IOException, AttachNotSupportedException, AgentLoadException, AgentInitializationException {System.out.println("main running...");//获取当前系统中所有 运行中的 虚拟机List<VirtualMachineDescriptor> list = VirtualMachine.list();for (VirtualMachineDescriptor vm : list) {if (vm.displayName().endsWith("com.xxx.AgentApp")) {VirtualMachine virtualMachine = VirtualMachine.attach(vm.id());virtualMachine.loadAgent("D:/data/agentdemo.jar");virtualMachine.detach();}}}
}

list()方法会去寻找当前系统中所有运行着的JVM进程，可以打印vmd.displayName()看到当前系统都有哪些JVM进程在运行。因为main函数执行起来的时候进程名为当前类名，所以通过这种方式可以去找到当前的进程id。

注意：在mac上安装了的jdk是能直接找到 VirtualMachine 类的，但是在windows中安装的jdk无法找到，如果你遇到这种情况，请手动将你jdk安装目录下：lib目录中的tools.jar添加进当前工程的Libraries中。

之所以要这样写是因为：agent要在主程序运行后加载，我们不可能在主程序中编写加载的代码，只能另写程序，那么另写程序如何与主程序进行通信？这里用到的机制就是attach机制，它可以将JVM A连接至JVM B，并发送指令给JVM B执行。

然后运行，结果如下图所示：

在这里插入图片描述

总结：

以上就是Java Agent的俩个简单例子，Java Agent十分强大，它能做到的不仅仅是打印几个监控数值而已，还包括使用Transformer等高级功能进行类替换，方法修改等，要使用Instrumentation的相关API则需要对字节码等技术有较深的认识。

5 APM 工具

5.1.SkyWalking概述

目前主流的一些 APM 工具有: Cat、Zipkin、Pinpoint、SkyWalking

在这里插入图片描述

Cat: 大众点评开源的基于编码和配置的调用链分析，应用监控分析，日志采集，监控报警等一系列的监控平台工具。
Zipkin：Twitter开源的调用链分析工具，目前基于springcloud sleuth得到了广泛的使用，特点是轻量，使用部署简单
Pinpoint：韩国人开源的基于字节码注入的调用链分析，以及应用监控分析工具。特点是支持多种插件，UI功能强大，接入端无代码侵入。
Skywalking：国产的优秀APM组件，是一个基于字节码注入的调用链分析，对JAVA分布式应用程序集群的业务运行情况进行追踪、告警和分析的系统。特点是支持多种插件，UI功能较强，接入端无代码侵入。目前已加入Apache孵化器。

其中，Cat和Zipkin对代码均具有侵入性：Cat需要修改代码集成API，Zipkin需要修改项目配置增加拦截器。

下篇文章详细介绍 SkyWalking ，它是一款优秀的国产 APM 工具，包括了分布式追踪、性能指标分析、应用和服务依赖分析等。

Skywalking相比较其他的分布式链路监控工具，具有以下特点：
- 社区相当活跃。Skywalking已经进入apache基金，目前在GitHub的star数已突破20k，开发者是国人。
- 探针无倾入性。对比CAT具有倾入性的探针，优势较大。不修改原有项目一行代码就可以进行集成。
- 探针性能优秀。有网友对Pinpoint和Skywalking进行过测试，由于Pinpoint收集的数据过多，所以对性能损耗较大，而Skywalking探针性能十分出色。
- 功能对比zipkin比较丰富，skywalking支持性能指标分析、告警等功能，zipkin主要支持链路追踪，对其他功能的支持不是十分出色
Zabbix、Premetheus等监控系统主要关注服务器硬件指标与系统服务运行状态等，而APM系统则更重视程序内部执行过程指标和服务之间链路调用情况的监控，APM更有利于深入代码找到请求响应“慢”的根本问题，与Zabbix之类的监控是互补关系。

分布式链路追踪概述

分布式链路追踪概述文章目录分布式链路追踪概述1.分布式链路追踪概述1.1.什么是 Tracing1.2.为什么需要Distributed Tracing 2.Google Dapper2.1.Dapper的分布式跟踪2.1.1.跟踪树和span2.1.2.Annotation2.1.3.采样率 3.OpenTracing3.1.发展历史3.2.数据模型 4.java探针技术-j…...

编程日记 2023/8/11 5:20:56

css中的var函数

css中的var函数假设我们在css文件存在多个相同颜色值，当css文件越来越大的时候，想要改颜色就要手动在每个旧颜色上修改，这样维护工作非常难进行。但是我们可以使用变量来存储值，这样可以在整个css样式表中重复使用&#xff0c…...

编程日记 2023/8/11 5:19:55

第五次作业运维高级构建 LVS-DR 集群和配置nginx负载均衡

1、基于 CentOS 7 构建 LVS-DR 群集。 LVS-DR模式工作原理首先，来自客户端计算机CIP的请求被发送到Director的VIP。然后Director使用相同的VIP目的IP地址将请求发送到集群节点或真实服务器。然后，集群某个节点将回复该数据包，并将该数据包…...

编程日记 2023/8/11 5:18:54

neo4j电影库-关系查询

关系类型数量源数据目标数据属性ACTED_IN172演员电影roles（角色扮演）属性，属性值为数组DIRECTED44导演电影无PRODUCED15制片商电影无WROTE10作家电影无FOLLOWS3影评人影评人无REVIEWED9影评人电影summary（影评摘要）和 …...

编程日记 2023/8/11 5:17:52

2020/10-2023/7 Notes

2020/10-2023/7 Notes 1.Unity WebGL 字体动态字体 2.Path.Combine 3.播放Unity WebGL构建包 Vistual Studio Code->Extensions->Live Server 4.Cloud Compare laszip.net RenderDoc Mike Zero Ras Mapper HDF Viewer 5.使Unity支持GLSL Project->添加命令行参数-&g…...

编程日记 2023/8/11 5:16:51

在UOS系统中管理ORACLE数据库

在明确了“数字中国”建设战略后。自主创新与国产化已成为我国实现科技强国、经济强国的发展趋势与行业共识。即信息技术应用创新产业，简称“信创”。而现有的国产操作系统，虽然已日趋成熟，但因为很多应用软件由国外垄断，因此…...

编程日记 2023/8/11 5:15:50

以http_proxy和ajp_proxy方式整合apache和tomcat（动静分离）

注意：http_proxy和ajp_proxy的稳定性不如mod_jk 一.http_proxy方式 1.下载mod_proxy_html.x86_64 2.在apache下创建http_proxy.conf文件（或者直接写到conf/httpd.conf文件最后） 3.查看server.xml文件到tomcat的安装目录下的conf/serve…...

编程日记 2023/8/11 5:14:49

【pinia】Pinia入门和基本使用：

文章目录一、什么是pinia二、创建空Vue项目并安装Pinia1. 创建空Vue项目2. 安装Pinia并注册三、实现counter四、实现getters五、异步action六、 storeToRefs保持响应式解构七、基本使用：【1】main.js【2】store》index.js【3】member.ts 一、什么是pinia P…...

编程日记 2023/8/11 5:13:48

Linux 文件系统（一）系统目录

系统目录基本概念分区划分目录划分基本概念虽然Linux有很多不同的发行版，但是其基本目录结构都是类似的，因此只要了解一个发行版基本足矣。分区划分系统默认大致有以下几种分区 /（根目录）：该分区包含了操作系…...

编程日记 2023/8/11 5:12:47

『CV学习笔记』Opencv和PIL Image以及base64编码互相转化

Opencv和PIL Image以及base64编码互相转化文章目录一. opencv&PIL.Image&Skimage1.1. opencv-python读取透明图片(带alpha通道)1.2. opencv、PIL.Image、Skimage读取的彩色图片维度区别1.3. opencv、PIL.Image转换二. base64和cv2 imge互相转换三. base64和PIL imge互…...

编程日记 2023/8/11 5:11:45

行业追踪，2023-08-07

自动复盘 2023-08-07 凡所有相，皆是虚妄。若见诸相非相，即见如来。 k 线图是最好的老师，每天持续发布板块的rps排名，追踪板块，板块来开仓，板块去清仓，丢弃自以为是的想法，板块去留让…...

编程日记 2023/8/11 5:10:43

CSRF 攻击和 XSS 攻击分别代表什么？如何防范？

一：PHP 1. CSRF 攻击和 XSS 攻击分别代表什么？ 1.CSRF攻击 1.概念： CSRF（Cross-site request forgery）跨站请求伪造，用户通过跨站请求，以合法身份做非法的事情 2.原理： 1.登录受信任…...

编程日记 2023/8/11 5:09:41

RabbitMQ: 详解、使用教程和示例

RabbitMQ: 详解、使用教程和示例什么是 RabbitMQ？ RabbitMQ 是一个开源的消息代理（Message Broker）软件，它实现了高级消息队列协议（AMQP），用于在应用程序之间进行异步消息传递。它允许应用程…...

编程日记 2023/8/11 5:08:39

redis NOAUTH Authentication required 可能不是密码问题

开发环境 springboot 2.4.3 spring-boot-starter-data-redis 2.4.3 redis 4.0 lettuce 6.0.2 背景多环境（test，pre，prd）部署，在测试环境测试通过之后部署预发环境的时候，服务一直报错，提示【i…...

编程日记 2023/8/11 5:07:38

动态规划解0-1背包问题（超详细理解）

前言： 好久没写0-1背包问题了，都有些不记得了，写这篇文章给自己以后做简单参考，如果能同时帮到读者，不胜荣幸。正文 0-1背包问题是这样的一个问题，假设有一个背包，其容量为 capacity 。在地…...

编程日记 2023/8/11 5:06:38

有哪些可能引起前端安全的问题?

跨站脚本 (Cross-Site Scripting, XSS) ⼀种代码注⼊⽅式,为了与 CSS 区分所以被称作 XSS。早期常⻅于⽹络论坛, 起因是⽹站没有对⽤户的输⼊进⾏严格的限制, 使得攻击者可以将脚本上传到帖⼦让其他⼈浏览到有恶意脚本的⻚⾯, 其注⼊⽅式很简单包括但不限于 JavaScript / CSS …...

编程日记 2023/8/11 5:05:36

【Unity实战100例】用户头像圆形遮罩使用Shader不用Mask组件

目录一.创建材质二.创建Shader文件编写Shader代码三.Image材质设置源码：https://download.csdn.net/download/qq_37310110/88196529 前言：我们在使用Unity的自带组件Mask的时候会出现毛边现象很难处理掉，这里我们使用着色器shader来进行处理就不会出现毛边现象。...

编程日记 2023/8/11 5:04:35

arm-linux-gnueabihf-g++ gcc编译、优化命令汇总

gcc优化选项，可在编译时间，目标文件长度，执行效率三个维度，进行不同的取舍和平衡。 gcc 常用编译选项 arm-linux-gnueabihf-g -O3 -marcharmv7-a -mcpucortex-a9 -ftree-vectorize -mfpuneon -mfpuvfpv3-fp16 -mfloat-abihard -…...

编程日记 2023/8/11 5:03:34

vmwera中安装的centos8出现ifconfig不可用

刚刚在虚拟机中装好centos结果发现自己的ifconfig命令不可用。看一下环境变量里有没有ifconfig命令的路径，因为ifconfig是在/sbin路径下的，root用户登录进去才可以运行，先看一下root用户的环境变量。 root用户的环境变量里是有/sbin路径的&a…...

编程日记 2023/8/11 5:02:33

线性表中的时间复杂度

线性表一、顺序表示的线性表插入操作的时间复杂度最好情况： O ( 1 ) O(1) O(1)。（新元素插到表尾，不需要移动元素）最坏情况： O ( n ) O(n) O(n)。（新元素插到表头，需要将原有的n个元素全部…...

编程日记 2023/8/11 5:01:31

线性回归——工龄与平均工资关系分析

项目实训：工龄与平均工资关系分析项目实训 1. 实训目的 （1）理解数据分析的过程。 （2）掌握机器学习常用库（NumPy、Pandas、Matplotlib）的使用方法。 （3）掌握使用Sklearn训…...

编程新知 2026/4/10 10:41:31

ThinkPHP 8+ES的生命周期的庖丁解牛

它的本质是：PHP 应用作为客户端，通过 HTTP 协议与 ES 集群进行交互。这个过程涉及 JSON 序列化/反序列化、HTTP 连接管理、倒排索引的异步构建以及最终一致性的等待。与 MySQL 的同步事务不同，ES 的操作通常是“近实时 (NRT)”的，…...

编程新知 2026/4/10 10:16:09

阿里Z-Image中文文生图实战：ComfyUI可视化操作，3分钟生成第一张图

阿里Z-Image中文文生图实战：ComfyUI可视化操作，3分钟生成第一张图 1. 快速了解Z-Image-ComfyUI Z-Image是阿里巴巴最新开源的中文文生图大模型，它让普通用户也能在消费级显卡上快速生成高质量图像。这个镜像集成了Z-Image模型和ComfyUI可视…...

编程新知 2026/4/10 9:47:09

鸿蒙hdc命令

1、安装的所有应用 hdc shell bm dump -a com.example.kikakeyboard com.ohos.UserFile.ExternalFileManager com.ohos.adminprovisioning com.ohos.amsdialog com.ohos.backgroundtaskmgr.resources com.ohos.calendardata com.ohos.callui com.ohos.camera com.ohos.certmana…...

编程新知 2026/4/10 9:42:13

分布式链路追踪概述

文章目录

1.分布式链路追踪概述

1.1.什么是 Tracing

1.2.为什么需要Distributed Tracing

2.Google Dapper

2.1.Dapper的分布式跟踪

2.1.1.跟踪树和span

2.1.2.Annotation

2.1.3.采样率

3.OpenTracing

3.1.发展历史

3.2.数据模型

4.java探针技术-javaAgent

4.1.javaAgent概述

4.2.javaAgent入门

4.2.1.主程序之前运行的Agent

4.2.2.主程序之后运行的Agent

5 APM 工具

5.1.SkyWalking概述

相关文章：