刘晗《分布式链路追踪实战》:20讲玩转微服务可观测性系统

刘晗《分布式链路追踪实战》:20讲玩转微服务可观测性系统插图

课程背景

随着微服务的落地,查找并解决系统问题的难度也在升级。如何从架构层面更好地了解分布式系统,多维度、快速定位并解决问题?这时候就需要引入分布式链路追踪,构建可观测的微服务系统。
无论你是开发、测试、还是运维,提高系统的可观测性,都会减少你的低效劳动,让你的工作更高效。

专栏解读

专栏分为 3 大模块,共 21 讲,内容包含可观测性的基本原理、关键步骤、实践应用,带你更加深入了解分布式系统,更具预警性地应对微服务开发中的各种问题。

  • ①可观测性原理:数据追踪的基石是什么、系统日志为何是保障系统稳定的关键、了解系统的指标如何编写……
    这一模块先带你了解可观测性中的关键概念和原理,包括数据观测、系统日志、监控指标、链路分析等内容;同时结合实践,告诉你如何更好地观测你的应用程序,以及如何处理真实的业务场景问题。
  • ②告警体系与可观测性:如何从架构层面了解系统,感知业务隐藏问题,并且善用告警系统,快速解决问题?
    这一模块主要带你了解如何将可观测性的理念与告警体系结合,形成一套可以落地的规范。
  • ③可观测性的实践应用:ELK 如何收集日志、Prometheus 如何完美地显示指标体系、Zipkin 如何进行分布式追踪、SkyWalking 如何把观测和分析结合起来……

这一部分内容是可观测系统中的关键点,教你如何将第一模块的原理应用到实践中。

课程讲师

刘晗 拉勾技术专家,SkyWalking PMC
曾在多家大型公司负责基础组件、底层框架研发,擅长业务研发、基础架构研发、服务治理、服务观测等方向,对分布式系统观测、系统调优有着丰富的实战经验。目前在拉勾网负责基础组件研发和可观测平台的搭建。

课程目录

开篇词

  • 开篇词 | 如何更好地观测线上系统?

第一部分:可观测性原理

  • 01 | 数据观测:数据追踪的基石从哪里来?
  • 02 | 系统日志:何以成为保障稳定性的关键?
  • 03 | 日志编写:怎样才能编写“可观测”的系统日志?
  • 04 | 统计指标:“五个九”对系统稳定的真正意义
  • 05 | 监控指标:如何通过分析数据快速定位系统隐患?(上)
  • 06 | 监控指标:如何通过分析数据快速定位系统隐患?(下)
  • 07 | 指标编写:如何编写出更加了解系统的指标?
  • 08 | 链路监控:为什么对于系统而言必不可少?
  • 09 | 性能剖析:如何补足分布式追踪短板?
  • 10 | 链路分析:除了观测链路,还能做什么?
  • 11 | 黑/白盒监控:系统功能与结构稳定的根基

第二部分:告警体系与可观测性

  • 12 | 系统告警:快速感知业务隐藏问题
  • 13 | 告警质量:如何更好地创建告警规则和质量?
  • 14 | 告警处理:怎样才能更好地解决问题?

第三部分:可观测性的实践应用

  • 15 | 日志收集:ELK 如何更高效地收集日志?
  • 16 | 指标体系:Prometheus 如何更完美地显示指标体系?
  • 17 | 链路追踪:Zipkin 如何进行分布式追踪?
  • 18 | 观测分析:SkyWalking 如何把观测和分析结合起来?
  • 19 | 云端观测:ARMS 如何进行云观测?
  • 20 | 运维集成:内部的 OSS 系统如何与观测相结合?

结束语

  • 结束语 | 未来的监控是什么样子?