包含标签 监控 的文章

企业级监控系统设计实践(三)数据转发

插件

上节讲了关于机器指标的采集,本节讲一下业务数据的采集,业务数据其实我们做的主要就是制定规范,告诉用户按照什么样的数据格式上报数据

根据经验,数据格式主要需要下面几个指标

  • metric 告诉监控系统数据项是什么
  • value 指标的数值
  • endpoint 上报数据的来源
  • tag 形式为a=b,通过tag可以匹配一批数据
  • timestamp 上报时间
  • step 上报间隔
……

阅读全文

企业级监控系统设计实践(二)数据采集

数据采集

收到数据采集,那我们主要需要哪些数据呢?

  • 机器的状态,cpu,内存
  • 业务自己产生的数据,如qps等
  • mysql,redis等开源软件自身的状态数据

上面的数据大致可以分为两类:

  • 机器指标
  • 业务数据

采集方式也有两种:push和pull 当agent数量非常庞大时,如果采用pull的方式,server端需要保持大量的链接,非常消耗性能,所以我们采用agent push数据的方式

……

阅读全文

企业级监控系统设计实践(一)

背景

从公司产品上线的那一天就开始需要运维,而监控则是运维中重要的一环,那我们想一下,为什么要监控呢,因为要保证线上服务出问题之后或者即将出问题时能立刻感知,此外有些数据我们想知道它的发展趋势。这其实已经道出了监控的最小功能点: 收集信息,进行处理,发出提醒,数据展示

阶段一:

机器数量:n < 5 假如公司的只有一款产品部署在一台机器,那我们只要写一个监控脚本,收集机器的信息和业务指标,再加一些判断,就完事了

……

阅读全文