包含标签 监控 的文章
夜莺二次开发指南-用户资源中心
夜莺二次开发指南-资产设备管理
夜莺二次开发指南-监控系统(3)
夜莺二次开发指南-监控系统(2)
夜莺二次开发指南-监控系统(1)
企业监控平台建设-需求分析篇
前言
工作以来一直在做监控平台相关的工作,最近计划写一系列文章总结下对企业监控平台建设的思考,本文是第一篇
……
企业级监控系统设计实践(三)数据转发
插件
上节讲了关于机器指标的采集,本节讲一下业务数据的采集,业务数据其实我们做的主要就是制定规范,告诉用户按照什么样的数据格式上报数据
根据经验,数据格式主要需要下面几个指标
- metric 告诉监控系统数据项是什么
- value 指标的数值
- endpoint 上报数据的来源
- tag 形式为a=b,通过tag可以匹配一批数据
- timestamp 上报时间
- step 上报间隔
企业级监控系统设计实践(二)数据采集
数据采集
收到数据采集,那我们主要需要哪些数据呢?
- 机器的状态,cpu,内存
- 业务自己产生的数据,如qps等
- mysql,redis等开源软件自身的状态数据
上面的数据大致可以分为两类:
- 机器指标
- 业务数据
采集方式也有两种:push和pull 当agent数量非常庞大时,如果采用pull的方式,server端需要保持大量的链接,非常消耗性能,所以我们采用agent push数据的方式
……企业级监控系统设计实践(一)
背景
从公司产品上线的那一天就开始需要运维,而监控则是运维中重要的一环,那我们想一下,为什么要监控呢,因为要保证线上服务出问题之后或者即将出问题时能立刻感知,此外有些数据我们想知道它的发展趋势。这其实已经道出了监控的最小功能点: 收集信息,进行处理,发出提醒,数据展示
阶段一:
机器数量:n < 5 假如公司的只有一款产品部署在一台机器,那我们只要写一个监控脚本,收集机器的信息和业务指标,再加一些判断,就完事了
……