1.Open-falcon-基础系列(三)-各个组件详解及使用
2.Mt-Falcon——Open-Falcon在美团点评的源码应用与实践
Open-falcon-基础系列(三)-各个组件详解及使用
Open-Falcon的基础组件详解
Agent: 作为监控核心,负责机器负载数据采集,源码每秒推送到Transfer。源码部署时需覆盖所有监控机器,源码资源消耗低。源码配置通过cfg.json,源码网站源码asp可通过work文件获取hostname,源码避免误操作导致的源码监控误报。
支持Agent存活监控:通过心跳连接更新心跳时间戳,源码检测Agent实例存活状态。源码
二、源码HBS改造内存优化:使用RPC+MessagePack替代JSON-RPC,源码提升编码效率,源码减少内存占用。源码
查询监控策略:提供接口查询指定机器的源码监控策略列表。
模板继承问题修复:改进聚合逻辑,确保所有子模板监控策略生效。源码导入iapp
报警禁用:支持5种类型禁用,避免误报警。
三、Transfer改造Endpoint黑名单功能:禁用特定Endpoint或监控指标,避免数据过多影响性能。
指定监控项发送到OpenTSDB:重要监控指标直接保存至OpenTSDB,便于长时间查询。
四、网址采集源码Judge改造内存优化:仅缓存配置策略的监控项数据,提高性能。
报警状态持久化:报警事件信息持久化存储,避免重启重复报警。
报警升级、ACK功能:实现报警等级调整和确认。
五、Graph改造索引存储优化:采用Redis+Tair,支付源码分析提高性能。
过期索引自动清理:监控项索引超过1个月未上报自动删除,并在重新上报时重建。
历史数据查询优化:解决小时内数据查询误差问题。
六、Alarm改造报警合并、发散、白名单、clickhouse 源码解析分布式消费、报警方式调整、持久化与统计、报警红盘、模板负责人选项、基础监控自动报警。
七、Portal/Dashboard改造服务树绑定、权限认证、操作日志、shift多选、颜色调整、索引自维护、Dashboard刷新、screen中单图刷新、按环境应用监控模板。
八、新增模块Ping监控、字符串监控、同比环比监控、多条件监控。
总结 Mt-Falcon全面替换Zabbix,接入美团点评所有机器,监控项数量超过两亿,数据上报QPS达百万级。下一步重点是监控融合统一、配置页面优化、自动报警处理与数据运营。 我们致力于推动Open-Falcon社区发展,部分改进已合并至官方版本。