简单好用的SLA探活工具 - EaseProbe
作者:matrix 被围观: 2,470 次 发布时间:2022-10-02 分类:零零星星 | 一条评论 »
SLA探活的需求很广泛,简单的可以自己实现。但是专门独立的探活工具倒是极少~
EaseProbe由GO编写,不需要其他依赖支持直接使用二进制程序运行。
这几天测试用来给api接口、ssl证书、web 200探活,好用~
github仓库
https://github.com/megaease/easeprobe
支持HTTP、TCP、SSH、SSL证书、各种数据库/消息中间件服务探活,和email、Slack、Discord、Telegram、飞书...的通知。还支持消息通知和定时发送报表,可以自定义分类告警渠道
配置config.yaml
参照官方配置,新建文件config.yaml
配置SSL证书过期检测、WEB HTTP200检测、接口HTTP状态检测:
http: # http探活
# 默认监控网页HTTP是否为200OK
- name: "HHTJIM.COM OK"
url: https://www.hhtjim.com
- name: "LINK.HHTJIM.COM OK"
url: https://www.hhtjim.com
# 监控接口是否返回指定状态码
- name: link mp3 parse
url: https://link.hhtjim.com/163/5146554.mp3
method: GET
insecure: true
success_code:
# 配置允许的状态码范围
- [200,206] # the code >=200 and <= 206
- [300,308] # the code >=300 and <= 308
timeout: 1s # default is 30 seconds
tls: # SSL证书探活
# 监控网页证书是否临近过期(24小时内触发告警)
- name: "www.hhtjim.com SSL EXPIRED"
host: www.hhtjim.com:443
insecure_skip_verify: true # dont check cert validity
expire_skip_verify: false # dont check cert expire date
alert_expire_before: 24h # alert if cert expire date is before X, the value is a Duration, see https://pkg.go.dev/time#ParseDuration. example: 1h, 1m, 1s. expire_skip_verify must be false to use this feature.
# 监控网页证书是否临近过期(7天内触发告警)
- name: "link.hhtjim.com SSL EXPIRED"
host: link.hhtjim.com:443
insecure_skip_verify: true
expire_skip_verify: false
alert_expire_before: 168h
notify: # 告警通知方式
lark:
- name: "lark alert service"
# 配置飞书通知机器人的webhook
webhook: "https://open.feishu.cn/open-apis/bot/v2/hook/00000-10b1-000000-8949-00000000"
# 全局配置
settings:
probe:
timeout: 30s # the time out for all probes
interval: 1m # probe every minute for all probes
说明:
参照上面注释可自由配置,我这里使用的是飞书通知。也可以其他方式告警~
探活配置参数:
https://github.com/megaease/easeprobe/blob/main/docs/Manual.md#1-probe
告警通知配置参数:
https://github.com/megaease/easeprobe/blob/main/docs/Manual.md#2-notification
开启监控
EaseProbe已经有docker镜像,可以直接一键启停。
# 首次启动
$ docker run -d -p 8181:8181 --name sla -v $(pwd)/config.yaml:/opt/config.yaml megaease/easeprobe
# 重启
$ docker restart sla
# 关闭
$ docker stop sla
查看状态
访问http://HOST:8181`就能看到web监控面板,且支持api接口
http://HOST:8181/api/v1/sla`
附. 飞书BOT创建
这里的告警通知使用的是群自定义机器人webhook,需要使用飞书客户端创建(web端没有找到入口)
- 群设置
- 添加自定义机器人
- 复制webhook地址
参考:
https://mp.weixin.qq.com/s/c73ZPBGoMbqjT-xbRiCJ3g
https://github.com/megaease/easeprobe/blob/main/docs/Manual.md
https://open.feishu.cn/document/ukTMukTMukTM/ucTM5YjL3ETO24yNxkjN?lang=zh-CN
点个赞,文章写得很不错