
FlashDuty集中收集告警信息并高效地進(jìn)行收斂降噪
聲明:該文章來自(HelloGitHub)版權(quán)由原作者所有,K2OS渲染引擎提供網(wǎng)頁(yè)加速服務(wù)。
FlashDuty,它專注于解決 OnCall 的痛點(diǎn),支持對(duì)接數(shù)十種主流監(jiān)控系統(tǒng),能夠集中收集告警信息并高效地進(jìn)行收斂降噪。此外,F(xiàn)lashDuty 還提供排班、告警升級(jí)等實(shí)用功能,減少運(yùn)維小伙伴們晚上被打擾的次數(shù),告別 OnCall 噩夢(mèng)。
接下來,讓我們一起來了解這款一站式、企業(yè)級(jí)的告警降噪工具?FlashDuty。
FlashDuty 簡(jiǎn)介
說它小而美,是因?yàn)樗_實(shí)非常專注,只解決一個(gè)問題,就是運(yùn)維領(lǐng)域的告警響應(yīng)問題??梢钥醋鍪?PagerDuty 的國(guó)內(nèi)平替。
理論上,好產(chǎn)品一定是經(jīng)過深度打磨的,打磨是需要大量人力的,所以攤子鋪得越大投入就越大,專注在一個(gè)細(xì)分領(lǐng)域的產(chǎn)品反而更容易取得成功。
FlashDuty 具體解決哪些痛點(diǎn)需求呢?大概可以歸為如下幾點(diǎn):
告警統(tǒng)一收集的需求,解決「監(jiān)控系統(tǒng)多,告警事件分散,配置分散,人員信息重復(fù)維護(hù)在多個(gè)地方」等問題。
告警統(tǒng)一響應(yīng)的需求,在一個(gè)地方查看、處理所有監(jiān)控系統(tǒng)的告警,統(tǒng)一做告警聚合降噪、排班、告警升級(jí)、分派。還要提供 App、和 IM 打通等移動(dòng)辦公手段。
告警統(tǒng)一分析的需求,告警統(tǒng)一到一個(gè)地方,統(tǒng)一結(jié)構(gòu)化、再豐富,進(jìn)而可以統(tǒng)一分析,不但可以分析 MTTA、MTTR 等常規(guī)指標(biāo),也可以喂給 AI,往智能化方向探索。
?為啥這些需求不能直接在監(jiān)控系統(tǒng)中搞定呢?核心原因有二。
1. 監(jiān)控系統(tǒng)的側(cè)重點(diǎn)就不在這,監(jiān)控系統(tǒng)側(cè)重在數(shù)據(jù)采集、存儲(chǔ)、分析、生成告警事件,對(duì)事件的后續(xù)處理流程關(guān)注較少;
2. 監(jiān)控系統(tǒng)有方向側(cè)重,比如 Zabbix 側(cè)重在設(shè)備、Cacti 側(cè)重網(wǎng)絡(luò)、Prometheus 側(cè)重微服務(wù)、云監(jiān)控側(cè)重云上資源,所以監(jiān)控系統(tǒng)來做這攤事,也只能處理自身生成的告警事件,不夠全面。
那 FlashDuty 是如何解決這些需求的呢?或者說,其產(chǎn)品主要思路是?
FlashDuty 產(chǎn)品思路
幾乎所有監(jiān)控系統(tǒng)都支持通過 Webhook 的方式把告警推送給第三方,所以首先 FlashDuty 就要基于這個(gè)機(jī)制去對(duì)接各類監(jiān)控系統(tǒng),這是個(gè)臟活累活,不過對(duì)接的越多競(jìng)爭(zhēng)力越大。
上圖是 FlashDuty 已經(jīng)對(duì)接的監(jiān)控系統(tǒng),還在持續(xù)增加中...
事件進(jìn)入 FlashDuty 之后,會(huì)走一個(gè) Pipeline,對(duì)事件進(jìn)行規(guī)整、過濾、再豐富、持久化、聚合、分派等一系列邏輯,最終遞達(dá)通知媒介,其邏輯就類似下面這個(gè)圖:
當(dāng)然了,魔鬼在細(xì)節(jié),即便是一個(gè)細(xì)分領(lǐng)域的產(chǎn)品,也有很多需要打磨的點(diǎn),下面走馬觀花,簡(jiǎn)單看一些系統(tǒng)截圖。
FlashDuty 產(chǎn)品截圖
首先看一個(gè)最常用的頁(yè)面,即故障(告警的集合)匯總頁(yè)面:
告警事件響應(yīng)平臺(tái),是踐行的 OnCall 文化,讀過 Google SRE 那本書的朋友對(duì)這個(gè)概念應(yīng)該很熟悉,沒有 OnCall 排班不可能有 SRE 的落地,排班需要有個(gè)靈活的工具,下面就是 FlashDuty 的排班頁(yè)面:
作為管理者,希望能夠量化告警、故障處理效率,作為一線員工,也希望能把工作量化,方便年終匯報(bào),所以統(tǒng)計(jì)分析也是必不可少:
晚上朦朦朧朧接到告警電話,起床開電腦、連 VPN、打開監(jiān)控系統(tǒng),這樣經(jīng)歷肯定很痛苦,一款事件 OnCall 的 App,移動(dòng)辦公,會(huì)提升很多幸福感,F(xiàn)lashDuty 也提供了手機(jī) App:
實(shí)際上,F(xiàn)lashDuty 不止可以接收告警事件,也提供了告警引擎能力,可以直接對(duì)接時(shí)序庫(kù)等各類存儲(chǔ),做告警判定,總之,跟告警相關(guān)的事情,F(xiàn)lashDuty 都可以干,下面是告警規(guī)則管理頁(yè)面:
關(guān)于試用
FlashDuty 產(chǎn)品介紹和試用地址如下:
介紹? flashcat.cloud/product/flashduty
試用? console.flashcat.cloud
通過他們的產(chǎn)品介紹頁(yè)面可以看到,有不少企業(yè)用了 FlashDuty,比如海底撈、吉野家、益豐、海大、保時(shí)捷、地平線、紫光云等,看起來還是比較靠譜的。
結(jié)語(yǔ)
人生短短三萬天,能省一天算一天。節(jié)省精力干點(diǎn)更高級(jí)、更有意思的事情。
實(shí)際一款好的 SaaS 產(chǎn)品,不但可以提升工作效率,還可以提升幸福感,希望今天介紹的這款?FlashDuty 產(chǎn)品,可以給你帶來幸福感 :)
[超站]友情鏈接:
四季很好,只要有你,文娛排行榜:https://www.yaopaiming.com/
關(guān)注數(shù)據(jù)與安全,洞悉企業(yè)級(jí)服務(wù)市場(chǎng):https://www.ijiandao.com/
- 1 習(xí)近平接見新疆各族各界代表 7904287
- 2 樺加沙風(fēng)眼內(nèi)部曝光 拍攝部門:震撼 7808790
- 3 飛機(jī)狂風(fēng)中降落 機(jī)翼險(xiǎn)些砸地 7713230
- 4 援疆的山海深情 跨越千里萬里 7617376
- 5 馬克龍被美警察攔下 當(dāng)場(chǎng)打給特朗普 7521425
- 6 臺(tái)風(fēng)“樺加沙”影響有多大?解讀來了 7426828
- 7 上海再通報(bào)多校午餐發(fā)臭:涉嫌瞞報(bào) 7329321
- 8 深圳機(jī)場(chǎng)飛機(jī)被“五花大綁”防臺(tái)風(fēng) 7232212
- 9 美媒:中國(guó)航母能力實(shí)現(xiàn)重大飛躍 7143678
- 10 為避臺(tái)風(fēng) 小區(qū)近百輛車停上大橋 7043687