
從核酸檢測到健康碼,為什么系統(tǒng)總是“崩了”?
聲明:該文章來自(cnbeta)版權(quán)由原作者所有,K2OS渲染引擎提供網(wǎng)頁加速服務(wù)。
第一財(cái)經(jīng)注意到,相對于千萬級的常住人口數(shù)量,這些系統(tǒng)承載的每分鐘的訪問量在百萬級別。隨著疫情反復(fù),頻頻崩潰的數(shù)據(jù)平臺系統(tǒng)引起了人們的注意。“我早上6點(diǎn)就起來了,6點(diǎn)半去排隊(duì),7點(diǎn)開始測,7點(diǎn)20就完事兒啦!”天津市民劉先生大清早就按照要求參加了核酸檢測,等到他看到了微信群里有朋友在抱怨核酸檢測系統(tǒng)的崩潰時(shí),才覺得10日的早起,值了!
微信記錄顯示,有天津市民在10日10:40左右抱怨在快要排到時(shí)因核酸檢測系統(tǒng)崩潰不得不暫緩檢測,等到11:30時(shí)系統(tǒng)才重新恢復(fù)?!鞍着帕藛幔俊眲⑾壬鷨柵笥?,對方回答沒有,因?yàn)楹傲思胰恕拜喠魈鏁骸薄?/p>
官方系統(tǒng)為何如此“脆弱”?
各地大數(shù)據(jù)系統(tǒng)投入不少,除了最近天津的核酸檢測系統(tǒng)出現(xiàn)崩潰情況之外,還屬健康碼最為常用,“崩潰”率也最高。
2021年,山東、西安、天津等地都先后出現(xiàn)過故障。事后披露的原因多為當(dāng)日最高查詢峰值激增導(dǎo)致系統(tǒng)阻塞。比如山東去年8月份當(dāng)日最高查詢峰值達(dá)60.96萬人次/分鐘,同前一工作日相比激增8倍,是去年最高峰值的2.5倍,西安“一碼通”用戶訪問量激增時(shí)出現(xiàn)每秒訪問量達(dá)到以往峰值的10倍以上,而粵康碼流量異常增大時(shí)最高達(dá)每分鐘140萬次,超出承載極限,觸發(fā)系統(tǒng)保護(hù)機(jī)制。
第一財(cái)經(jīng)注意到,相對于千萬級的常住人口數(shù)量,這些系統(tǒng)承載的每分鐘的訪問量在百萬級別。
“傳統(tǒng)的做法通常會分為兩類,一是整合多方數(shù)據(jù)后,以統(tǒng)一的數(shù)據(jù)資源平臺面向政府體系提供服務(wù)為主,另一類是部署兩套系統(tǒng)分別應(yīng)對政府內(nèi)部服務(wù)和面向居民的服務(wù)體系。前者的架構(gòu)在面對居民高并發(fā)的應(yīng)用場景時(shí)容易遇到瓶頸;后者則可能會對數(shù)據(jù)資源進(jìn)行重復(fù)建設(shè)。”一位業(yè)內(nèi)人士告訴第一財(cái)經(jīng),這些系統(tǒng)的構(gòu)建涉及基礎(chǔ)資源層、網(wǎng)絡(luò)層、應(yīng)用層多個(gè)專業(yè)廠商,出現(xiàn)問題的表征一定是訪問崩潰,但背后原因未必相同,因此不好對已經(jīng)出現(xiàn)崩潰情況的系統(tǒng)做出評價(jià)。
目前,各健康碼、核酸檢測系統(tǒng)的運(yùn)營公司大多是經(jīng)由當(dāng)?shù)氐拇髷?shù)據(jù)中心招投標(biāo)建設(shè)而成,從股東方也可一窺技術(shù)提供方。比如“粵康碼”由數(shù)字廣東網(wǎng)絡(luò)建設(shè)有限公司負(fù)責(zé)開發(fā)及技術(shù)維護(hù),背后的股東包括中國電子、三大運(yùn)營商和騰訊。西安的一碼通由西安市大數(shù)據(jù)資源管理局牽頭,中國電信西安分公司開發(fā)部署。記者曾聯(lián)系了多家與健康數(shù)據(jù)平臺或當(dāng)?shù)卮髷?shù)據(jù)中心有業(yè)務(wù)往來的技術(shù)供應(yīng)方,但都得到了謝絕采訪的回復(fù)。
不過,記者了解到,通常這樣的系統(tǒng)會采用分布式大數(shù)據(jù)技術(shù),結(jié)合所在地的人口情況、上下班出現(xiàn)的訪問高峰設(shè)計(jì)出相應(yīng)的系統(tǒng)容量和冗余量。“健康碼的賦碼業(yè)務(wù)邏輯需要根據(jù)運(yùn)營商手機(jī)相關(guān)數(shù)據(jù)、公安人口相關(guān)數(shù)據(jù)、衛(wèi)健委人員健康狀態(tài)等數(shù)據(jù)進(jìn)行離線加工融合,并通過實(shí)時(shí)對接健康云等用戶注冊信息融合加工達(dá)到秒級別的生產(chǎn)數(shù)據(jù)以快速控制風(fēng)險(xiǎn)。所以團(tuán)隊(duì)確定使用大數(shù)據(jù)分析和實(shí)時(shí)流處理引擎對這一業(yè)務(wù)場景進(jìn)行技術(shù)支撐?!币晃粎⑴c過某地健康碼系統(tǒng)搭建的相關(guān)人士介紹稱。
此外,還要對系統(tǒng)各環(huán)節(jié)下的全鏈路全方位測壓,以保證系統(tǒng)上線足夠高的可靠性和穩(wěn)定性。
應(yīng)急層面上看,系統(tǒng)要有足夠的彈性伸縮能力。在訪問出現(xiàn)激增的特殊情況時(shí),能夠快速擴(kuò)容,滿足相應(yīng)的訪問需求,比如進(jìn)行容器化的設(shè)計(jì)保證底層基礎(chǔ)設(shè)施具備良好的彈性伸縮能力。
除去訪問容量冗余角度上的考慮,還要考慮對于整體系統(tǒng)層面的全流程監(jiān)控設(shè)計(jì),如網(wǎng)絡(luò)訪問情況,健康碼接口訪問統(tǒng)計(jì),日峰值出現(xiàn)時(shí)段等指標(biāo)。這不僅為實(shí)時(shí)大屏提供了相應(yīng)的數(shù)據(jù)指標(biāo)支撐,同時(shí)也為團(tuán)隊(duì)驗(yàn)證系統(tǒng)容量設(shè)計(jì),監(jiān)控保障系統(tǒng)穩(wěn)定運(yùn)行,以及后續(xù)實(shí)現(xiàn)資源動態(tài)擴(kuò)縮容提供了決策依據(jù)。
即便考慮再周全,這世上當(dāng)然沒有完美無缺的系統(tǒng),特別是在計(jì)算資源本身就是有限的情況下。業(yè)內(nèi)人士提到需要配套合理的開發(fā)流程和運(yùn)營管理流程來有效的支撐軟件系統(tǒng)的持續(xù)升級和健康運(yùn)行。比如在總體系統(tǒng)設(shè)計(jì)上,針對關(guān)鍵軟件服務(wù)和數(shù)據(jù)配備應(yīng)急資源和環(huán)境進(jìn)行分級。平時(shí)這部分資源可用于一些創(chuàng)新業(yè)務(wù)或非關(guān)鍵性業(yè)務(wù),一旦有臨時(shí)性的業(yè)務(wù)需求如全員核酸時(shí),可以及時(shí)將這部分應(yīng)急資源用于業(yè)務(wù)擴(kuò)容來支撐。
這有些類似于12306系統(tǒng)將訂票和查詢余票業(yè)務(wù)分開,在各個(gè)子系統(tǒng)按需進(jìn)行擴(kuò)縮容的設(shè)計(jì),同樣,也不建議在關(guān)鍵高并發(fā)的健康碼查詢路徑上關(guān)聯(lián)過多的非關(guān)鍵業(yè)務(wù),不同業(yè)務(wù)采用微服務(wù)等新型軟件開發(fā)方式來開發(fā),結(jié)合容器云等技術(shù)來實(shí)現(xiàn)動態(tài)的按需擴(kuò)縮容,同時(shí)保證各個(gè)業(yè)務(wù)之間不互相影響,如上傳核酸報(bào)告、查詢核算報(bào)告、查詢健康碼等業(yè)務(wù)要分開。
“在某些關(guān)鍵業(yè)務(wù)失靈后能夠快速地從備份系統(tǒng)恢復(fù)數(shù)據(jù)并支持業(yè)務(wù)重新上線,這樣即使某個(gè)業(yè)務(wù)短暫出現(xiàn)問題,我們可以通過災(zāi)備系統(tǒng)來快速恢復(fù)業(yè)務(wù)和數(shù)據(jù),這樣老百姓的等待時(shí)間可以從一天縮減到幾分鐘?!边@位業(yè)內(nèi)人士說。
[超站]友情鏈接:
四季很好,只要有你,文娛排行榜:https://www.yaopaiming.com/
關(guān)注數(shù)據(jù)與安全,洞悉企業(yè)級服務(wù)市場:https://www.ijiandao.com/
- 1 潮涌天山活力新 7904091
- 2 央視起底柯克之死 7809003
- 3 中產(chǎn)運(yùn)動三件套又換了 7714346
- 4 多領(lǐng)域重點(diǎn)工程傳來好消息 7615916
- 5 持槍空降兵在孩子前一動不敢動 7523289
- 6 比亞迪李云飛回應(yīng)巴菲特清倉 7426470
- 7 內(nèi)蒙古一地集中采集男性居民血樣 7331160
- 8 安踏市值蒸發(fā)125億港元 7234008
- 9 浙江大學(xué)教授被留置 持股市值31億 7135398
- 10 特朗普兒子模仿爸爸引哄堂大笑 7043721