
消息服務(wù)Matrix.org遭遇RAID陣列故障導(dǎo)致55TB數(shù)據(jù)庫損壞 持續(xù)1天后已恢復(fù)
聲明:該文章來自(藍(lán)點(diǎn)網(wǎng))版權(quán)由原作者所有,K2OS渲染引擎提供網(wǎng)頁加速服務(wù)。
RAID 陣列故障導(dǎo)致數(shù)據(jù)損壞的案例并不少見,日前知名的去中心化分散消息服務(wù) Matrix.org 使用的服務(wù)器就遭遇 RAID 陣列故障,故障的是主服務(wù)器以至于使用該平臺(tái)的開發(fā)者都無法正常收發(fā)消息。
需要明確的是對于擁有自己的專屬主服務(wù)器的客戶例如政府組織不受影響,其他任何使用 Matrix.org 作為主服務(wù)器的用戶都受影響,以至于無法收到任何消息。
Matrix.org 主服務(wù)器托管著大型 PostgreSQL 數(shù)據(jù)庫,這份數(shù)據(jù)庫包含的數(shù)據(jù)約為 55TB,在故障發(fā)生后團(tuán)隊(duì)開始處理并想方設(shè)法從源數(shù)據(jù)和備份數(shù)據(jù)中恢復(fù)數(shù)據(jù)庫。
此次故障的發(fā)生時(shí)間是 2025 年 9 月 2 日 17:39 UTC,直到 9 月 3 日 17:03 UTC 才恢復(fù)正常,也就是持續(xù)時(shí)間將近 24 小時(shí),期間無數(shù)開發(fā)者受到此次故障的影響。
在實(shí)際故障中最初 Matrix.org 的二級數(shù)據(jù)庫由于 RAID 故障而丟失文件系統(tǒng),隨后主數(shù)據(jù)庫也開始跟著崩潰,接著 Matrix.org 支持團(tuán)隊(duì)承認(rèn)事情有點(diǎn)不對勁。
接下來就是著手修復(fù) RAID 陣列故障和恢復(fù)數(shù)據(jù)庫,這個(gè)過程花費(fèi)了超過 15 個(gè)小時(shí),在初步恢復(fù)正常后 Matrix.org 還需要將中斷期間的消息逐漸釋放出來。
Matrix.org 是免費(fèi)的因此也沒有服務(wù)水平協(xié)議 (SLA),如果開發(fā)者自己搭建了服務(wù)器那不受影響,所以如果依賴 Matrix.org 的去中心化服務(wù)器,那也要做好可能發(fā)生中斷的準(zhǔn)備。
[超站]友情鏈接:
四季很好,只要有你,文娛排行榜:https://www.yaopaiming.com/
關(guān)注數(shù)據(jù)與安全,洞悉企業(yè)級服務(wù)市場:https://www.ijiandao.com/
- 1 潮涌天山活力新 7904217
- 2 廣東或大范圍停工 7808675
- 3 央視起底柯克之死 7712300
- 4 多領(lǐng)域重點(diǎn)工程傳來好消息 7616278
- 5 中產(chǎn)運(yùn)動(dòng)三件套又換了 7522048
- 6 牛糞“圍村”成養(yǎng)殖大縣最頭疼的事 7428299
- 7 央行證監(jiān)會(huì)等負(fù)責(zé)人出席發(fā)布會(huì) 7328497
- 8 #英加澳為何要承認(rèn)巴勒斯坦國# 7238170
- 9 中方回應(yīng)中美領(lǐng)導(dǎo)人是否在APEC會(huì)晤 7142798
- 10 以總理:絕不會(huì)有巴勒斯坦國 等著瞧 7039609