
蘋果CSAM丑聞再升級(jí):掃描算法存嚴(yán)重缺陷,三年前就“偷窺”用戶
美國(guó)時(shí)間8月24日,是締造了蘋果公司輝煌傳奇的史蒂夫·喬布斯卸任 CEO,將大權(quán)交給Tim Cook十周年的日子。十年過去了,蘋果的財(cái)務(wù)表現(xiàn)無(wú)比優(yōu)秀,曾經(jīng)多年保持著世界上最值錢公司的紀(jì)錄。然而在名氣和財(cái)氣背后,這幾年的蘋果,風(fēng)評(píng)卻越來越差。就連經(jīng)常被拿來自我吹捧的隱私,蘋果在這方面的種種表現(xiàn),都越來越令人難以相信:這居然是蘋果能干的出來的事?
文/杜晨
8月初,硅星人寫了一篇文章《蘋果要偷看你手機(jī)電腦上的照片了》,說的是當(dāng)時(shí)蘋果被業(yè)界人士曝出(隨后很快官方承認(rèn))的一項(xiàng)爭(zhēng)議性極高的新舉措:對(duì)用戶手機(jī)上保存的照片,以及通過 iMessage 發(fā)布、上傳到 iCloud 的圖片進(jìn)行審核,從而識(shí)別兒童色情和虐待內(nèi)容 (CSAM),打擊其傳播。
注意,我們?cè)谡f的可是蘋果——號(hào)稱最注重用戶個(gè)人隱私的蘋果。而現(xiàn)在,蘋果就這樣堂而皇之地?fù)u身一變,成了一家隨時(shí)隨地都要“偷看”你照片的公司。
自從這項(xiàng)新政宣布以來,對(duì)蘋果不利的情況接連發(fā)生,使得 CSAM 掃描事件不斷升級(jí),目前已經(jīng)基本達(dá)到可以稱之為“丑聞”的程度了。
算法漏洞浮現(xiàn)
首先來個(gè)快速前情提要:
美國(guó)時(shí)間8月5日,約翰霍普金斯大學(xué)加密學(xué)教授 Matthew Green 曝光蘋果將推出一項(xiàng)用于檢測(cè) CSAM 的技術(shù)。這項(xiàng)技術(shù)名為 NeuralHash,基本上就是在用戶手機(jī)本地和 iCloud/蘋果服務(wù)器云端,用算法對(duì)用戶圖片和一個(gè)第三方 CSAM 數(shù)據(jù)庫(kù)進(jìn)行哈希值比對(duì)。一旦比對(duì)成功,蘋果就會(huì)屏蔽這張照片,并且不排除后續(xù)還會(huì)進(jìn)行報(bào)警或通知青少年家長(zhǎng)之類的操作。
這件事被曝出后,硅星人已經(jīng)進(jìn)行了詳細(xì)報(bào)道,并點(diǎn)評(píng)了這項(xiàng)技術(shù)存在的一些應(yīng)用層面的問題,主要有兩點(diǎn):
1)所謂只打擊 CSAM 的技術(shù),無(wú)法從技術(shù)上被限制只針對(duì) CSAM,因?yàn)椤?/p>
2)此類工具已經(jīng)在技術(shù)上被攻破,使得兩張完全不同的照片,可以實(shí)現(xiàn)哈希碰撞(也即擁有相同的哈希值)
自那之后,這項(xiàng) CSAM 技術(shù)又被曝出新的情況,使得丑聞再度升級(jí)。
機(jī)器學(xué)習(xí)研究者 Asuhariet Ygvar 發(fā)現(xiàn),NeuralHash 算法早在 iOS 14.3版本就已經(jīng)植入到 iPhone 的操作系統(tǒng)里了,并且蘋果還故意混淆了其 API 命名。(而此前蘋果在 CSAM 技術(shù)的官網(wǎng)頁(yè)面上宣稱,這項(xiàng)技術(shù)是新的,計(jì)劃在 iOS 15 和 macOS Monterey 正式版推出時(shí)才啟動(dòng)。)
Ygvar 通過逆向工程的方法,成功導(dǎo)出了 NeuralHash 算法并且將其重新打包為 Python 可執(zhí)行。這位研究者還在 GitHub 上提供了導(dǎo)出方法,讓其它數(shù)據(jù)安全人士可以對(duì) NeuralHash 進(jìn)行更深的探索研究:
(這位研究者沒有提供導(dǎo)出后的成品算法,顯然是為了避免遭到蘋果的知識(shí)產(chǎn)權(quán)訴訟,這一點(diǎn)稍后會(huì)詳述。)
算法鏈接:https://github.com/AsuharietYgvar/AppleNeuralHash2ONNX (這位研究者沒有提供導(dǎo)出后的成品算法,顯然是為了避免遭到蘋果的知識(shí)產(chǎn)權(quán)訴訟,這一點(diǎn)稍后會(huì)詳述。) 算法鏈接:https://github.com/Asuhariet Ygvar/AppleNeuralHash2ONNX
Ygvar 自己做的早期測(cè)試顯示,NeuralHash 算法對(duì)于圖片尺寸和壓縮調(diào)整的抗性較好。但如果圖片進(jìn)行了切割或者旋轉(zhuǎn),NeuralHash 就不好用了。這表明,NeuralHash 算法投入到 CSAM 檢測(cè)的實(shí)際效果可能會(huì)打折。
不出意外,很快就有人實(shí)現(xiàn)了對(duì)于 NeuralHash 算法的哈希值碰撞。位于波特蘭的安全研究員 Cory Cornelius 發(fā)布了一張比格犬照片和另一張灰色亂碼圖片。這兩張看起來毫無(wú)關(guān)聯(lián)的圖片,通過 NeuralHash 算法計(jì)算出的哈希值居然是一模一樣的。
緊接著,最早發(fā)布了模型導(dǎo)出方法的Ygvar,也復(fù)現(xiàn)了這次碰撞:
這條 GitHub 留言下方,有人進(jìn)一步指出,Cornelius 發(fā)現(xiàn)的情況,其實(shí)比碰撞更嚴(yán)重,已經(jīng)屬于原像攻擊 (pre-image) 的范疇了。
簡(jiǎn)單來說,哈希碰撞就是找到兩張哈希值相同的隨機(jī)照片,而原像攻擊,你可以將其理解為“刻意生成的碰撞”,也即先給定一張照片,然后生成另一張和其哈希值相同,但內(nèi)容不同的照片。
緊接著,更多開發(fā)者也用同一張照片實(shí)現(xiàn)了更多的碰撞:
甚至,有人在 ImageNet(一個(gè)備受機(jī)器學(xué)習(xí)人士歡迎,適用范圍超級(jí)廣的標(biāo)注圖片數(shù)據(jù)庫(kù))里,都能找到天然的 NeuralHash “雙胞胎”。
ImageNet 里的一張釘子照片和一張滑雪板照片,NeuralHash 算出的哈希值相同。另一張斧子的照片和線蟲的圖片,也是天然的 NeuralHash 哈希值“雙胞胎”。
對(duì) NeuralHash 算法實(shí)現(xiàn)原像攻擊,以及天然哈希值雙胞胎的存在,進(jìn)一步表明:蘋果打算大規(guī)模推廣的這個(gè) CSAM 識(shí)別算法,存在遠(yuǎn)比人們想象更嚴(yán)重的,有可能被濫用的缺陷。
以下是一種可能性:
你在網(wǎng)上跟某人結(jié)仇,他想要報(bào)復(fù)你。于是他去找了一張 CSAM 照片,然后生成了幾張看起來人畜無(wú)害,但是跟原始照片哈希值相同的圖片,發(fā)了過來。你的手機(jī)將它們識(shí)別成了 CSAM,你被舉報(bào)了,警察上門了,那人得逞了。
沒錯(cuò),我們完全不需要“設(shè)身處地”,把自己當(dāng)作一個(gè)可能傳播色情內(nèi)容的人。每一個(gè)普通人都完全有可能成為技術(shù)濫用或是錯(cuò)誤使用的受害者。如果今天被濫用的是 NeuralHash,而對(duì)象碰巧是你,那你的名譽(yù)將可能變得不堪一擊。
研究者 Brad Dwyer 表示,盡管上述漏洞存在,目前的早期測(cè)試似乎表明,哈希碰撞的發(fā)生率和蘋果宣稱的誤報(bào)率在相似水平。
但是,Dwyer 也強(qiáng)調(diào),蘋果目前在全球擁有超過15億用戶。這意味著NeuralHash 一旦出現(xiàn)誤報(bào),會(huì)對(duì)很大數(shù)量的用戶造成負(fù)面影響。
瞞天過海、封口威脅
硅星人的讀者可能還記得,前段時(shí)間我們寫過 Epic Games 和蘋果的訴訟,和這兩家公司因?yàn)椤疤O果稅”、應(yīng)用商城政策等問題而結(jié)下的梁子。
這樁案子其實(shí)是 Epic Games 挑起的針對(duì)蘋果的一場(chǎng)注定曠日持久的反壟斷戰(zhàn)爭(zhēng),話題也是完全“不設(shè)限”。所以在證據(jù)采集的階段,Epic Games 這邊的律師也搜集了大量跟案件原本話題有關(guān)或無(wú)關(guān)的資料,其中有很多都是蘋果內(nèi)部的高度機(jī)密資料。
也是在昨天,這樁訴訟再次曝出一條和蘋果 CSAM 掃描丑聞?dòng)嘘P(guān)的猛料:
蘋果反欺詐技術(shù)部門“FEAR”(Fraud Engineering Algorithms and Risk)的老大 Eric Friedman在2020年和同事的一段 iMessage 聊天當(dāng)中是這樣說的:“我們(蘋果)是全世界最大的兒童色情內(nèi)容分發(fā)平臺(tái)?!?/p>
這當(dāng)然是一句帶有諷刺調(diào)侃意味的發(fā)言。Friedman 實(shí)際表達(dá)的是,由于蘋果的隱私安全設(shè)計(jì),更多不法分子選擇蘋果通訊產(chǎn)品傳播這些內(nèi)容。
從表面上來看,這句話似乎是這位工作內(nèi)容包括打擊兒童色情內(nèi)容的蘋果高管在用一種苦澀諷刺的方式,來證明蘋果為什么要做這件事。
但是結(jié)合今天關(guān)于 CSAM 已經(jīng)討論的情況,不禁令人感到細(xì)思極恐:蘋果又是怎么知道自己平臺(tái)上有如此多的兒童色情內(nèi)容,以至于這位高管可以在2020年就下如此斷言呢?難道蘋果在此之前已經(jīng)在掃描用戶的設(shè)備和 iCloud 賬戶了嗎?
一些人開始猜測(cè),這家公司早就在私下掃描了。
在這條證據(jù)通過訴訟公開之后,蘋果發(fā)言人回應(yīng) 9to5Mac記者質(zhì)詢時(shí)表示:我們從2019年就已經(jīng)開始掃描用戶的 iCloud 賬戶了。
(這個(gè)時(shí)間,比剛才提到包含了 NeuralHash 算法的 iOS 14.3版本的發(fā)布時(shí)間,又早了整整整整一年。)
具體來說,蘋果掃描的是用戶的 iCloud Mail,也即用戶注冊(cè) iCloud 賬戶時(shí)得到的那個(gè) @iCloud.com 后綴的登錄電子郵箱。
同時(shí)蘋果還表示,也在對(duì)一些“其它數(shù)據(jù)”進(jìn)行同樣的掃描,但拒絕透露具體是哪些數(shù)據(jù)。該公司宣稱,從未掃描過用戶的 iCloud Photos(云端相片存儲(chǔ),iOS 默認(rèn)開啟的功能)。
截圖來自 9to5Mac 報(bào)道此事件的文章
更令人費(fèi)解的是,蘋果號(hào)稱將用戶數(shù)據(jù)隱私至于無(wú)上地位,時(shí)不時(shí)也會(huì)用這套說辭去攻擊貶低其它競(jìng)爭(zhēng)對(duì)手(比如 Facebook),卻從未以足夠清晰的方式向用戶告知過它也在掃描用戶隱私數(shù)據(jù)的情況。
它號(hào)稱珍惜用戶的忠誠(chéng),所以重視用戶的數(shù)據(jù)隱私,但現(xiàn)在我們看的越來越清楚,“保護(hù)用戶隱私”更像是它采用的一種宣傳口徑。
蘋果當(dāng)然想要瞞天過海。但當(dāng)一切再也瞞不住了的時(shí)候,它也會(huì)不惜通過各種手段去封住別人的口,阻撓第三方揭露它的問題。這一點(diǎn),沒有任何人比 Corellium 感受的更加深刻。
簡(jiǎn)單來說,常規(guī)渠道銷售的 iPhone 有一套非常復(fù)雜的用戶協(xié)議。如果安全研究人士如果要深度分析破解它(且未獲得蘋果的專門許可),這樣的行為就會(huì)違反協(xié)議。而 Corellium 這家公司提供一種“虛擬化 ARM 架構(gòu)設(shè)備”的服務(wù),包括 iOS 和 Android 設(shè)備,讓研究人士可以在電腦上對(duì) ARM 架構(gòu)的系統(tǒng)和軟件安全性進(jìn)行研究,而無(wú)需購(gòu)買實(shí)體的手機(jī)。
于是在2019年,蘋果以違反數(shù)字千年版權(quán)法為由起訴了 Corellium。一開始外界擔(dān)心,考慮到蘋果強(qiáng)大的法務(wù)力量,這個(gè)案子的走向最終可能會(huì)對(duì)安全行業(yè)不利。好在去年12月,主審案子的法官下達(dá)了一個(gè)初步裁決,確定 Corellium 的商業(yè)行為并不構(gòu)成侵犯版權(quán)。
今年8月10日,原定開庭日期的一周前,蘋果和 Corellium 突然達(dá)成了庭外和解。
這次和解還有一個(gè)更加微妙的細(xì)節(jié):它發(fā)生在蘋果正式宣布 CSAM 掃描,并且引發(fā)科技行業(yè)史無(wú)前例般巨大爭(zhēng)議的幾天之后。
很明顯,蘋果不希望在這個(gè)尷尬的時(shí)間點(diǎn)上,這樁懸而未決且對(duì)自己不利的案子被行業(yè)人士和公眾當(dāng)作它跟安全行業(yè)作對(duì)的證據(jù)。畢竟,在蘋果官網(wǎng) CSAM 的介紹頁(yè)面上也有提到,蘋果也在和第三方安全專家就 NeuralHash 的有效性和安全性展開合作。蘋果軟件 SVP Craig Federighi 接受采訪時(shí)也表示,歡迎安全專家對(duì) CSAM/NeuralHash 進(jìn)行檢驗(yàn)。
誰(shuí)曾想到,這邊剛跟蘋果和解,幾天后,Corellium 就又“欠招”了。
8月17日,Corellium 四周年的這一天,該公司發(fā)起了一個(gè)“開放安全計(jì)劃”,招募安全研究人員,向最優(yōu)秀的三組申請(qǐng)者提供每組5000美元撥款,以及長(zhǎng)達(dá)一年的 Corellium 技術(shù)工具免費(fèi)使用權(quán)限。
截圖來源:Corellium 網(wǎng)站
這項(xiàng)計(jì)劃的主題是“驗(yàn)證設(shè)備廠商的安全宣傳”。而這個(gè)廠商是誰(shuí)也就不用猜了……
截圖來源:Corellium 網(wǎng)站
“我們贊賞蘋果公司做出的承諾,允許第三方研究人員對(duì)其問責(zé)。我們也相信,我們的平臺(tái)非常適合幫助研究者實(shí)現(xiàn)這個(gè)目標(biāo)?!盋orellium 公司在官網(wǎng)上寫道。
這一舉動(dòng)再次激怒了蘋果。可能蘋果太憤怒了,以至于它的法務(wù)團(tuán)隊(duì)已經(jīng)不按套路出牌了……
在 Corellium 宣布這一計(jì)劃的第二天,蘋果撕毀了之前達(dá)成的和解,就去年12月法院下達(dá)的“Coreelium行為不構(gòu)成侵犯版權(quán)”的裁決,重新提交了上訴。
現(xiàn)在你應(yīng)該能理解,為什么本文前一小節(jié)提到的那個(gè)逆向工程了 NeuralHash 的開發(fā)者,只是提供了破解提取方法,沒有把提取出來的算法做成下載鏈接了。
畢竟,這世界上可能沒有人想要被蘋果告侵犯版權(quán)啊……
[超站]友情鏈接:
四季很好,只要有你,文娛排行榜:https://www.yaopaiming.com/
關(guān)注數(shù)據(jù)與安全,洞悉企業(yè)級(jí)服務(wù)市場(chǎng):https://www.ijiandao.com/

隨時(shí)掌握互聯(lián)網(wǎng)精彩
- 1 看總書記關(guān)心的清潔能源這樣發(fā)電 7904292
- 2 今年最強(qiáng)臺(tái)風(fēng)來襲 7808542
- 3 澳加英宣布承認(rèn)巴勒斯坦國(guó) 7713052
- 4 長(zhǎng)春航空展這些“首次”不要錯(cuò)過 7616730
- 5 43歲二胎媽媽患阿爾茨海默病 7520775
- 6 iPhone 17橙色斜挎掛繩賣斷貨 7427712
- 7 英國(guó)航母從南海“溜了” 7327900
- 8 女子花10萬(wàn)云養(yǎng)豬生重病難退錢 7238315
- 9 三所“零近視”小學(xué)帶來的啟示 7142000
- 10 中國(guó)消失的森林正“全盤復(fù)活” 7046896