一、ChatGPT數據泄露事件經過
美國時間3月25日,OpenAI官方發布了3月20日ChatGPT臨時中斷服務的調查報告,并表示有1.2%的ChatGPT Plus的用戶數據可能被泄露。
根據OpenAI官網公告表示,3月20日前,因開源數據庫存在的錯誤導致了緩存出現問題,一些用戶可能看到其他人聊天記錄的片段,以及其他用戶信用卡的最后四位數字、到期日期、姓名、電子郵件地址和付款地址等信息。最初該問題僅波及到個別用戶,但是由于OpenAI在對服務器進行更改時再度出現失誤,導致問題進一步加劇,受影響的用戶可能擴大至1.2%的比例。
以下為OpenAI對此事件的說明:
“由于開源庫中的一個錯誤,我們本周早些時候將 ChatGPT下線,該錯誤允許一些用戶看到另一個活躍用戶的聊天記錄中的標題。如果兩個用戶大約同時處于活動狀態,那么新創建的對話的第一條消息也可能在其他人的聊天記錄中可見。該錯誤現已修補。除了幾個小時的歷史記錄外,我們已恢復ChatGPT服務以及聊天記錄功能。
經過更深入的調查,我們還發現,同樣的錯誤可能導致 1.2%的ChatGPT Plus訂閱者在特定的9小時窗口內處于活躍狀態,從而無意中看到了與支付相關的信息。在周一我們關閉ChatGPT之前的幾個小時內,一些用戶可能會看到另一個活躍用戶的名字和姓氏、電子郵件地址、支付地址、信用卡號的最后四位(僅)和信用卡到期時間日期。但任何時候都不會暴露完整的信用卡號碼。
我們認為,數據實際泄露給其他人的用戶數量極少。要訪問此信息,ChatGPT Plus 訂閱者需要執行以下操作之一:
· 打開3月20日星期一凌晨1點到10點發送的訂閱確認電子郵件。由于該錯誤,該窗口期間生成的一些訂閱確認電子郵件被發送給了錯誤的用戶。這些電子郵件包含另一個用戶信用卡號的最后四位數字,但沒有顯示完整的信用卡號。在3月20日之前,可能有少量訂閱確認電子郵件被錯誤地處理,盡管我們尚未確認任何此類情況。
· 在3月20日星期一凌晨1點到10點之間,在ChatGPT 中單擊“我的帳戶”,然后單擊“管理我的訂閱”。在此窗口中,另一個活躍的 ChatGPT Plus用戶的名字和姓氏、電子郵件地址、付款地址、信用卡號碼的最后四位(僅)和信用卡到期日期可能是可見的。這也可能發生在3月20日之前,盡管我們尚未確認任何此類情況。
我們已聯系受影響的用戶通知他們的付款信息可能已被泄露。我們相信用戶數據不會持續存在風險。
OpenAI致力于保護用戶隱私并確保數據安全。這是我們非常認真對待的責任。不幸的是,本周我們沒有兌現這一承諾,也沒有達到用戶的期望。我們再次向我們的用戶和整個 ChatGPT社區致歉,并將努力重建信任。”
此前,數據安全公司Cyberhaven的研究人員分析了不同行業客戶的160萬員工使用ChatGPT的情況。在其發布的報告中表示,自ChatGPT公開發布以來,5.6%的知識工作者在工作中至少嘗試使用過一次,4.9%的員工曾向ChatGPT提供了企業數據。受事件影響,一些美國和日本企業已開始限制在商業運營中使用ChatGPT等互動人工智能服務。美國銀行、花旗集團、德意志銀行、高盛集團、富國銀行、摩根大通和Verizon 等越來越多的機構禁止員工使用ChatGPT聊天機器人處理工作任務。日本軟銀之前就使用ChatGPT和其他類似應用警告員工稱:“不要輸入公司的可識別信息或機密數據”。
二、ChatGPT數據泄露原因分析
(一)錯誤原理
從公布的技術細節可以看出,錯誤是在Redis客戶端開源庫redis-py中被發現的。OpenAI對錯誤原理進行如下說明:
· OpenAI 使用Redis在他們的服務器中緩存用戶信息,所以ChatGPT不需要為每個請求檢查數據庫。
· OpenAI使用Redis Cluster將這一負載分布到多個Redis實例上。
· OpenAI使用redis-py庫,以便讓用了Asyncio的Python服務器與 Redis對接。
· 該庫在服務器和集群之間維護一個共享的連接池,并在完成后回收連接以用于另一個請求。
· 當使用 Asyncio時,redis-py的請求和響應表現為兩個隊列:調用者將請求推送到傳入隊列,并從傳出隊列中彈出響應,然后將連接返回到池中。
· 如果在請求被推送到傳入隊列之后,但在響應從傳出隊列中彈出之前,請求被取消,就會看到錯誤:連接因此被破壞,下一個為不相關的請求出列的響應可以接收連接中留下的數據。
· 在大多數情況下,這會導致一個無法恢復的服務器錯誤,而用戶將不得不重新嘗試他們的請求。
· 但在某些情況下,損壞的數據恰好與請求者所期望的數據類型相匹配,因此從緩存中返回的數據看起來是有效的,即使這些數據屬于另一個用戶。
· 3月20日星期一凌晨1點,OpenAI無意中給他們的服務器引入了一個變化,導致Redis請求取消的情況激增。這在一定程度上引發了每個連接返回錯誤數據的可能性。
· 這個錯誤只出現在Redis Cluster的Asyncio redis-py客戶端,現在已經被修復。
(二)補救措施
OpenAI表示采取了以下措施以改進系統:
· 廣泛測試了對潛在錯誤的修復情況。
· 添加了冗余檢查以確保Redis緩存返回的數據與請求用戶匹配。
· 以編程方式檢查日志,以確保所有消息僅對正確的用戶可用。
· 關聯多個數據源以準確識別受影響的用戶,以通知用戶。
· 改進日志記錄以識別何時發生。
· 提高了Redis的穩健性,以減少在極端負載下出現連接錯誤的可能性。
三、數據泄露趨勢分析
數據泄露是指,數據處理者喪失對其掌握數據的控制力,造成數據范圍的擴散和用途的不可控。近年來,數據泄露事件屢有發生,呈現出泄露規模大、行業多、持續長等特點,數據泄露已經成為網絡安全的主要威脅。
一是數據泄露規模體量增大。近年來,隨著數據處理者業務上云的普及,線上業務持續增長,導致受數據泄露影響的個體數量不斷擴大,少則數千萬,多達數億。
二是數據泄露涉及行業增多。隨著越來越多的設備、平臺相互聯通,以及云計算、物聯網的不斷融合,數據泄露涉及的行業越來越廣泛,已滲透至互聯網、物流、金融、教育、醫療、酒店、娛樂等行業。其中,互聯網、金融行業作為信息化、數字化發展程度最高的行業,已成為數據泄露的重災區。
三是數據泄露持續時間較長。由于大部分個人信息處理者并沒有應對數據泄露的響應機制,無法迅速發現個人信息遭到泄露。據IBM《2021年數據泄露成本報告》顯示,數據處理者發現數據泄露平均需要212天,控制影響平均還需要75天,比去年長一周。此外,不同行業響應時間存在較大差異。
四是數據泄露引發原因多樣。數據泄露原因多種多樣,既有黑客利用系統漏洞進行攻擊,又有數據庫配置錯誤、企業人員非授權訪問、第三方維護人員錯誤操作、“內鬼”主動泄露以及辦公網絡邊界不再固定等諸多原因。此次,ChatGPT數據泄露事件即屬于其中的數據庫配置錯誤問題。
四、人工智能將引發網絡安全進入智能化對抗時代
ChatGPT作為當下最熱的人工智能技術,受到業界及公眾追捧。越來越多的行業和領域逐步接入GPT技術,代表著相關行業的數據逐步為類GPT服務平臺所共享,并且會隨著應用范圍和頻率的增加,類GPT服務平臺將獲得海量的數據。ChatGPT數據泄露事件也是一種警示:技術的先進性并不與網絡的安全性成正比,若技術應用越廣泛、帶來的不可控風險則越高。
人工智能技術是把雙刃劍,在數字化浪潮下迎來廣闊發展機遇的同時,隨著與各領域融合應用不斷深入,也引發安全方面的新問題。《2023產業互聯網安全十大趨勢》報告認為人工智能技術將對網絡安全形勢帶來前所未有的挑戰,呈現“ChatGPT大規模人工智能計算廣泛應用于安全領域,攻防進入智能化對抗時代”的新趨勢。報告指出,ChatGPT基于強大的基礎模型、高質量的樣本數據、基于人類反饋的強化學習三大能力,帶來了巨大的可能性。然而隨著生成式人工智能技術的進步,網絡攻擊者可以輕松地進行微調和針對性的攻擊,因此ChatGPT將對網絡安全構成嚴重的威脅。目前,網絡攻擊者已開始使用ChatGPT創建惡意軟件、暗網站點和其他實施網絡攻擊的工具。此外,使用ChatGPT編寫用于網絡攻擊的惡意代碼軟件,將會大大降低攻擊者的編程或者技術能力門檻,將導致即使沒有技術基礎也能成為攻擊者。同時,人工智能賦能網絡攻擊與傳統網絡攻擊在技術與手法上相比,將使過去勞動密集型、成本高昂的攻擊手法開始徹底轉型,朝著分布式、智能化、自動化方向發展,從而形成更為精準和快速的自動化攻擊手法。未來,隨著大模型人工智能計算被廣泛應用于網絡攻擊各個領域,網絡安全形勢將更加嚴峻,攻防真正進入智能化對抗時代。
當前,如何加強人工智能安全治理,保障人工智能安全健康發展,已成為各界關注的課題。未來生命研究所(Future of Life Institute)29日公布一封題為“暫停巨型人工智能實驗”的公開信,呼吁所有人工智能實驗室立即暫停訓練比GPT-4更強大的人工智能系統至少6個月。辛頓、馬庫斯和馬斯克均簽署了這封公開信。公開信中提出,廣泛的研究表明,具有與人類競爭智能的人工智能系統可能對社會和人類構成深遠的風險。高級人工智能可能代表地球生命史上的深刻變化,應以輔以相應的資源進行規劃和管理。然而,這種級別的規劃和管理并沒有發生,只有當我們確信它們的影響是積極的并且風險是可控的時候,才應該開發強大的人工智能系統。這種確信必須有充分的理由,并隨著系統潛在影響的規模而增加。
及時掌握網絡安全態勢 盡在傻蛋網絡安全監測系統
本文來源:互聯網
如涉及侵權,請及時與我們聯系,我們會在第一時間刪除或處理侵權內容。
電話:400-869-9193 負責人:張明