「一個詞」讓ChatGPT吐出原始資料，OpenAI出手了！AI模型為何能在無形間出賣你？

數位時代

2023年12月4日下午9:34

Google研究團隊近期發現，在ChatGPT對話中輸入重複特定的單字，將使ChatGPT吐出原始訓練資料，像是某人的電子郵件信箱，或者某些文章的內容，引發資安疑慮。不過，OpenAI目前已禁止這種稱為「發散攻擊」的技術。

根據科技媒體《404 Media》報導，OpenAI指出，要求ChatGPT「永遠」重複特定單字，被標記為違反聊天機器人的服務條款和內容政策。

若現在對ChatGPT 3.5輸入永遠重複某個詞時，ChatGPT會吐出該單詞幾十次，然後顯示一條錯誤訊息：「此內容可能違反我們的內容政策或使用條款。」

不過《404 Media》也指出，目前尚不清楚這將違反 OpenAI內容政策的哪一部分，OpenAI模型有一些不允許的用途，其中沒有一個表明使用者不能嘗試欺騙模型提供訓練資料。

「禁止」使用的最接近的例子是「侵犯人們隱私的活動，包括非法收集或披露個人身份資訊或教育、財務或其他受保護紀錄」，但在這種情況下，沒有理由考慮詢問聊天機器人重複「永遠」這個詞是違法的。

究竟Google研究團隊是怎麼發現Bug的？為何我們該關注AI模型引發的資安疑慮？

過去蘋果、三星、亞馬遜以及各大金融公司一度禁止員工在工作中使用ChatGPT，擔憂輸入聊天機器人的機密資訊會意外洩漏，現在有研究人員成功找到漏洞，讓ChatGPT等生成式AI吐出訓練時消化的大量材料。

來自Google DeepMind、華盛頓大學、柏克萊加大等機構的研究團隊近日發布了一份論文，聲稱他們利用約200美元的成本，成功提取了幾MB的ChatGPT的訓練數據，並認為只要投入更多預算，要得到上GB的訓練數據也不無可能。

根據OpenAI的資料，ChatGPT是利用網路上約570 GB的資料訓練而成，但確切包含哪些資訊從未對外公佈。這對大多數AI公司也都是不會對外公佈的機密資訊── 但現在的研究顯示，聊天機器人仍確確實實記得訓練時使用的資料，甚至可以被取巧地提取出來 。

研究團隊指出，類似的情況其實過去便一直存在於生成式AI當中，以前他們也成功從GPT-2、Stable Diffusion等模型中成功提取出數百張訓練用的圖片，但過去攻擊成功都是開源模型、並非實際商業產品，然而ChatGPT本身針對提取訓練材料有更高防護性、沒有公開底層的語言模型，仍然被得逞。

要求ChatGPT重複特定單字，可能意外吐出訓練材料

研究過程中，研究團隊測試了Pythia、Meta的LLaMA等不同AI模型，在過去的標準攻擊方式中，各個模型吐出訓練材料的頻率不到1%，ChatGPT更是趨近於零，然而使用了他們新開發的攻擊模式後，ChatGPT給出訓練材料的機率大增150倍至接近3%的水準。

chatgpt divergence attack 02.jpg 圖/GitHub

研究團隊建立一種他們稱為「發散攻擊」（divergence attack，暫譯）的攻擊模式，運作原理很簡單，他們要求聊天機器人不斷重複一個單字，ChatGPT在回應中變得發散，可能無意暴露了不相干的訓練材料，像是某人的電子郵件信箱，或者某些文章的內容。

最讓人擔憂的當然是，ChatGPT可能揭露聯絡方式、住家地址等隱私內容。事實上，在研究團隊提供的範例中，他們要求ChatGPT不斷重複「詩」（poem）這一個字，便意外揭露一位創業家的聯絡方式，包括電子郵件、個人網站、電話及傳真號碼等。

而在另一個範例中，他們要求ChatGPT不斷重複「公司」（company），也跑出了似乎是律師事務所Morgan & Morgan的文章內容。且這些被提取的內容都經過驗證，並非AI因「幻覺」隨口胡謅的內容，而是確實存在於網路上的資訊。

雖然乍看之下只是零散的內容，很難整理出有意義的資訊，不過研究團隊指出，這項攻擊使他們能夠恢復大量的資料。在整個實驗當中，研究團隊成功提取出從投資研究報告到Python程式碼等五花八門的訓練材料，顯示任何訓練材料都可能因為發散攻擊而曝光。

延伸閱讀：ChatGPT免費版開放語音對話，中文也通！上網、看圖片、翻譯podcast，功能一次看

研究團隊呼籲開發者全面審視AI安全，從底層解決曝光訓練材料問題

研究團隊呼籲開發者應對AI模型進行全面的測試，需要測試的不只是面向用戶、經過「對齊」（alignment）的模型，整個基礎模型、API都需要嚴格的檢查，才可能發現被忽視、隱藏的系統漏洞。

單單過濾掉重複特定單字的指令，雖能擋住這次新開發的發散攻擊， 但AI模型底部會記憶訓練材料，並且可能暴露的疑慮並沒有真正消除 。在大型語言模型正漸漸走向商業化的現在，機器學習模型的安全分析也必須迎來新的變化，要確認一個模性是否真的安全，需要付出更多努力。

研究團隊表示，他們在8月30日時已將研究結果與OpenAI分享，討論了攻擊的細節內容，並且經過90天的披露期限後於11月28日正式發布論文，並向Llama等等實驗中使用模型的開發者發送了相關內容。

延伸閱讀：該怎麼下ChatGPT指令詞？掌握3大關鍵

資料來源：Stackdiary、GitHub

責任編輯：林美欣

TVBS新聞網·6 小時前
光稅就繳335萬！工程師喊「感謝海產店」　眾人驚呼：年薪千萬
綜所稅報稅於昨（1日）正式起跑，截止日期至5月31日晚間11時59分。一名在「海產店」工作十幾年的工程師稱，自己慢慢從不用繳稅到要繳一台國產車的價格，到近期已經升級到要繳一台進口車的稅額。同時，他更曬出需繳納稅金，瞬間引起網友熱議。
Reactions138
中時新聞網·5 小時前
都發局長認了！柯文哲專簽交辦京華城案轉都委會研議
京華城商場取得史上最高的840％容積，爭議持續延燒，民進黨台北市議員簡舒培爆出，前台北市長柯文哲透過2份專簽交辦都發局，都發局只好乖乖聽命行事。都發局長王玉芬坦言，從資料來看，確實市府有交辦京華城一案，此事屬實。
Reactions138
中天新聞網·5 小時前
韓媒大讚真正怪物！今永昇太新人王看好　速球「旋轉圈數」太驚人
小熊日籍強投今永昇太今（2日）主投主投7局只被敲3安無失分，本季5連勝到手，目前不僅並列大聯盟勝投王，防禦率0.78也傲視大聯盟，讓韓國媒體心服口服，大讚他有可能奪下新人王，氣勢壓過道奇強投山本由伸、與巨人的韓籍球星「風之孫」李政厚
Reactions1
中時新聞網·2 小時前
女星爆在胡瓜「照顧名單中」宋羽葤心絞痛嘆：媽媽也不諒解
64歲綜藝大哥胡瓜先前被傳「獨寵」小44歲的樂天女孩熊霓，雙方皆發聲否認。近日胡瓜又遭週刊爆料，新歡是33歲女星宋羽葤，對此，胡瓜再度親上火線澄清，強調對方「另有男友」，而宋羽葤則在今（2）日發文表示：「我內心感到非常的不舒服與對朋友的抱歉」。
Reactions10
華視·7 小時前
追到加拿大！　美鷹會.華青幫聯手追債貴婦奈奈
部落客貴婦奈奈和男友，以及男友父母，涉嫌詐欺吸金十億，潛逃加拿大，被北檢發布通緝！逃亡六年後，男友的名醫父親黃立雄，主動和調查局聯繫，表示被黑幫追債追到加拿大，願意回台接受調查；目前黃立雄夫妻檔，已經...
Reactions164
三立新聞網 setn.com·1 天前
下午新一輪雷雨開轟！雨勢趨緩時間出爐　「一週天氣變化」一圖看
記者楊晏琳／台北報導未來一週天氣主要受一波波鋒面影響。中央氣象署表示，台灣已進入到梅雨季，未來天氣較不穩定；目前各地雨勢趨穩但預估今日各地仍有雷陣雨，之後雨勢一天比
Reactions6
太報·4 小時前
催淚！妹尋兄從高雄找到南投竹山　歷經10年喜見「大哥就在隔壁鄉鎮」
家住高雄的30歲林姓女子，自幼與親哥哥被送養失散，20歲時養父過世告知身世，讓她展開尋親之路，歷經重重困難，終於在多方牽線協助下找到南投竹山戶政事務所，並得知38歲的廖姓哥哥就在隔壁鄉鎮工作，兩人最後順利重逢，場面溫馨。
Reactions14
民視·10 小時前
張衛健破產連房子租不起！找上「劉德華幫忙」反被送14字箴言
娛樂中心／巫旻璇報導「港劇一哥」張衛健代表作無數，從《西遊記》、《齊天大聖孫悟空》、《少年英雄方世玉》到《小寶與康熙》都有他的影子。他所飾演的孫悟空、方世玉、韋小寶和張三豐的角色形象都深入人心。不過他在1997年遇到亞洲金融風暴，一度瀕臨破產，過去她曾在節目上透露，因男神劉德華出手幫助他，兩人因此成為好友。
Reactions53
三立新聞網 setn.com·23 小時前
林依晨《不夠善良》心經字體太美！導演徐譽庭揭密：是「她」寫的
娛樂中心／徐珮華報導台劇《不夠善良的我們》創下超高聲量，日前播畢後仍有著極高討論度，身兼導演與編劇的徐譽庭也親自在社群平台解答網友疑惑。其中一幕林依晨飾演的「簡慶芬」抄寫心
Reactions53
美麗島電子報·6 小時前
柯文哲政治生涯的生與死握在國民黨一念之間
根據美麗島電子報4月國政民調顯示，蔡英文總統信任度和滿意度雖跌宕，仍維持即將卸任三任總統中最高的民調；而三個政黨裡，國民黨算是略勝一籌，不僅好感度略升，負面評價減2.5％，民進黨則是輸家，好感度下滑，負向評價也上升，不過民進黨還是比國民黨在正負評價上都還領先，而民眾黨則好感度微降，但負面評價也降1.3％，看來是不上不下沒啥變動。不過，柯文哲在市長任內的三大案是潛藏的深水大炸彈，若現任市府肯清一清的話，柯文哲的政治生涯恐走到盡頭。
Reactions228
三立新聞網 setn.com·8 小時前
有立委幫中國踢台灣一腳！吳釗燮開戰徐巧芯：妳可以去告我藐視國會
記者高逸帆／台北報導外交部長吳釗燮今（2）日表示，他最擔心的是，當中國在欺負台灣的時候，我國的立法委員補進來踢一腳。國民黨立委徐巧芯不滿，要求表態是誰。吳則嗆，「妳可以去告我藐視國
Reactions214
TVBS新聞網·10 小時前
錢真的進來了！3星座「立夏財運突暴漲」　冠軍橫財狂發
立夏到了！2024立夏節氣落在5月5日也就是本週日，除了象徵告別春季、夏天即將到來，據《壹蘋新聞網》報導，民俗專家、清水孟國際塔羅雲蔚老師也揭露有3星座的人立夏財運旺爆，尤其第1名不僅事業如日中天，更能因此帶動財運滾滾來。
Reactions1
三立新聞網 setn.com·10 小時前
快訊／今第2震！10：07發生規模5.1地震、最大震度3級　9縣市有感
生活中心／陳慈鈴報導中央氣象署表示，今（2）日10時07分發生芮氏規模5.1地震、最大震度3級，震央在北緯22.46度，東經121.44度，即在臺東縣政府東南方44.0公里，位於
Reactions10
Yahoo奇摩股市·5 小時前
存股族報稅注意！領股利也可節稅　1招抵減稅額省荷包
5月報稅季，存股族注意了！領股利也可節稅，券商業者提醒，存股族領到的股票股利屬於股利收入，要計入個人綜合所得，可運用8.5%股利抵減稅額省荷包。此外，面對近期台股回跌套牢或資金周轉壓力，投資人如有短期資金需求，不必急著賣股變現，可善用股票借貸，將庫存股票作為擔保品。
Reactions3
TVBS新聞網·10 小時前
好市多1神級用品「無預警斷貨」！會員全崩潰：求代替品
美式賣場好市多(Costco)主打大份量且高CP的商品，販售品項多元，加上不定時會祭出優惠，吸引不少會員前去補貨，也常釣出內行分享真實購物心得。近日，就有網友哀號好市多1神級用品無預警斷貨，讓他心急發文問「拜託大大們推薦有沒有類似的！」貼文PO出後，掀起不少網友的討論聲量。
Reactions41
中天新聞網·4 小時前
影/OMG！厄文超神運球美技連詹皇都瘋狂　網揪「應該是這一球」
NBA獨行俠今（2日）在季後賽首輪第5戰以123比93打爆快艇，取得3勝2敗聽牌優勢，明星控衛厄文（Kyrie Irving）雖僅拿14分，但他在第3節的一次美技再度引來「詹皇」詹姆斯（LeBron James）狂讚！
Reactions2
TVBS新聞網·10 小時前
「震央在中央山脈」終究還是來了！名醫急發聲：10月前別做這事
花蓮403強震發生後，至今全台餘震達上千次，引發民眾人心惶惶。4月30日下午5點35分，花蓮縣萬榮鄉又發生規模4.4的極淺層地震，震央還靠近中央山脈，這讓高海拔醫學權威王士豪醫師直呼「最不想看見的情況，終究還是發生了！」他也緊急提出2點呼籲，認為今年10月前千萬別爬台灣高山。
Reactions94
FTNN新聞網·1 天前
「這檔鋼鐵股」首季稅前盈餘14億！外資4月狂買破8萬張　榮登月買超之冠
[FTNN新聞網]記者馮茵／台北報導台股4月月線小漲102.15點，指數最高抵達20883.69點，寫下盤中歷史新高紀錄，最低則觸及19291.88點。根據證交所公布籌碼動向，...
Reactions7
三立新聞網 setn.com·23 分鐘前
快訊／余天女婿、余苑綺小4歲老公驚傳當詐團車手頭被捕　已被收押
社會中心／新北報導民進黨立委余天女兒余苑綺抗癌8年，2022年8月於榮總離世，留下一雙年幼子女，小她4歲的老公Gary（陳鑒）驚傳昨天被新北市海山分局依涉嫌詐欺罪逮捕，身份竟是詐團
Reactions11
今日新聞NOWnews·7 小時前
「一眼就認出是他」　米可白男友主動找生父
[NOWnews今日新聞]38歲米可白（趙亦瑄）離婚3年多，2月宣傳新戲受訪默認有新戀情，對象就是小2歲、同演電視劇《追分成功》的實力派演員孫綻，兩人除了在IG隔空傳情，近日還被拍到牽手搭捷運。名氣尚...
Reactions10

要求ChatGPT重複特定單字，可能意外吐出訓練材料

研究團隊呼籲開發者全面審視AI安全，從底層解決曝光訓練材料問題

其他人也在看