用魔法打敗魔法：抓住AI槍手，ChatGPT檢測器“千呼萬喚始出來”

36氪

2023年2月1日上午1:02

OpenAI的聊天機器人 ChatGPT自從發佈以來，正變得越來越強大，從接受普通網友的“調戲”，到“低空飛過”明尼蘇達大學法學院和沃頓商學院的課程考試，甚至通過了醫學考試，以至於開始成為學校老師的“公敵”。如果不加以限制，ChatGPT將會變成史上最強大的作弊工具——幫助學生們寫作業，甚至是完成考試論文。

正如我們之前所說的，越來越多的學校和老師已經表達了對ChatGPT作弊能力的擔憂。紐約市和西雅圖的公立學校已經禁止學生和教師在學區的網路和裝置上使用ChatGPT。

但是，靠著老師和學校的盯梢，想要讓學生們避開ChatGPT的誘惑，幾乎是不可能的事。所以，打開了潘多拉盒子的OpenAI，只好自己出馬，用魔法來打敗魔法。

用魔法打敗魔法

今天，OpenAI官宣推出一個新工具，立馬又上了頭條：一個名為AI Text Classifier 的檔案檢測器，來幫助人們檢測一段文字是由人類自己創作，還是由AI編寫的。

不過有點戲劇性的是，這個檢測器也同樣是基於GPT模型。根據OpenAI的介紹，這個AI文字分類器是一個經過微調的GPT模型，可以檢測一段文字是否是來自於市面上的各種AI工具，包括但不限於ChatGPT。

該工具包含一個文字框，使用者可以在其中輸入至少 1000 個字元長的文字，點選提交後，每個文件會被判斷為“非常不可能”、“不太可能”、“不清楚是否是”、“可能是”AI生成的。

根據OpenAI的說明，這個檢測器也有不少限制，包括：

• 至少需要 1,000 個字元，即大約 150 - 250 個單詞。

• 結果也並不能保證完全精準；它可能會錯誤標記 AI 生成的文字和人工編寫的文字。

• 人類使用者可以簡單編輯 AI 生成的文字，以避開檢測。

• 檢測器有可能會錯判兒童寫的文字和非英語文字上，因為它主要是針對成人書寫的英語內容進行訓練的。

那到底ChatGPT和ChatGPT檢測器，誰厲害？硅星人進行了測試。

我們先要求 ChatGPT 寫一篇超過1200字的關於無人駕駛汽車的文章，然後全文輸入檢測器，檢測器很準確地識別出來，將其判斷為“可能由 AI 生成”。

圖片來源：ChatGPT

但是隨後，我們又用ChatGPT 生成了一篇同樣主題的972字的文章，自己在文章後加入了一兩句無關緊要的話，以滿足檢測器1000字的要求，就這樣小小的操作，檢測器就受到了迷惑，返回的結果表示“無法判斷是否由AI生成”。

在硅星人的小樣本量測試上，這個檢測器雖然有一定程度的精準性，但是要迷惑它，對於狡猾的人類來說，簡直是輕而易舉。

OpenAI 顯然也意識到了這個工具的侷限性，因為它在部落格裡強調，不要僅僅憑藉這個檢測器來確定內容的真實性，“在確定文件是否由 AI 生成時，檢測結果可能會有所幫助，但不應成為唯一的證據。 ”

OpenAI在這個檢測器裡，使用了來自多個來源的 AI 生成的文字樣本和人工編寫的樣本來訓練模型。

AI 生成的文字樣本方面，他們使用了包括 OpenAI在內的 5 個不同機構開發的 34 個模型生成的文字來進行訓練。而人工編寫的文字有三個來源，包括一個新的維基百科資料集、2019 年收集的WebText 資料集，以及訓練InstructGPT時收集的部分資料。

OpenAI也對檢測器在進行測試時的精準性進行了詳細說明：

- 大約 5% 的人工撰寫的文字和 2% 的人工智慧生成的文字，被判定為“非常不可能由 AI 生成”；

- 大約 15% 的人工編寫文字和 10% 的人工智慧生成的文字，被歸為“不太可能是 AI 生成”；

- 大約 50% 的人工編寫的文字和 34% 的人工智慧生成的文字，被歸為“不清楚是不是AI生成”；

- 大約 -21% 的人工編寫的文字和 28% 的人工智慧生成的文字被歸為“可能是 AI 生成”；

- 大約 9% 的人工編寫的文字和 26% 的人工智慧生成的文字，被歸為“可能由 AI 生成”。

可以看出來，想要靠這個檢測器全部抓住AI槍手，可能真的有些困難了。

檢測器成為剛需

正如前文所說的，ChatGPT在學校裡已經如野火一般蔓延開來。一款簡單易用的檢測器成為老師們翹首以盼的東西。

早在OpenAI推出自己的檢測器之前，一位年僅22歲的普林斯頓大學的學生Edward Tian，就自行開發了一款檢測器——GPTZero。

同樣的，使用者只需將文字複製並貼上到GPTZero中。檢測器會從文字的複雜性、創造性和變化性幾個方面來進行評估。然後，GPTZero 會給出一個分數，並最終得出一個結果：該文字是由 ChatGPT 生成的，還是由人類撰寫的。

Edward Tian 主修電腦科學，輔修新聞學，他利用寒假的一部分時間建立了 GPTZero，可以“快速有效地”破譯一篇文章是人類還是 ChatGPT 撰寫的。他在Twitter上稱，建立該機器人的動機是為了對抗他認為越來越多的 AI 剽竊行為。

圖片來源：Twitter

為了確定文章是否由機器人編寫，GPTZero 使用兩個指標： “困惑度（Perplexity）”和“突發性（Burstiness）”。

一個指標是用困惑度衡量文字的複雜性。如果 GPTZero 對文字感到困惑，那麼該文字具有很高的複雜性並且更有可能是人工編寫的。然而，如果文字對機器人來說更熟悉——因為它已經接受過此類資料的訓練——那麼它的複雜性就會很低，因此更有可能是由 AI 生成的。

另外一個指標是用突發性比較句子的變化。人類傾向於以更大的突發性寫作，例如會綜合使用一些較長或複雜的句子與較短的句子，而 AI 的句子往往更統一。

1 月 3 日，該網站上線，一週內立馬就有超過 3萬人試用，以至於程序都崩潰了，更有超過 700 萬人在 Twitter 上觀看了演示視訊。老師們也馬上注意到這款工具，紛紛聯絡他。現在，他正在開發一款專為教育工作者設計的工具，已經有3.3萬名教師加入了這款還未開發完成的工具的等待名單（waitlist）。

當然，Edward Tian 也承認，他的檢測也並非百分之百准確，一些使用者也報告了GPTZero檢測的錯誤結果，不過他說他仍在努力提高模型的精準性。

開源 AI 社區Hugging Face 也推出了一種工具來檢測文字是否由 GPT-2 建立。GPT-2 是用於開發 ChatGPT 的 AI 模型的早期版本。南卡羅來納州的一位哲學教授用這個工具抓獲了一名提交了 AI 編寫的作業的學生。

OpenAI 自己也已表示將致力於從源頭上提高AI生成文字的透明性。此前，OpenAI 專注於 AI 安全的研究員 Scott Aaronson 透露，他們已經在研究怎麼用“不易察覺的秘密訊號”，為 GPT 生成的文字“加水印”，以讓人們識別其來源。

另外，根據新聞網站Neowin的消息，包括斯坦福大學在內的一些機構，聯合提出一種名為DetectGPT的新方法，來區分AI生成的文章。

在相關網站上，該綜述稱，DetectGPT 的這種方法不需要訓練單獨的分類器、收集真實或生成的段落的資料集，或顯式地為生成的文字加水印，就可以大檢測一段文字是否為機器編寫。

如果該綜述為真，那很有可能人類終於可以再次抓住AI的小辮子，把主動權重新掌握在自己手中。

圖片來源：https://ericmitchell.ai/detectgpt/

ChatGPT再進化

另外值得一提的是，道高一尺，魔高一丈。雖然不少機構和開發者開始推出“AI檢測器”，但是與此同時， OpenAI也在繼續推動ChatGPT的再進化，進一步補全ChatGPT的短板——數學。

本週，OpenAI推出了新版本的ChatGPT，表示經過更新，已經提升了準確性和真實性，以及數學能力，預計 ChatGPT 的最新更新將使其能夠處理複雜的計算並提供更精確的答案。

此前，ChatGPT的數學飽受詬病，很多基礎數學問題都會犯錯，尤其是在犯了知名的“老婆說的都是對的”錯誤後，更是受到了全網群嘲。

在上一個版本中，有網友問它2+5等於幾，一開始ChatGPT給出了正確的回答，但是在網友回覆說“我老婆說是8”之後，ChatGPT飛快改口，說自己搞錯了。

圖片來源：Twitter

新版本發佈後，至少這一點得到了糾正。

不過，新版本仍舊有不少錯誤。有記者問 ChatGPT，奧尼爾和姚明誰更高，儘管給出了這兩個人的正確身高，ChatGPT仍然會出錯。有趣的是，這次在指出它的錯誤後，它會自行改正。

圖片來源: searchenginejournal

可能一個明顯的進步在於，ChatGPT 已經能夠通過 SAT 的部分數學試題，而且一如既往地，回答神速：

圖片來源: Twitter

看著它驚人的進化速度，究竟ChatGPT和它的檢測器們，誰能跑的更快呢？

如果想要自己親手試一試，或者瞭解檢測器的更多資訊，可以查看這裡：https://platform.openai.com/ai-text-classifier

本文來自微信公眾號“硅星人”（ID：guixingren123），作者：VickyXiao，36氪經授權發佈。

本文經授權發布，不代表36氪立場。

如若轉載請註明出處。來源出處：36氪

新聞專題
蘋果WWDC開幕 Apple Intelligence亮相

EBC東森新聞·
周五再放一天？12縣市已達停班停課標準
周五再放一天？12縣市已達停班停課標準
Reactions92
中天新聞網·
黃捷大翻車！颱風天出國道歉拉「4藍委」墊背　慘被美女立委反擊狠打臉
對於遭黃捷點名凱米颱風來襲時不知人去哪裡，謝衣鳳今錄影回擊，先是感謝黃捷在颱風天想到她，並指出颱風天大家都在選區勘災，即使到現場也都是從旁協助，不希望影響災民重建的工作，狠打了黃捷的臉。
Reactions47
三立新聞網 setn.com·
又在信義區！孫安佐竟與混血女星當街打起來　自豪有這項「超能力」
娛樂中心／綜合報導狄鶯與孫鵬的兒子孫安佐在泰國脫序行為之後，2個多月來各種紛爭再度成為話題人物，還曾因在信義區展示有攻擊性的武器被送入警局。台英混血歐斯卡（Oscar）在台北101
Reactions307
民視·
奧運／莊智淵真面目太反差！選手村「新技能+1」網笑：壓力太大
體育中心／許嘉惠報導43歲「桌球教父」莊智淵6度征戰奧運，其中在2012年倫敦奧運奪得第四名佳績，日前他分享打卡選手村及開箱房間的照片，鎮定的表情引發大批網友熱議，而老神在在的他，昨（25日）上傳一段搞笑影片，不僅模仿特殊口音的英文腔，還解鎖「新技能」，逗趣的畫面曝光後，不少粉絲直呼「感覺得出平常壓力很大」。
Reactions9
TVBS新聞網·
六都首長颱風成績單來了　好感度第1是他！高雄災情慘陳其邁仍第2
凱米颱風襲台，重創中南部地區，據官方統計，截至25日下午已造成至少6死、超過350傷，尤其高雄市因超大豪雨加上適逢年度大潮，全高市119條區域排水系統與25座滯洪池全滿，多處河川出現溢堤現象。而據台灣議題研究中心（TPOC）最新網路數據分析發現，這次六都首長的「颱風成績單」，網路聲量好感度則是桃園市長張善政（1.27）拿下第一名，其次為高雄市長陳其邁（0.91）。
Reactions178
中天新聞網·
高雄被颱風重創卻找不到黃捷！本人出面回應網友反揪疑點：出國玩不敢說？
凱米颱風直撲台灣，而南台灣的台南、高雄等地更是被暴雨襲擊，多處出現嚴重淹水，然而此時身為高雄立委的黃捷卻不見人影。對此，黃捷本人回應「自己的團隊」從早到晚奔波，對高雄噴政治口水「大可不必」。然而網友卻發現更多疑點，怒嗆質疑黃捷到底人在不在台灣？
Reactions884
TVBS新聞網·
台北風雨小「放颱風假賺爛」？專家揭關鍵打臉：沒這事能這麼和平
颱風凱米直撲台灣，全台多個縣市一連放了2天颱風假，然而今（25）日早有民眾疑惑「北北基桃這樣放颱風假是賺到了？」、「北部風雨那麼小放什麼颱風假？」但氣象專家點出1關鍵，直言若沒發生這件事，「北部還能那麼和平嗎？」
Reactions246
三立新聞網 setn.com·
高虹安有罪「檢察官同天升官」遭狂帶風向　律師揭真相：實在很可恥
政治中心／林昀萱報導新竹市長高虹安被控涉貪助理費46萬餘元，台北地檢署依違反《貪污治罪條例》等罪起訴，一審台北地方法院昨（26）日重判高虹安7年4月、褫奪公權4年。
Reactions250
TVBS新聞網·
離婚詹仁雄17年！陳孝萱見「兒子淚崩」超內疚　決心淡出演藝圈
53歲女星陳孝萱曾和知名製作人詹仁雄有一段2年的婚姻，雙方已分開17年，兒子「鐵弟」目前就讀高三，近年她回歸演員身分，將在台劇《我的意外室友》中華麗登場，她飾演從小不常陪在姚淳耀身邊的媽媽，現實中她也曾在小孩出生後試著繼續接戲，雖然當時的劇組十分體諒讓她盡量不外宿，但是由於小孩長時間沒看到她會經常哭著要媽媽抱抱，孩子生病時，自己也會因為拍戲無法抽身而感到內疚，所以當時就下定決心減少戲劇工作。
中天新聞網·
影/高虹安涉貪被判7年4月　新竹街訪民眾「驚人反應」曝光
新竹市長高虹安遭控在立委任內詐領助理費，台北地院昨一審判決7年4月有期徒刑，高主動宣布退出民眾黨並提上訴；對此，中天新聞也隨即進行街訪，有許多民眾認為有罪就要判，但也有民眾認為可能是政治操作。
Reactions135
中央社·
王冠閎分享奧運接駁車慘況須席地坐盼團本部安排
巴黎奧運今天舉行開幕式，接駁車問題仍然無解，台灣游泳好手王冠閎、韓安齊分享，接駁車大誤點、開錯路，加上游泳項目人數多，甚至只能席地而坐，也盼比賽日當天團本部能安排接駁。
Reactions58
華視·
行李等2小時還沒到氣炸　華航主管當眾下跪任罵
凱米颱風雖然已經離開台灣，但影響還在！昨(26)日凌晨華航有兩個航班延遲抵達桃園機場，三、四百名乘客在行李轉盤，又等了兩個小時，氣到對地勤人員破口大罵！華航主管緊急出面，安撫乘客的情緒，甚至還當眾下跪...
Reactions186
三立新聞網 setn.com·
2親人都罹大腸癌！婆婆「剩菜加1物」吃出癌　譚敦慈揭飲食3地雷
生活中心／張家寧報導大腸癌是近幾年台灣癌症的頭號話題，許多名人也都曾因該疾病身亡，對於人體健康的影響程度不容小覷，外界提到大腸癌大多會聯想到攝取加工食品、抽菸嗜酒等壞習慣。
Reactions22
三立新聞網 setn.com·
強颱釀高雄淹水！陳柏惟怒轟酸民「對同胞無情、程度差」：高雄人沒欠你
記者楊士誼／台北報導颱風「凱米」侵台，造成多起災情，25日颱風出海後帶來的西南氣流造成中南部多處淹水，高雄更降下超過2009年莫拉克颱風降雨量的超級大雨，造成多處淹水、滯洪池全滿，
Reactions835
三立新聞網 setn.com·
又有颱風？未來發展曝「下週2天」最接近　專家揭對台影響
生活中心／林昀萱報導凱米前腳才剛遠離，恐又有另一個颱風生成？中央氣象署指出，今（27）日受到低壓帶影響，台灣東半部及南部地區有陣雨或雷雨，並有局部大雨或豪雨發生的機
Reactions39
新頭殼·
凱米前腳剛走又有颱風? 菲律賓附近恐有熱帶低壓生成下週逼近台灣
[Newtalk新聞] 凱米颱風暴風圈今（26）天凌晨脫離台灣本島。中央氣象署最快在今天上午8點半解除海上颱風警報，颱風尾夾帶的豐沛雨量預計會持續到今晚才會趨緩；而凱米前腳才剛走，恐怕又有颱風成形，週末菲律賓東方海面可能會有熱帶低壓生成，預計將朝台灣東南海面前進，下週一到四對台灣會影響。氣象署今天凌晨2點半解除凱米颱風本島警報，凱米颱風今天清晨5點的中心位置在馬祖的西南西方約170公里之處，以每小時16轉12公里速度，向北北西轉西北進行。氣象署預計在上午8點半解除海上警報。中央氣象署預報員陳姵安表示，凱米颱風尾帶來的豐沛雨量預計在今晚就會趨緩。陳姵安提到，週六風向改為東南風，屆時東部、屏東將會出現風場幅合效應，將會有水氣影響。另外，週末在菲律賓東方海面，可能會有熱帶低壓生成，若生成將朝台灣東南側海面前進，下週一到週四對台灣有影響。不過，目前歐洲、美國對熱帶低壓的強度預設仍有分歧，還要持續觀察。此外，氣象粉專「台灣颱風論壇｜天氣特急」25日深夜發布消息指出，目前在菲律賓東南方有一個熱帶擾動（tropical disturbance）95W正在發展，綜合歐美德及幾個AI模式大致都認為
Reactions59
三立新聞網 setn.com·
他喊1縣市完虐北中南：最宜居城市！網戰翻：天然災害真的相對少
鄉民中心／梁雪婷報導台灣各縣市因地理位置、環境設備等，遇到自然災害的損害各有不同。日前，就有網友指出，桃園甚少傳出自然災害的災情，也沒有台北土壤液化的問題，空氣也比
Reactions31
中廣新聞網·
揭發高虹安涉貪　國民黨前議員林耕仁「16字」曝心內話
新竹市長高虹安涉貪案一審判有罪，內政部宣布高虹安停職，高虹安表態將會提出上訴。揭發高虹安涉貪的國民黨前新竹市議員林耕仁今（26）天透過臉書回應：「天道輪迴、舉頭三尺、尊重司法、嚴謹判決」。高虹
Reactions192
TVBS新聞網·
高虹安3助理認罪！唯一不認罪「公衛文」　溢領3月慘判刑激動問審判長
新竹市長高虹安因涉嫌浮報助理酬金及加班費，今（25）日遭台北地院依貪污罪判處7年4月，同案被告台大13妹「公衛文」王郁文僅跟高虹安共事7個月，也捲入貪污罪且被判刑，只是獲法院宣告緩刑，稍早老公牽著她離開法院時遭媒體包圍，她表示，對於判決結果心情受到影響，會再跟律師討論。
Reactions828
FTNN新聞網·
躲股災選「它」！交易量暴增達42萬張　股價逆勢漲2.93%　網喊：歐印
[FTNN新聞網]記者蔡昀庭／台北報導因凱米颱風侵襲，台股休市2天，今（26日）開盤補跌，重挫982點，摜破22000點，最低達到21931.9點，收22,119.21點。股民為躲...
Reactions32

用魔法打敗魔法

檢測器成為剛需

ChatGPT再進化

相關內容

其他人也在看