語音克隆技術的蓬勃吸引的不僅是演員 還有網絡罪犯

隨著「語音克隆」技術效果的提高,演員和網絡犯罪分子對其興趣與日俱增。當蒂姆·海勒第一次聽到自己的語音克隆時,他說聽到的聲音是如此凖確,以至於 「我驚掉了下巴......這令人震驚」。

語音克隆是指用計算機程序來生成一個合成的、可適應的人的聲音副本。從某人說話的錄音中,該軟件能複製其聲,並說出你在鍵盤上輸入的任何單詞或句子。

這種技術的最新進展是,計算機生成的音頻據說現已精確到令人不安的程度。軟件不僅能識別口音而且能識別音色、音調、節奏、說話的流暢度和呼吸,克隆的語音樣本可以被加以調整以表達任何需要的情緒:如憤怒、恐懼、快樂、愛或無聊等。

來自德克薩斯州,29歲的配音藝術家和演員海勒從事包括飾演卡通人物、為有聲讀物和紀錄片配音、在視頻遊戲中發聲,以及為電影預告片配音等各類工作。海勒說,他最近將興趣轉向語音克隆,以應證其未來的職業生涯。他又說,這可能使他獲得更多工作機會。例如,如果自己被兩項工作同時預訂,他可以提供克隆配音來代替其中一個工作。

https://twitter.com/bbcchinese/status/1387290400889753601

「如果我被預訂了其他工作...... 我可以把我的『配音』(他稱自己的克隆聲音)定位為一個可以節省客戶時間的選擇,並為自己創造被動收入,」 海勒說。

為了克隆自己的聲音,海勒找到一家位於波士頓,名為VocaliD的公司。越來越多的公司提供這種服務,它是其中之一。

VocaliD由其首席執行官魯帕爾·帕特爾(Rupal Patel)創立,她也是東北大學(Northeastern University)通信科學教授。帕特爾在2014年成立這家公司,作為其臨牀工作的延展內容,為那些在沒有幫助的情況下便無法說話的病人創造人工聲音。例如在手術或生病後失聲的人。

她說,這項技術由人工智能主導,軟件可以 "學習 "並自行適應,在過去幾年裏有很大進步。這也引起配音藝術家的注意:「我們還專門為客人定制更加多樣化的聲音,」帕特爾教授說。

「我們製作了一些變性人的聲音,還有一些性別中立的聲音......技術應該以我們所有人的方式說話,我們都有獨特的口音和聲音。」

語音克隆還可以用來將演員的聲音翻譯成不同的語言,這意味著,例如美國電影製作公司,可能將不再需要僱用額外的演員為電影製作海外發行的配音版本。

加拿大公司Resemble AI表示,現在可以將克隆的英語語音變成其他15種語言;首席執行官佐海布·艾哈邁德(Zohaib Ahmed)說,要生成一個高質量的人聲副本,軟件需要某個人說話的錄音,時間短至10分鐘。

「當人工智能學習你的聲音時,它學習了許多屬性......如音色和音調,以及強度,」他說,「但它也會學習(一個人的聲音)的數千個其他特徵,這些特徵對我們來說可能不是很明顯。」

然而,儘管聲音克隆的日益複雜化具有明顯的商業潛力,它也導致人們越來越擔心它可能被用於網絡犯罪:欺騙大眾相信另外的人在說話。

與計算機生成的假視頻一起,聲音克隆也被稱為 「深度偽造」(deep fake)。而網絡安全專家埃迪·波布裏茨基(Eddy Bobritsky)說,合成聲音會帶來 「巨大安全風險」。

以色列公司Minerva實驗室的老闆說:「當涉及到電子郵件或短信時,多年來人們都知道,冒充他人相當容易。但直到現在,與你信任和熟悉的人通電話是確保你確實了解這個人的最常見方式之一。」

波布裏茨基說,這種情況現在正在改變。「例如,如果一個老闆打電話給僱員要求提供敏感信息,而僱員認出了這個聲音,其立即反應就是按要求做。這是很多網絡犯罪的途徑」。

事實上,《華爾街日報》早在2019年就報道過這樣一個案例,據稱一位英國經理被騙向騙子轉移22萬歐元(26萬美元;19萬英鎊),騙子用其德國老闆的聲音克隆副本行騙。波布裏茨基補充說:「需要採取步驟來處理這種新技術及其帶來的威脅。」

正如專業人工智能新聞網站Venture Beat所報道的那樣,世界各地的公司事實上已經在這樣做。

這些公司可以監測音頻,看它是否是假音,尋找諸如重覆、數字噪音和使用某些短語或詞語的蛛絲馬跡。同時,政府和執法機構也在關注這一問題。去年,歐盟的執法機構歐洲刑警組織敦促各成員國對能夠檢測深度偽造的技術進行 "重大投資"。而在美國,加州已禁止在政治活動中使用這些技術。

在德克薩斯州,海勒說雖然他還沒有出售他的克隆聲音,但 「有幾個不同的客戶表示有興趣」。

從長遠來看,他是否擔心可能會因為其他人的合成聲音而失業?他說:「我並不擔心它會讓我丟工作。我真的覺得,真正的人聲永遠有其存在的價值。擁有『配音』(他的克隆聲)的意義不在於取代我或其他任何人,而是作為我業務中的一個額外工具存在。」

美國演員工會,電影演員協會的執行副總裁麗貝卡·達蒙(Rebecca Damon)說,圍繞語音克隆這個話題的另一個關鍵問題是,配音員要為他們支付適當的報酬。

她說:「聲音克隆可以代表我們的成員從事的一個令人興奮和可能有利可圖的新行業。然而,對我們來說,至關重要的是,配音演員應得到公平補償,並能夠同意如何使用他們的聲音。為此我們正在密切監測語音克隆技術的發展,並與我們的成員合作,確保所需的行業護欄可以就位,使這項嶄新的和受歡迎的工作領域實現其潛力。」

海勒補充說,關於設定語音克隆的定價問題是,「這是配音界的『西部荒野』」。

他說:「在我看來,當涉及為你的人工智能語音]定價和合同談判時,最重要的是你並未簽下所有權和永久使用權。」

BBC記者威爾·斯梅爾(Will Smale)對本文亦有貢獻。