39位元,多樣語言的傳輸常數!Huh?

39位元,多樣語言的傳輸常數!Huh?
39位元,多樣語言的傳輸常數!Huh?

人類語言中,對具體物件的觀感不同,命名的音也就不一樣,對抽象的概念,更不可能出現語音的相似性,除非剛好屬於同一種語言的群族。但系出同根,語言儘管多樣,卻也隱藏著普遍規律。

撰文/曾志朗

你工啥咪?是台灣(閩南)話。你說什麼?是北京話。Nei gong matyeh?(你講乜?)是廣東話。What did you say?是英文。而Pardon是法文,和前面的句意相同,都是聽不清楚或不夠確定,希望對方重複一遍的用意。語言不同,雖然表達的意思都一樣,但詞彙有別,發音更是天差地遠,語音和句型就會有很大的差異,也就是所謂的語言特定的表徵。


但是在平常沒那麼正式的口語會話裡,即使聽的一方因為閃神或嘈雜以致聽不清楚,又或者聽到了但覺得對方語意和語氣不符合當前情境,而希望說的人可以重複說過的話,通常並不會使用完整句子逐字逐音說出來。幾乎全世界的語言,大都只會用一個語音來表達,就是「Huh?」或類似「Huh?」的音。例如在東迦納的山區語言裡,用的是「Ha?」,在寮國中部的河邊村落用的是「Haa?」,而遠在南美洲厄瓜多海邊的人會說「Aa?」。我們呢?不論閩南話、北京話或廣東話,則是發出「Hunh?」的音,都是希望對方「再說一次」。


這個語言表達的共同現象,真的很有趣。語言學家早就說過,用什麼語音去表達某個概念,充其量就是個遵行約定俗成原則的結果。所以漢語的花,英文是flower,日語稱hana,德語叫blume,都不一樣。樹在不同語言的發音也不同,英文是tree,日語是ki(枝)或ueki(植木),德語是baum。最有趣的,手勢語也是如此,對同樣的概念,各地也有不同的手勢表達方式。在台灣,是兩手握著樹幹,然後分開環成一個大大的圓包著樹幹;美國則是以耶誕樹為基型,雙手先合起,然後由上而下成八字狀分開,再合攏往下拉出一根樹幹;荷蘭的手勢語裡,一隻手成垂直狀,手掌朝上,慢慢搖動,如尖葉樹迎風搖晃。這是說,對具體物件的觀感不同,命名的音也就不一樣,對抽象的概念,更不可能出現語音的相似性,除非剛好屬於同一種語言的群族!


因此,當馬克士普朗克研究所的三位研究者(現任教澳洲雪梨大學、荷蘭奈梅亨大學和加拿大馬吉爾大學)發現,「Huh?」這個語音竟然不約而同出現在31個不同語言「請對方再說一次」的語用情境時,大感驚奇!他們進一步從不同語族選定10個語言,把日常生活的談話錄音下來,再去分析「Huh?」發生的語境和發音的方式。結果發現,在10個語言中,雖然「Huh?」的發音略有不同,但都來自相同的發音部位,也確實是在對方講完之後,意有所指的暗示對方再說一次,並非不經意的咕噥聲。三位研究者以此下了結論,認為「Huh?」確實是個有意義的詞彙,可以視為語言普遍性的一個表徵。


雖然研究者很細心檢視了來自16種不同語群中的31個語言,也很精確計算出各個語言發出類似「Huh?」的發音部位,並得到相當一致的結果。但對目前世界上6000多個不同語言數而言,來自31個語言的證據,還是稍嫌薄弱。以語言學家對普遍性規律的嚴格標準,只要其他語言在相同語境下沒有出現類似「Huh?」的語音,那語言普遍性的結論就破功了。所以「Huh?」是請求修補前面說話的跨語言普遍性的結論,僅管有趣,也有一定的說服力,但是否以偏概全,仍需檢驗更多不同語群的語言才行。畢竟31/6000的證據,確實不足以服人。


語言的演化歷經幾十萬年,即使源自同一個根,也會因為人類遷移的路線不一,遭遇的天候(寒溫熱)、環境(山區、海邊、平原或沙漠)、族群交流、文化和社會化等變異,在發音器官、語法、語用及詞彙使用頻率上有所差異。樹枝形狀不一,開出來的花和果實當然也不會相同。但語意雖然千變萬化,卻仍然存在很多有趣的跨語言共通點,值得心理語言學家注意。例如長度、寬度的描繪並沒有特別含意,但高度就必須小心了。你可以問別人「你有多高?」,但不可問「你有多矮?」,否則可能要遭白眼。矮字帶有負面含意,確實是放之各種語言而皆準!


還有更有趣的跨語言共通性哩!比如「深」這個字,英文是deep,而深山是deep mountain,深谷是deep valley,深藍和深綠是deep blue和deep green,深思是deep thinking,深情是deep feeling,深夜是deep night,深呼吸是deep breath,深深入睡是deep in sleep,深度學習是deep learning,深沉的聲音叫deep voice。這種把深的空間感,轉換為各類隱喻的修飾詞,在許多不同的語言裡都有相同用法。


另一個例子是「高」這個字,英文是high。情緒高昂是high spirit,高道德是high moral,高音是high voice,品格高尚是high character,高速是high speed,高瞻是high vision,高談則是high talk。這些高的用法,也是把空間的感知轉換為抽象的隱喻,而且是存在許多不同的語言中。這種跨語言普遍性轉換規律,使得不同語言的翻譯變為輕而易舉,而掌握這種轉換能力的人,就是文采「高」明而賦有「深」義的講者!


從語音到語意,語言學家在多樣的語言體系中尋找普遍性的規律,確實用心良苦,而且真的很不容易。澳洲國立大學的維茲畢卡(Anna Wierzbicka)認為,大約有60個詞是普遍存在所有的語言當中,用來表達最簡單的概念,如好、所有、人、你、我、他等;澳洲詹姆士庫克大學的狄克遜(Robert M. W. Dixon)教授主張,每一種語言一定會有不同於主詞和動詞的形容詞。而近代語言學大師喬姆斯基則認定,遞迴的表達方式(即把某個歷程的輸出變成為同一歷程的再輸入的句法),是世上所有語言共有的語法形式。


如果現存的6000多個不同語言真的來自同一源頭,那麼經過幾十萬年的分化和變形,各語群說話的型態也已各具千秋,互相聽不懂了。這時候,若能找到相互之間的普遍性規律,再探究是由歷史的哪一個時段走上異途,將對語言如何受到環境、天候、社會和文化等因素影響有一定的了解,也將使我們對人類認知功能和智慧演進之間的密切關係,有更進一步的理解。


最近發表在《科學進展》(Science Advances)的一個研究發現,正是「語言多樣,卻隱藏普遍性規律」的新例證,結果令人意想不到,而且可以知道腦的認知能量在語言資訊傳遞速率上所扮演的角色。如眾所周知,義大利人說話很快,平均一秒鐘說九個音節,德國人說話就比較慢,一秒鐘只能說五到六個音節。那從表象看,義大利人大腦每秒鐘接收的訊息量,是否會比德國人多呢?非也,非也!答案是:兩者一樣多,都是39個位元(bit)!


法國里昂大學的裴洛葛瑞諾(Francois Pellegrino)教授和他的同事找來17個不同語言、各10位母語者,請他們朗讀15篇相同文本,再從這17個不同語言的文本朗讀錄音中,以資訊傳輸的計算方法,算出擁有643個不同音節的日語,傳輸密度大概是每一音節有5個位元的訊息,而擁有6949個不同音節的英文,每個音節傳輸的密度就超過7個位元。此外,越語是帶著六個聲調的複雜系統,其每個音節的傳輸密度是8個位元。看來,音節多寡和語言傳輸速度是有相關的。研究者進一步把傳輸密度乘上每秒鐘發出多少個音節的速率,結果讓他們大吃一驚,17個語言中,無論音節滾動得快(如義大利語)或慢(如德語),每秒鐘所得到的傳輸訊息量都趨近一個常數,即39.15位元。研究者驚喜之餘,不禁大喊:「原來這麼有趣的規律就隱藏在我們眼前,但我們卻視而不見!」


問題是為什麼會有這個常數?答案也許也很簡單—我們腦神經的認知能量就是這麼多!所有語言,不論說得多快、多複雜,都過不了這個理解能力的門檻:39.15位元。也就是說,世界上沒有一個語言能比另一個語言傳遞更多的訊息!